Scraping-projektin tilaaminen: näin sujuu yhteistyö
Scraping-projekti: 1) Kerro mitä dataa tarvitset ja mistä, 2) Toimittaja arvioi toteutettavuuden, 3) Sovitaan hinta ja aikataulu, 4) Toteutus + testaus, 5) Toimitus haluamassasi muodossa. Tyypillinen kertaprojekti: 500–2000 €. Jatkuva seuranta: kuukausimaksu.
Mitä kertoa toimittajalle?
Mitä tarkemmin kuvaat tarpeen, sitä paremman tarjouksen saat:
1. Mitä dataa tarvitset?
- Kentät: tuotteen nimi, hinta, saatavuus, kuvaus...
- Esimerkkisivu URL:ineen
- Onko kyse yksittäisistä sivuista vai koko kategorioista?
2. Mistä sivustoilta?
- URL-osoitteet
- Montako sivustoa?
- Vaatiiko kirjautumista? (yleensä ei toteuteta)
3. Kuinka usein?
- Kertaluonteinen keräys
- Päivittäin / viikoittain / kuukausittain
4. Missä muodossa haluat datan?
- Excel / CSV
- JSON
- Suoraan tietokantaan / API:iin
- Google Sheets
5. Mihin käytät dataa?
Auttaa toimittajaa ymmärtämään: hintaseuranta, markkinatutkimus, liidienhankinta, tuotetietojen rikastus...
Projektin vaiheet
- Tarvekartoitus: Käydään läpi mitä tarvitset
- Toteutettavuusarvio: Toimittaja tutkii sivustot, arvioi monimutkaisuuden
- Tarjous: Hinta, aikataulu, toimitusmuoto
- Toteutus: Scraperin kehitys ja testaus
- Testiaineisto: Näyte datasta tarkistettavaksi
- Korjaukset: Tarvittaessa hienosäätö
- Toimitus: Lopullinen data sovitussa muodossa
- (Jatkuva): Ajastus ja ylläpito jos sovittu
Hinnoittelumallit
| Malli | Kuvaus | Tyypillinen hinta |
|---|---|---|
| Kertaprojekti | Kerätään data kerran | 500–2000 € |
| Tuntityö | Laskutetaan käytetyn ajan mukaan | 70 €/h |
| Jatkuva palvelu | Säännöllinen keräys + ylläpito | 200–1000 €/kk |
| Per rivi | Maksat kerätyn datan määrän mukaan | 0,01–0,10 €/rivi |
Mikä vaikuttaa hintaan?
- Sivuston monimutkaisuus: JavaScript-renderöinti, anti-bot -suojaukset
- Datan määrä: 100 riviä vs 100 000 riviä
- Sivustojen määrä: 1 sivusto vs 10 sivustoa
- Toistuvuus: Kerran vs päivittäin
- Datan käsittely: Raakadata vs puhdistettu ja normalisoitu
- Ylläpito: Sivusto muuttuu → scraper pitää päivittää
Mitä odottaa toimitukselta?
Hyvä toimitus sisältää:
- Data sovitussa muodossa
- Dokumentaatio kentistä
- Tieto milloin kerätty
- Virheraportti jos jotain puuttuu
Jatkuvassa palvelussa lisäksi:
- Ajastus ja automaattinen toimitus
- Hälytykset virheistä
- Ylläpito kun sivusto muuttuu
- Raportointi
Riskit ja niiden hallinta
| Riski | Hallinta |
|---|---|
| Sivusto muuttuu | Ylläpitosopimus, monitorointi |
| Sivusto estää | Proxy-palvelut, hitaampi keräys |
| Datan laatu vaihtelee | Validointi, testiaineisto ennen toimista |
| Projekti myöhästyy | Selkeä aikataulu, välitavoitteet |
Checklist tilaajalle
- ☐ Määritellyt kentät listattuna
- ☐ Esimerkkisivut URL:eineen
- ☐ Keräystiheys sovittu
- ☐ Toimitusmuoto sovittu
- ☐ Budjetti tiedossa
- ☐ Aikataulu tiedossa
- ☐ Yhteyshenkilö nimetty
Usein kysytyt kysymykset
Kuinka kauan projekti kestää?
Tyypillinen kertaprojekti: 1–2 viikkoa. Yksinkertainen: muutama päivä. Monimutkainen: 3–4 viikkoa.
Saanko scraperin omaksi?
Sovittavissa. Yleensä asiakas saa datan, scraper jää toimittajalle (ellei erikseen sovita). Scraperin omistus voi nostaa hintaa.
Mitä jos sivusto estää keräyksen kesken projektin?
Hyvä toimittaja kertoo riskin etukäteen ja sisällyttää kohtuullisen määrän ongelmanratkaisua hintaan. Äärimmäisissä tapauksissa projekti voidaan keskeyttää.
Lue myös
Haluatko tilata scraping-projektin?
Kerro mitä dataa tarvitset ja mistä, niin annamme arvion. 70 €/h tai kiinteä hinta.
Pyydä tarjous