Käsin tehtävänä prosessi menisi seuraavasti
- Täytä julkisilla verkkosivuilla olevaan lomakkeeseen toimiala, kunta ja pari muuta tietoa.
- Klikkaa Haku-nappia.
- Hakutulokset ilmestyvät uudelle sivulle taulukossa. Hakutuloksia näkyy kerrallaan rajattu määrä - seuraavalle tulossivulle pääsee alareunan linkeistä.
- Naputtele tiedot jokaisesta välilehdestä esim Excel-tiedostoon.
- Täytä lomake erikseen jokaiselle kunnalle ja käy läpi kaikki tulossivut ja kopioi taas Exceliin.
Kuntia oli yhteensä reilu 300 ja jokaisen kunnan tulokset oli jaettu keskimäärin kolmeen välilehteen. Käsin tehtynä työ olisi vienyt päiviä tai viikkoja ja luultavasti sisältänyt enemmän tai vähemmän virheitä.
Lopputuloksena saatiin haettua reilut 16000 yhteystietoa, joista lähes kaikilla oli puhelinnumero, sähköposti, verkko-osoite, postiosoite ja yrityksen nimi. Suunnilleen joka toiselle saatiin muodostettua etu- ja sukunimi [email protected] muotoa olevista sähköposteista.
Lue täältä tekninen kuvaus PhantomJS-työkalusta.