PySpark-koodin suorituslogiikka ja optimointi

Kirjoituksessa selvitetään PySpark-ohjelmoinnin suorituslogiikka ja annetaan useita neuvoja PySpark-koodin optimoimiseksi.

Spark + Python tutoriaali datakehittäjille

Tutoriaali Spark-rinnakkaislaskentaan Python-ohjelmointikielellä. Esimerkki on ajettu AWS pilvilaskenta-alustalla AWS Glue-palvelussa.

Big data ETL - Johdatus AWS Glue-palveluun

AWS Glue soveltuu erityisesti suurten datamäärien, eli niin sanotun big datan prosessointiin eräajona. Kirjoitus Solitan Data-blogissa.

Excel Power Map - Paikkadatan visualisointi aikasarjana

Excel Power Map-ominaisuus on tarkoitettu paikkatietojen visualisointiin. Katso turvapaikanhakijadatasta tehty demo-video.

Suomenkielisten sanojen perusmuotoistaminen ja stemmaus pythonilla

Kirjoitin Solitan blogiin aiheesta "Suomenkielisten sanojen perusmuotoistaminen pythonilla". Kirjoitus sisältää koodiesimerkkejä.

Blogikirjoittaminen ammatillisista aiheista - Kokemuksia ja vinkkejä

Blogikirjoittaminen ammatillisista aiheista on mainio tapa lisätä omaa ja työnantajan näkyvyyttä. Lue ohjeet ja kokemukset.

Tekoälykokeiluissa havainnot ovat tuloksia tärkeämpiä

Kirjoitin Solitan blogiin aiheesta "Tekoälykokeiluissa havainnot ovat tuloksia tärkeämpiä". Linkki alkuperäiseen tekstiin ja tiivistelmä.

Kokemuksia tekstianalytiikasta rahoitushakemuksien luokittelussa

Kokemuksia tekstianalytiikasta ja rahoitushakemusten automaattisesta luokittelusta.

Mitä teen työkseni?

Outo englanninkielinen titteli ei usein kerro, mitä työ oikeasti on. Blogitekstissä kerron tarkemmin, millaisia ongelmia ratkon työssäni.

Näin saat parhaat tekijät dataprojektiisi - Kirjoitukseni Solitan blogissa

Tarkoituksenani on kuvata konsulttien päätöksiin vaikuttavia tekijöitä, joita konsulttipalveuiden ostaja ei välttämättä tule ajatelleeksi.

Esimerkki koneoppimisen soveltamisesta liiketoimintaan

Sain vihdoin julkaistua pöytälaatikossani muutaman kuukauden muhineen blogikirjoituksen teemalla "Konkreettinen esimerkki koneoppimisesta ja liiketoimintahyödyistä". Tarve yhdistää liiketoiminta ja koneoppiminen vaikuttaa olevan kova.

Yrittäminen ja palkkatyö samaan aikaan

Onnistuuko yrittäminen ja palkkatyö samaan aikaan? Entä miten toiminimi vaikuttaa verotukseen ja kuinka suuria ovat rahalliset hyödyt?

Mikä on Hackathon ja miten se voitetaan?

Hackathon on kilpailu, jossa ratkaisu koostuu tietotekniikan ja liiketoiminnan yhdistämisestä. Lue ratkaisustamme Hiabin Hackathonissa.

Arki Solitalla - Tällaista on ollut työ Data Scientistina

Raportti ensimmäisestä 6 kuukaudestani Solitalla "data hommissa". Kokemuksia ja käytännön esimerkkejä asiakasprojekteista.

Tällainen firma on ohjelmistoyritys Solita

Mikä erottaa Solitan muista ohjelmistoalan yrityksistä? Entä mitä tehdään edustamassani Agile Data-yksikössä?

Näin hankin itselleni unelmatyön - Jättijulkaisu työnhausta esimerkkien kera

Aloitan pian työni data-analytiikkakonsulttina. Lue sensuroimaton versio Solitan rekrytointiprosessista ja lataa lähettämäni työhakemus.