Joistakin ammateista tai työtehtävistä on helpompi kertoa kuin toisista. Esimerkiksi poliisin tai putkimiehen ammateista kaikilla on jonkinlainen käsitys.

Sitten on rooleja, joissa on epämääräinen englanninkielinen titteli, työ ei näy toimiston seinien ulkopuolelle ja käsitteistö on täynnä outoja lyhenteitä. Tähän kategoriaan lasken omankin työni, joten avaan työtehtäviäni Solitalla viimeisen vuoden aikana esimerkkien kautta. Solitalla aloitin helmikuussa 2017.

Virallisissa yhteyksissä käytän nimikettä data scientist, mutta kuten tulet huomaamaan, toimenkuva on laaja.

  1. Data-alustan toteuttaminen pilveen
  2. Sovellus materiaalitoimitusten optimointiin
  3. Ennakoivaa analytiikkaa Kiinaan
  4. Lainahakemusten riskiennuste
  5. Data science-osaamisen myynti
  6. Toimenkuvani plussat ja miinukset

Teksti on kirjoitettu omasta aloitteestani, eikä työnantaja ole vaikuttanut sen sisältöön.

Data-alustan toteuttaminen pilveen 11/2017 - 01/2018

Tehtävänämme työparini kanssa oli pystyttää asiakkaalle pilveen Solitan tuotteistettu data-alusta .

Pilveen tekeminen tarkoittaa, että palvelimien ostamisen sijaan laskentatehoa vuokrataan esimerkiksi Microsoft Azuren, Amazon Web Servicesin tai Google Cloudin datakeskuksista.

Kun data-alustan pilviympäristö oltiin luotu, dataa tuotiin verkkokaupasta, asiakastietojärjestelmästä ja markkinointiautomaatiotyökalusta keskitetysti yhteen tietokantaan. Datalähteiden lisäämisen jälkeen data mallinnettiin, eli jäsenneltiin data sopivien käsitteiden kautta järkeviin kokonaisuuksiin myöhempää analysointia ja raportointia varten.

Avainsanat: AWS, Linux, tietomallinnus, tietoturva, tietovarasto, tietoverkot

Sovellus materiaalitoimitusten optimointiin 02/2018 - 05/2018

Projektissa toteutettiin sovellus, joka ennusti sopivaa toimitusajankohtaa materiaalitoimituksille sää-, asiakas- ja paikkatietoadataa hyödyntäen. Raaka-aine ei saisi loppua varastosta, mutta turhia toimituksiakaan ei kannattaisi tehdä.

Projektissa aloittaessani sovellusta oltiin tehty jo melko pitkälle. Tehtäväkseni jäi selvittää tietokannasta, miksi ennusteet poikkeavat niin paljon vanhalla menetelmällä tehdyistä arvioista. Ratkoimme asiakkaan kanssa datan laatuun liittyviä haasteita. Tein ohjelmakoodiin ja tietokantakyselyihin tarvittavia korjauksia ja arvioin, toimiko koneoppimismalli halutulla tavalla.

Avainsanat: koneoppiminen, Azure, python, R, SQL

Ennakoivaa analytiikkaa Kiinaan 06/2018 - 08/2018

Tässä projektissa pääsin mukaan jo tarjouksen tekemiseen. Koska asiakas oli Kiinassa, työkulttuuri, kielimuuri ja aikaero aiheuttivat kommunikaatiohaasteita. Kiinassa kävin paikan päällä pari kertaa, mikä auttoi asiakkaan henkilöstöön tutustumisessa.

Projektin tavoitteena oli kaupallistaa laitteiden ennakoivaan huoltoon liittyvä palvelu.

Asiakkaan laitteisiin kytketyt sensorit lähettivät säännöllisin väliajoin dataa tietokantaan. Tehtäväni oli etsiä sensoridatasta ilmiöitä, jotka ennakoisivat laitteen hajoamista. Lopputuloksena syntyi kourallinen algoritmeja, joiden tavoitteena on hälyttää ennen laitteen vikaantumista.

Avainsanat: fysiikka, IoT, python, SQL, tilastotiede

Lainahakemusten riskiennuste 09/2018 - 01/2019

Asiakkaan liiketoimintaan kuului lainahakemusten käsittelyä. Hakemuksen käsittelijä määritteli riskin neljässä eri kategoriassa. Tavoitteena oli järjestelmäuudistuksen yhteydessä automatisoida riskiarviointi.

Aluksi yhdistelimme hakemuksiin liittyvää dataa eri järjestelmien tietokannoista. Lähdimme liikkeelle ilmiön ymmärtämisestä visualisoimalla dataa ja laskemalla prosessiin liittyviä tunnuslukuja.

Loimme koneoppimismallin jäljittelemään ihmisen tekemiä päätöksiä, mutta paremmaksi vaihtoehdoksi osoittautui selkeästi määritelty riskipisteytysjärjestelmä.

Avainsanat: koneoppiminen, konsultointi, python, SQL, tilastotiede

Rinnakkaislaskentaa data-alustalle 02/2019 - 10/2019

Tiimimme kehitti AWS data-alustaa ruotsalaiselle valmistavan teollisuuden yritykselle. Alkuvaiheessa sain vastuulleni hyödyntää Spark-rinnakkaislaskentaa suurien datamäärien prosessoinnissa.

Projektin aikana olen joutunut opettelemaan paljon ohjelmistokehityksen perusasioita. Tähän sisältyy niin versionhallinnan ammatillinen käyttäminen, automatisoitu pilvi-infrastruktuurin pystyttäminen ja data-alustan monitorointi.

Avainsanat: AWS, spark, python, ohjelmistokehitys

Data Science-osaamisen myynti

Karkeasti puolet työajastani kuluu data science- eli analytiikkaosaamisen myymiseen. Toimenkuva pitää sisällään asiakkuusvastaavien kanssa ideointia, tarjousten valmistelua, myyntimateriaalien kehittämistä, demojen tekemistä, blogien kirjoittamista, puhe-esiintymisiä, seminaarikäyntejä, työpajojen järjestämistä ja myyntikäynneille osallistumista.

Eli paljon kaikkea.

Olennaista on myyntitehtävien priorisoiminen, johon päästään määrittelemällä yksilöiden ja yrityksen vahvuudet ja data science-tiimin tavoitetila. Myyntitilanteissa valttia on aikaisemmista projekteista saadut kokemukset ja selkeästi esitetty näkemys seuraavista askelista.

Välillä myyntitehtävät ovat vieneet ympäri Eurooppaa, mutta useimmin Helsinkiin.

Toimenkuvani plussat ja miinukset

Miinukset

  • Asiakkaiden ongelmat ovat epämääräisiä ja laajoja.
  • Myyntitehtävät lisäävät kompleksisuutta aikataulujen suunnitteluun.
  • Työn tuloksia ei näe, jos projekti etenee hitaasti tai projekti ei saa jatkoa.
  • Projektit eivät ole vaihtuneet niin suoraviivaisesti kuin otsikointi antaa ymmärtää: Työ on välillä sekavaa.

Plussat

  • Työkaverit.
  • Vaihtelevat työtehtävät.
  • Vapaus työtavoista ja -ajoista.
  • Hyvin monenlaisten organisaatioiden näkeminen.
  • Uusiin teknologioihin perehtyminen ja oppiminen.
  • Mahdollisuus ratkaista erittäin mielenkiintoisia ja isossa mittakaavassa merkittäviä ongelmia.
  • Ne hetket, kun onnistuu pilkkomaan ison ja haastavan ongelman pieniin, ymmärrettäviin palasiin.

Päivitetty 13.10.2019. Lisätty tekstikappale “Rinnakkaislaskentaa data-alustalle 02/2019 - 10/2019”.