Ilmaiset data science-kehitysympäristöt
Google Colab, Databricks Community Edition, Visual Studio Code ja Docker vaihtoehtoina ilmaiseksi data science-kehitysympäristöksi.
Inspiraatiota | Asennetta | Tarinoita
Koneoppiminen tarkoittaa menetelmiä, joilla voidaan tehdä ennusteita datasta perustuen historiatietoon. Yksinkertaisessa tapauksessa sovellukselle tai algoritmille voidaan syöttää taulukkomuotoista dataa, josta luodaan tilastollinen malli. Taulukossa voi olla vaikkapa kolme saraketta: koulutus, ikä ja palkka. Datan perusteella malli pystyy ennustamaan koulutuksen ja iän perusteella henkilön palkan tietyllä tarkkuudella ennen näkemättömistä kirjauksista. Esimerkiksi bayesilainen luokittelu on yksinkertainen koneoppimisalgoritmi.
Google Colab, Databricks Community Edition, Visual Studio Code ja Docker vaihtoehtoina ilmaiseksi data science-kehitysympäristöksi.
Vertailu merkittävimpien pilvien koneoppimisalustoista. AWS SageMaker, Azure Machine Learning, Google Vertex AI ja Databricks.
Mikä on koneoppimisalusta? Esittelyssä niiden erilaiset komponentit, kuten kehittäjän työtila, MLOps-työkalut ja pilvilaskenta.
Koneoppimisen hyödyntäminen ennakoivassa huollossa. Kaksiosaisessa sarjassa asiaa kustannusäästöistä ja esimerkki Python-kielellä.
Kokemuksia DataCamp-palvelusta. Data science-koulutus on helppo järjestää joko itselle tai tiimille järjestelmällisenä kokonaisuutena.
Ensiasunnon ostaminen keskustasta. Kokemuksia lainan neuvottelemisesta, asunnon hinnan arvioinnista ja korkojen vaikutuksesta.
Teknisen toteutuksen kuvaus asiakasprojektissta, jossa toteutin hakurobotin AWS-pilvialustalle nuuskimaan tietoa automatisoidusti netistä.
Aikasarjadatan klusterointi SQL-kyselyllä. Yksinkertaisella logiikalla saatiin luotua havainnollistava 3D-kuvaaja. Koodi löytyy GitHubista.
Testissä Excel-mobiilisovelluksen ominaisuus, jolla tulostetun taulukon kuvasta voidaan tuoda tiedot laskentataulukkoon automatisoidusti.
Kirjoitin Solitan blogiin aiheesta ”Suomenkielisten sanojen perusmuotoistaminen pythonilla”. Kirjoitus sisältää koodiesimerkkejä.
Kirjoitin Solitan blogiin aiheesta ”Tekoälykokeiluissa havainnot ovat tuloksia tärkeämpiä”. Linkki alkuperäiseen tekstiin ja tiivistelmä.
Kokemuksia tekstianalytiikasta ja rahoitushakemusten automaattisesta luokittelusta.
Tekninen kuvaus data edellä tehdystä web-sovelluksesta, jonka toteutuin AWS-pilvialustalle harrasteprojektina.
Tein harrasteprojektina pilveen mobiilioptimoidun web-sovelluksen, jossa olennaista oli datan monipuolinen hyödyntäminen. Katso demovideo.
Outo englanninkielinen titteli ei usein kerro, mitä työ oikeasti on. Blogitekstissä kerron tarkemmin, millaisia ongelmia ratkon työssäni.
Sain vihdoin julkaistua pöytälaatikossani muutaman kuukauden muhineen blogikirjoituksen teemalla ”Konkreettinen esimerkki koneoppimisesta ja liiketoimintahyödyistä”. Tarve yhdistää liiketoiminta ja koneoppiminen vaikuttaa olevan kova.
Ennen oli Excel. Nykyään on mobiilisovellukset, pilvi, IoT ja koneoppinen. Tässä blogissa kerron näkemykseni Excelin roolista suhteessa muihin työkaluihin. Pohdintaa myös Excelin tulevaisuudesta.
Kirjassa annetaan useita määritelmiä termille data science ja pohditaan data scientistin työssä vaadittavia taitoja. Kirja oli konkreettinen ja sopivan helppolukuinen myös aihetta vähemmän tuntevalle.
Luin kirjan tilastolliseen laskentaan käytetystä R-kielestä. Kerron kokemukseni kirjan sisällöstä ja käyttämistäni oppimismenetelmistä.
Tampere ES Data Science Meetupissa puheenvuorot koneoppimiskilpailuista ja nettisivujen asiakaspalvelun automatisoinnista.
Vedonlyönti – sillä on mahdollista elättää itsensä. Blogia ei ole sponsoroitu, vaan ajatukset ovat täysin omiani. Lue opas.
Kirja koneoppimisesta, tiedonlouhinnasta ja algoritmeista. Data Mining Concepts and Techniques, J. Han, M. Kamber & J. Pei.