EN FI SV
Google Colab, Databricks Community Edition, Visual Studio Code ja Docker vaihtoehtoina ilmaiseksi data science-kehitysympäristöksi.

Ilmaiset data science-kehitysympäristöt

Tämä kirjoitus on julkaistu vain englanniksi nimellä: Free data science workspaces.

Vertailu merkittävimpien pilvien koneoppimisalustoista. AWS SageMaker, Azure Machine Learning, Google Vertex AI ja Databricks.

Vertailu suurten pilvipalveluiden koneoppimisalustoista

Tämä kirjoitus on julkaistu vain englanniksi nimellä: Comparison of machine learning platforms in major clouds.

Tekninen kuvaus data edellä tehdystä web-sovelluksesta, jonka toteutuin AWS-pilvialustalle harrasteprojektina.

Web-sovellus pilvessä data edellä - Tekninen toteutus

Toteutin harrasteprojektina sekä tietokoneelle että mobiililaitteille taipuvan web-sovelluksen, jossa tärkeänä kriteerinä oli kyvykkyys hyödyntää dataa monipuolisesti esimerkiksi koneoppimisen, rajapintojen ja visualisointien muodossa.

Ennen oli Excel. Nykyään on mobiilisovellukset, pilvi, IoT ja koneoppinen. Tässä blogissa kerron näkemykseni Excelin roolista suhteessa muihin työkaluihin. Pohdintaa myös Excelin tulevaisuudesta.

Elämme koneoppimisen ja pilven aikakautta, mutta mikä Excelin rooli nykyään on?

Ennen oli Excel. Nykyään on mobiilisovellukset, pilvi, IoT ja koneoppinen. Tässä blogissa kerron näkemykseni Excelin roolista tänä päivänä. Kokemukseni perusteella ihmiset voidaan jakaa karkeasti kolmeen ryhmään Exceliin suhtautumisen perusteella - käyn ryhmät läpi kolmessa ensimmäisessä luvussa.

Kirjassa annetaan useita määritelmiä termille data science ja pohditaan data scientistin työssä vaadittavia taitoja. Kirja oli konkreettinen ja sopivan helppolukuinen myös aihetta vähemmän tuntevalle.

Doing Data Science - Data Science on datan soveltamista käytäntöön

Doing Data Science on yliopistokurssin pohjalta kirjoitettu kirja, jossa useat henkilöt kertovat data science teeman alta hyvin erilaisista näkökulmista. Kirjassa oli joitakin koodiharjoituksia, mutta kirja toimii erinomaisesti ilman niitäkin.

Luin kirjan tilastolliseen laskentaan käytetystä R-kielestä. Kerron kokemukseni kirjan sisällöstä ja käyttämistäni oppimismenetelmistä.

R in a Nutshell - Kokemuksia R-ohjelmoinnista

R on tilastolliseen laskentaan suunniteltu ohjelmointikieli. R in a Nutshell puolestaan on R-kirja, jonka kahlasin läpi kuluneen viiden viikon aikana.

Raportti ensimmäisestä 6 kuukaudestani Solitalla "data hommissa". Kokemuksia ja käytännön esimerkkejä asiakasprojekteista.

Arki Solitalla - Tällaista on ollut työ Data Scientistina

Huom! Täältä löytyy 24.11.2018 julkaisemani tuoreempi kirjoitus nykyisistä työtehtävistäni. Pääkuva otettu Solitan uusille työntekijöille järjestetyssä scrum-koulutuksessa toukokuussa. Meikäläinen kuvassa kolmas oikealta.

Tässä blogissa kerron, kuinka toisella yrittämälläni sain diplomityöni nollasta kansien väliin 3 kuukaudessa käyttäen vain 150 työtuntia.

Diplomityö 3 kuukaudessa ja 150 tunnissa - Näin se tehdään

Ensimmäiset askeleeni diplomityöni tekemiseksi otettiin syksyllä 2015, eli puolitoista vuotta sitten. Ainakin yhteen yritykseen muistan soittaneeni ja kyselleeni diplomityöpaikasta, mutta en koskaan päätynyt edes laittamaan hakemusta.

Tampere ES Data Science Meetupissa puheenvuorot koneoppimiskilpailuista ja nettisivujen asiakaspalvelun automatisoinnista.

Tampere ES Data Science Meetup

Tampere Entrepreneurship Society eli tuttavallisemmin Tampere ES järjesti 9.2.2017 klo 17-19 Tampereen keskustassa Data Science aiheisen iltatilaisuuden nimeltä Data Science Meetup.

Vedonlyönti - sillä on mahdollista elättää itsensä. Blogia ei ole sponsoroitu, vaan ajatukset ovat täysin omiani. Lue opas.

Vedonlyönti - Voiko sillä elää? - Lue Opas

Vedonlyönti - sillä on mahdollista elättää itsensä. Blogia ei ole sponsoroitu, vaan ajatukset ovat täysin omiani. Vedonlyönti erityisesti urheilun parissa herättää paljon myyttejä ja uskomuksia, joista osa pitää paikkansa ja osa ei.

NaN

Maanjäristysdatan visualisointi ja klusterointi

Visualisointi toteutettiin analysoimalla R-studion sisäänrakennettua quakes tietoaineistoa, joka sisälsi 1000 kirjausta Fijin maanjäristyksistä vuodesta 1964 määrittämättömään vuoteen asti. Visualisoinnin kannalta oleellisia muuttujia olivat karttakoordinaatit, järistyksen syvyys ja voimakkuus.

Olet palkannut viisi uutta myyntiharjoittelijaa, joilla suoritetaan 100 myyntipuhelun mittainen testi. Kuka saa jatkaa?

Arjen tilastotiedettä - Myyntiharjoittelijan palkkaaminen

Data-kategorian blogeissa analysoidaan todelliseen elämään pohjautuvia pulmia, joita voidaan ratkoa datan ja tilastojen avulla. Tilanne Olet palkannut viisi uutta myyntiharjoittelijaa, joilla suoritetaan 100 myyntipuhelun mittainen testi.

Kirja koneoppimisesta, tiedonlouhinnasta ja algoritmeista. Data Mining Concepts and Techniques, J. Han, M. Kamber & J. Pei.

Data Mining Concepts and Techniques, J. Han, M. Kamber & J. Pei

Ensimmäisissä kappaleissa määritellään tiedonlouhinta, käydään yleistietoa datatyypeistä, datan käsittelyyn liittyvistä teknologioista. Suurin osa materiaalista käsittelee hyvin syvällisesti erilaisia tiedonlouhinta-algoritmeja assosiaatioista, luokittelusta, klusteroinnista ja poikkavuuksien havaitsemisesta.