Data Suomen postinumeroalueista sisältäen rajojen koordinaatit
Data Suomen kaikista postinumeroalueista ilmaiseksi sisältäen aluerajat standardimuotoisina koordinaatteina. Sisältää lisäksi alkuperäiset muuttujat Tilastokeskuksen avoimesta postinumerodatasta.
Dataloren lisenssit ja hinnoittelu
Data-analyttiikkaympäristö Dataloressa on kolme pääasiallista hinnoittelu- ja lisensointimallia. Ne tarjoavat loogisen polun kohti yrityksen data-analyysiekosysteemin rakentamista.
Datalore - Esittelyssä alusta kehittyneeseen analytiikkaan
Datalore on kohtuullisen tuore selainpohjainen alusta edistyneeseen data-analytiikkaan.
Verkkosovellus henkilökohtaisen varallisuuden hallintaan - Tekninen toteutus
Seuraavassa lyhyt esittely kehittämästäni varallisuudenhallintasovelluksesta. Jutun lopussa kerron käyttämistäni ohjelmointityökaluista ja -menetelmistä.
Suomen postinumeroalueiden visualisointi kartalla Pythonissa
Suomen postinumerodatan lukeminen ja visualisointi kartalla Pythonissa. Pythonissa on useita paketteja paikkatietodatan käsittelyyn, esimerkiksi geopandas.
Web-sovelluksen ajaminen Kuberneteksella
Kubernetes on tehnyt todellisen läpimurron konttisovellusten hallinnoinnissa. Kokeilin ajaa web sovellusta työkalulla.
Löysin Pipedriven ohjelmointirajapinnasta dokumentoimattoman ominaisuuden
Löysin Pipedriven ohjelmointirajapinnasta toiminnon, jota ei oltu dokumentoitu. Pipedriven kehitystiimi vahvisti havainnon.
Python-ohjelmoinnin aloittaminen 5 minuutissa
Python-ohjelmointi on helppo tapa aloitta ohjelmistokehityksen parissa. Tämä tutoriaali ei edellytä erillistä ohjelmistojen asentamista.
Ilmaiset data science-kehitysympäristöt
Google Colab, Databricks Community Edition, Visual Studio Code ja Docker vaihtoehtoina ilmaiseksi data science-kehitysympäristöksi.
Vertailu suurten pilvipalveluiden koneoppimisalustoista
Vertailu merkittävimpien pilvien koneoppimisalustoista. AWS SageMaker, Azure Machine Learning, Google Vertex AI ja Databricks.
Lottostrategia, joka todistetusti parantaa voiton todennäköisyyksiä
Nouseeko lottovoiton todennäköisyys, jos viikoittaisen lottoamisen sijaan panostaa yhteen lottoarvontaan? Kyllä, mutta aika vähän.
Koneoppiminen ennakoivassa huollossa
Koneoppimisen hyödyntäminen ennakoivassa huollossa. Kaksiosaisessa sarjassa asiaa kustannusäästöistä ja esimerkki Python-kielellä.
DataCamp - Data science-opinnot verkkokurssina
Kokemuksia DataCamp-palvelusta. Data science-koulutus on helppo järjestää joko itselle tai tiimille järjestelmällisenä kokonaisuutena.
Hakurobotti AWS-pilvialustalle - Tekninen kuvaus asiakasprojektista
Teknisen toteutuksen kuvaus asiakasprojektissta, jossa toteutin hakurobotin AWS-pilvialustalle nuuskimaan tietoa automatisoidusti netistä.
PySpark-koodin suorituslogiikka ja optimointi
Kirjoituksessa selvitetään PySpark-ohjelmoinnin suorituslogiikka ja annetaan useita neuvoja PySpark-koodin optimoimiseksi.
Datan klusterointi SQL-kyselyllä - Esimerkki IoT-datalla
Aikasarjadatan klusterointi SQL-kyselyllä. Yksinkertaisella logiikalla saatiin luotua havainnollistava 3D-kuvaaja. Koodi löytyy GitHubista.
Spark + Python tutoriaali datakehittäjille
Tutoriaali Spark-rinnakkaislaskentaan Python-ohjelmointikielellä. Esimerkki on ajettu AWS pilvilaskenta-alustalla AWS Glue-palvelussa.
Suomenkielisten sanojen perusmuotoistaminen ja stemmaus pythonilla
Kirjoitin Solitan blogiin aiheesta "Suomenkielisten sanojen perusmuotoistaminen pythonilla". Kirjoitus sisältää koodiesimerkkejä.
Web-sovellus pilvessä data edellä - Tekninen toteutus
Tekninen kuvaus data edellä tehdystä web-sovelluksesta, jonka toteutuin AWS-pilvialustalle harrasteprojektina.
Kannattaako säännöllinen sijoittaminen aloittaa laskusuhdanteen lähestyessä - Data-analyysi
Sijoittaminen laskusuhdanteen lähestyessä. Onko nyt huono hetki aloittaa säännöllinen sijoittaminen varmoina pidettyihin pörssi-indekseihin?
Doing Data Science - Kirja Datatieteen soveltamisesta käytäntöön
Kirjassa annetaan useita määritelmiä termille data science ja pohditaan data scientistin työssä vaadittavia taitoja. Kirja oli konkreettinen ja sopivan helppolukuinen myös aihetta vähemmän tuntevalle.
Csv tiedostojen kentät listaksi Pythonilla
Python-koodi, jolla voi automaattisesti listata CSV-tiedostojen otsikkokentät. Alunperin tarvitsin koodia tietovaraston dokumentaatioon.
Tampere ES Data Science Meetup
Tampere ES Data Science Meetupissa puheenvuorot koneoppimiskilpailuista ja nettisivujen asiakaspalvelun automatisoinnista.
Django tutoriaali - Dataintensiivisiin web-sovelluksiin
Python-kielelle suunnniteltu Django web-framework tarjoaa data-analytiikasta kiinnostuneelle kaiken tarpeellisen. Näin pääset alkuun.
Mastering Regular Expressions - Kirja säännöllisistä lausekkeista ohjelmoinnissa
Säännöllisten lausekkeiden hallitseminen säästää uskomattoman määrän koodia ja on todella arvokas työkalu datan louhintaan.
Automatisoitu tiedonhaku verkkosivuilta
Asiakasprojektissa haettiin dataa verkkosivuilta Excel-työkirjaan. Ratkaisuna oli Python-ohjelmointikielllä toteutettu työkalu.