Data Suomen postinumeroalueista sisältäen rajojen koordinaatit

Data Suomen kaikista postinumeroalueista ilmaiseksi sisältäen aluerajat standardimuotoisina koordinaatteina. Sisältää lisäksi alkuperäiset muuttujat Tilastokeskuksen avoimesta postinumerodatasta.

Dataloren lisenssit ja hinnoittelu

Data-analyttiikkaympäristö Dataloressa on kolme pääasiallista hinnoittelu- ja lisensointimallia. Ne tarjoavat loogisen polun kohti yrityksen data-analyysiekosysteemin rakentamista.

Datalore - Esittelyssä alusta kehittyneeseen analytiikkaan

Datalore on kohtuullisen tuore selainpohjainen alusta edistyneeseen data-analytiikkaan.

Verkkosovellus henkilökohtaisen varallisuuden hallintaan - Tekninen toteutus

Seuraavassa lyhyt esittely kehittämästäni varallisuudenhallintasovelluksesta. Jutun lopussa kerron käyttämistäni ohjelmointityökaluista ja -menetelmistä.

Suomen postinumeroalueiden visualisointi kartalla Pythonissa

Suomen postinumerodatan lukeminen ja visualisointi kartalla Pythonissa. Pythonissa on useita paketteja paikkatietodatan käsittelyyn, esimerkiksi geopandas.

Web-sovelluksen ajaminen Kuberneteksella

Kubernetes on tehnyt todellisen läpimurron konttisovellusten hallinnoinnissa. Kokeilin ajaa web sovellusta työkalulla.

Löysin Pipedriven ohjelmointirajapinnasta dokumentoimattoman ominaisuuden

Löysin Pipedriven ohjelmointirajapinnasta toiminnon, jota ei oltu dokumentoitu. Pipedriven kehitystiimi vahvisti havainnon.

Python-ohjelmoinnin aloittaminen 5 minuutissa

Python-ohjelmointi on helppo tapa aloitta ohjelmistokehityksen parissa. Tämä tutoriaali ei edellytä erillistä ohjelmistojen asentamista.

Ilmaiset data science-kehitysympäristöt

Google Colab, Databricks Community Edition, Visual Studio Code ja Docker vaihtoehtoina ilmaiseksi data science-kehitysympäristöksi.

Vertailu suurten pilvipalveluiden koneoppimisalustoista

Vertailu merkittävimpien pilvien koneoppimisalustoista. AWS SageMaker, Azure Machine Learning, Google Vertex AI ja Databricks.

Lottostrategia, joka todistetusti parantaa voiton todennäköisyyksiä

Nouseeko lottovoiton todennäköisyys, jos viikoittaisen lottoamisen sijaan panostaa yhteen lottoarvontaan? Kyllä, mutta aika vähän.

Koneoppiminen ennakoivassa huollossa

Koneoppimisen hyödyntäminen ennakoivassa huollossa. Kaksiosaisessa sarjassa asiaa kustannusäästöistä ja esimerkki Python-kielellä.

DataCamp - Data science-opinnot verkkokurssina

Kokemuksia DataCamp-palvelusta. Data science-koulutus on helppo järjestää joko itselle tai tiimille järjestelmällisenä kokonaisuutena.

Hakurobotti AWS-pilvialustalle - Tekninen kuvaus asiakasprojektista

Teknisen toteutuksen kuvaus asiakasprojektissta, jossa toteutin hakurobotin AWS-pilvialustalle nuuskimaan tietoa automatisoidusti netistä.

PySpark-koodin suorituslogiikka ja optimointi

Kirjoituksessa selvitetään PySpark-ohjelmoinnin suorituslogiikka ja annetaan useita neuvoja PySpark-koodin optimoimiseksi.

Datan klusterointi SQL-kyselyllä - Esimerkki IoT-datalla

Aikasarjadatan klusterointi SQL-kyselyllä. Yksinkertaisella logiikalla saatiin luotua havainnollistava 3D-kuvaaja. Koodi löytyy GitHubista.

Spark + Python tutoriaali datakehittäjille

Tutoriaali Spark-rinnakkaislaskentaan Python-ohjelmointikielellä. Esimerkki on ajettu AWS pilvilaskenta-alustalla AWS Glue-palvelussa.

Suomenkielisten sanojen perusmuotoistaminen ja stemmaus pythonilla

Kirjoitin Solitan blogiin aiheesta "Suomenkielisten sanojen perusmuotoistaminen pythonilla". Kirjoitus sisältää koodiesimerkkejä.

Web-sovellus pilvessä data edellä - Tekninen toteutus

Tekninen kuvaus data edellä tehdystä web-sovelluksesta, jonka toteutuin AWS-pilvialustalle harrasteprojektina.

Kannattaako säännöllinen sijoittaminen aloittaa laskusuhdanteen lähestyessä - Data-analyysi

Sijoittaminen laskusuhdanteen lähestyessä. Onko nyt huono hetki aloittaa säännöllinen sijoittaminen varmoina pidettyihin pörssi-indekseihin?

Doing Data Science - Kirja Datatieteen soveltamisesta käytäntöön

Kirjassa annetaan useita määritelmiä termille data science ja pohditaan data scientistin työssä vaadittavia taitoja. Kirja oli konkreettinen ja sopivan helppolukuinen myös aihetta vähemmän tuntevalle.

Csv tiedostojen kentät listaksi Pythonilla

Python-koodi, jolla voi automaattisesti listata CSV-tiedostojen otsikkokentät. Alunperin tarvitsin koodia tietovaraston dokumentaatioon.

Tampere ES Data Science Meetup

Tampere ES Data Science Meetupissa puheenvuorot koneoppimiskilpailuista ja nettisivujen asiakaspalvelun automatisoinnista.

Django tutoriaali - Dataintensiivisiin web-sovelluksiin

Python-kielelle suunnniteltu Django web-framework tarjoaa data-analytiikasta kiinnostuneelle kaiken tarpeellisen. Näin pääset alkuun.

Mastering Regular Expressions - Kirja säännöllisistä lausekkeista ohjelmoinnissa

Säännöllisten lausekkeiden hallitseminen säästää uskomattoman määrän koodia ja on todella arvokas työkalu datan louhintaan.

Asiakasprojekti: Automatisoitu tiedonhaku verkkosivuilta

Asiakasprojektissa haettiin dataa verkkosivuilta Excel-työkirjaan. Ratkaisuna oli Python-ohjelmointikielllä toteutettu työkalu.