Burgerimatikkaa

Tein vertailun Tampereen hampurilaisvalikoimasta. Tämän kirjoituksen aiheena onkin analyysi burgeridatasta.

Data Suomen postinumeroalueista sisältäen rajojen koordinaatit

Data Suomen kaikista postinumeroalueista ilmaiseksi sisältäen aluerajat standardimuotoisina koordinaatteina. Sisältää lisäksi alkuperäiset muuttujat Tilastokeskuksen avoimesta postinumerodatasta.

Dataloren lisenssit ja hinnoittelu

Data-analyttiikkaympäristö Dataloressa on kolme pääasiallista hinnoittelu- ja lisensointimallia. Ne tarjoavat loogisen polun kohti yrityksen data-analyysiekosysteemin rakentamista.

Datalore - Esittelyssä alusta kehittyneeseen analytiikkaan

Datalore on kohtuullisen tuore selainpohjainen alusta edistyneeseen data-analytiikkaan.

Verkkosovellus henkilökohtaisen varallisuuden hallintaan - Tekninen toteutus

Seuraavassa lyhyt esittely kehittämästäni varallisuudenhallintasovelluksesta. Jutun lopussa kerron käyttämistäni ohjelmointityökaluista ja -menetelmistä.

Suomen postinumeroalueiden visualisointi kartalla Pythonissa

Suomen postinumerodatan lukeminen ja visualisointi kartalla Pythonissa. Pythonissa on useita paketteja paikkatietodatan käsittelyyn, esimerkiksi geopandas.

Suomen postinumeroalueiden visualisointi kartalla Google Looker Studiossa

Esitä Suomen postinumeroalueet kartalla Google Looker Studiossa. Ohjeet vaativat Google Cloud-projektin ja BigQuery-tietokannan käyttöä.

Suomen postinumeroalueiden visualisointi kartalla Power BI Desktopissa

Näillä ohjeilla saat visualisoitua Suomen postinumeroalueet kartalle Power BI Desktopissa. Postinumerodata on saatavilla ilmaiseksi. Power BI-ominaisuus on kohtuullisen uusi.

Suoritin Google Cloud Professional Machine Learning Engineer-sertifikaatin!

Neljän kuukauden intensiivisen opiskelun jälkeen läpäisin Googlen pilvisertifikaatin nimeltä Professional Machine Learning Engineer! Suomennettuna kutakuinkin Ammattitason koneoppimisinsinööri.

Koneoppimistuotteet Googlen pilvialustalla

Esittely Googlen pilvialustan koneoppimiseen tarkoitetuista tuotteista. Valikoimasta löytyy tarvittavat palvelut teollisen mittakaavan sklaautuviin tekoälysovelluksiin.

Web-sovelluksen ajaminen Kuberneteksella

Kubernetes on tehnyt todellisen läpimurron konttisovellusten hallinnoinnissa. Kokeilin ajaa web sovellusta työkalulla.

Python-ohjelmoinnin aloittaminen 5 minuutissa

Python-ohjelmointi on helppo tapa aloitta ohjelmistokehityksen parissa. Tämä tutoriaali ei edellytä erillistä ohjelmistojen asentamista.

Ilmaiset data science-kehitysympäristöt

Google Colab, Databricks Community Edition, Visual Studio Code ja Docker vaihtoehtoina ilmaiseksi data science-kehitysympäristöksi.

Vertailu suurten pilvipalveluiden koneoppimisalustoista

Vertailu merkittävimpien pilvien koneoppimisalustoista. AWS SageMaker, Azure Machine Learning, Google Vertex AI ja Databricks.

Mikä on koneoppimisalusta?

Mikä on koneoppimisalusta? Esittelyssä niiden erilaiset komponentit, kuten kehittäjän työtila, MLOps-työkalut ja pilvilaskenta.

Koneoppiminen ennakoivassa huollossa

Koneoppimisen hyödyntäminen ennakoivassa huollossa. Kaksiosaisessa sarjassa asiaa kustannusäästöistä ja esimerkki Python-kielellä.

Maantieteellisen sijainnin huijaaminen verkkopalvelulle - Harrasteprojekti

Kuinka web-sivulle voi esittää olevansa eri maantieteellisessä sijainnissa? Kokeilussa esitin olevani Irlannissa matkustaessani Ruotsissa.

Paljonko palkkaa Data Scientist tienaa?

Data scientist palkka. Kuukausipalkka euroissa ja vertailu vastaaviin tehtävänimikkeisiin. Entä paljonko Piilaaksossa tienaisi?

DataCamp - Data science-opinnot verkkokurssina

Kokemuksia DataCamp-palvelusta. Data science-koulutus on helppo järjestää joko itselle tai tiimille järjestelmällisenä kokonaisuutena.

Hakurobotti AWS-pilvialustalle - Tekninen kuvaus asiakasprojektista

Teknisen toteutuksen kuvaus asiakasprojektissta, jossa toteutin hakurobotin AWS-pilvialustalle nuuskimaan tietoa automatisoidusti netistä.

PySpark-koodin suorituslogiikka ja optimointi

Kirjoituksessa selvitetään PySpark-ohjelmoinnin suorituslogiikka ja annetaan useita neuvoja PySpark-koodin optimoimiseksi.

Datan klusterointi SQL-kyselyllä - Esimerkki IoT-datalla

Aikasarjadatan klusterointi SQL-kyselyllä. Yksinkertaisella logiikalla saatiin luotua havainnollistava 3D-kuvaaja. Koodi löytyy GitHubista.

Spark + Python tutoriaali datakehittäjille

Tutoriaali Spark-rinnakkaislaskentaan Python-ohjelmointikielellä. Esimerkki on ajettu AWS pilvilaskenta-alustalla AWS Glue-palvelussa.

Big data ETL - Johdatus AWS Glue-palveluun

AWS Glue soveltuu erityisesti suurten datamäärien, eli niin sanotun big datan prosessointiin eräajona. Kirjoitus Solitan Data-blogissa.

Suomenkielisten sanojen perusmuotoistaminen ja stemmaus pythonilla

Kirjoitin Solitan blogiin aiheesta "Suomenkielisten sanojen perusmuotoistaminen pythonilla". Kirjoitus sisältää koodiesimerkkejä.

Tekoälykokeiluissa havainnot ovat tuloksia tärkeämpiä

Kirjoitin Solitan blogiin aiheesta "Tekoälykokeiluissa havainnot ovat tuloksia tärkeämpiä". Linkki alkuperäiseen tekstiin ja tiivistelmä.

Kokemuksia tekstianalytiikasta rahoitushakemuksien luokittelussa

Kokemuksia tekstianalytiikasta ja rahoitushakemusten automaattisesta luokittelusta.

Web-sovellus pilvessä data edellä - Tekninen toteutus

Tekninen kuvaus data edellä tehdystä web-sovelluksesta, jonka toteutuin AWS-pilvialustalle harrasteprojektina.

Web-sovellus pilvessä data edellä - Sovelluksen esittely

Tein harrasteprojektina pilveen mobiilioptimoidun web-sovelluksen, jossa olennaista oli datan monipuolinen hyödyntäminen. Katso demovideo.

Esimerkki koneoppimisen soveltamisesta liiketoimintaan

Sain vihdoin julkaistua pöytälaatikossani muutaman kuukauden muhineen blogikirjoituksen teemalla "Konkreettinen esimerkki koneoppimisesta ja liiketoimintahyödyistä". Tarve yhdistää liiketoiminta ja koneoppiminen vaikuttaa olevan kova.

Doing Data Science - Kirja Datatieteen soveltamisesta käytäntöön

Kirjassa annetaan useita määritelmiä termille data science ja pohditaan data scientistin työssä vaadittavia taitoja. Kirja oli konkreettinen ja sopivan helppolukuinen myös aihetta vähemmän tuntevalle.

Kuntadatan hakeminen nettisivuilta automatisoidusti

Käsin tehtävänä prosessi menisi seuraavasti Täytä julkisilla verkkosivuilla olevaan lomakkeeseen toimiala, kunta ja pari muuta tietoa. Klikkaa Haku-nappia. Hakutulokset ilmestyvät uudelle sivulle taulukossa. Hakutuloksia näkyy kerrallaan rajattu määrä - seuraavalle tulossivulle pääsee alareunan linkeistä. Naputtele tiedot jokaisesta välilehdestä esim Excel-tiedostoon. Täytä lomake erikseen jokaiselle kunnalle ja käy läpi kaikki tulossivut ja kopioi taas Exceliin. Kuvaus verkkolomakkeen täyttämisestä ja lähettämisestä.1. Laatikko: Verkkolomake.2. Laatikko: Verkkolomakkeen näyttämät tulokset.3. Excel-tiedosto, johon tulokset voidaan syöttää. Kuntia oli yhteensä reilu 300 ja jokaisen kunnan tulokset oli jaettu keskimäärin kolmeen välilehteen. Käsin tehtynä työ olisi vienyt päiviä tai viikkoja ja luultavasti sisältänyt enemmän tai vähemmän virheitä.

PhantomJS ja automatisoitu tietojen haku

Yritykseni kautta tehty asiakasprojekti, jossa automatisoin tietojen hakua netistä simuloimalla käyttäjän toimintoja PhantomJS-työkalulla.

Mikä on Hackathon ja miten se voitetaan?

Hackathon on kilpailu, jossa ratkaisu koostuu tietotekniikan ja liiketoiminnan yhdistämisestä. Lue ratkaisustamme Hiabin Hackathonissa.

R in a Nutshell - Kokemuksia R-ohjelmoinnista

Luin kirjan tilastolliseen laskentaan käytetystä R-kielestä. Kerron kokemukseni kirjan sisällöstä ja käyttämistäni oppimismenetelmistä.

Csv tiedostojen kentät listaksi Pythonilla

Python-koodi, jolla voi automaattisesti listata CSV-tiedostojen otsikkokentät. Alunperin tarvitsin koodia tietovaraston dokumentaatioon.

Algoritmiongelma - Osaatko ratkaista älytehtävän todellisesta asiakasprojektista?

Algoritmiongelma tuli alunperin vastaan todellisessa asiakasprojektissa, jossa tuotteen kulkua tuotantolinjalla täytyi pystyä seuraamaan.

Tampere ES Data Science Meetup

Tampere ES Data Science Meetupissa puheenvuorot koneoppimiskilpailuista ja nettisivujen asiakaspalvelun automatisoinnista.

Maanjäristysdatan visualisointi ja klusterointi

Visualisointi toteutettiin analysoimalla R-studion sisäänrakennettua quakes tietoaineistoa, joka sisälsi 1000 kirjausta Fijin maanjäristyksistä vuodesta 1964 määrittämättömään vuoteen asti. Visualisoinnin kannalta oleellisia muuttujia olivat karttakoordinaatit, järistyksen syvyys ja voimakkuus.

Virusongelma - Tilastollinen pulmapähkinä

Virusongelma: Virus leviää maapallolla ja tappaa ilman hoitoa. Tehtävänäsi on ratkaista tilastollinen pähkinä ja pelastaa maailma.

Arjen tilastotiedettä - Myyntiharjoittelijan palkkaaminen

Olet palkannut viisi uutta myyntiharjoittelijaa, joilla suoritetaan 100 myyntipuhelun mittainen testi. Kuka saa jatkaa?

Data science ja business intelligence - Termistö haltuun

Data science, data engineeer, business intelligence... Big data teeman ympärillä on paljon sekavaa termistöä. Kokosin tärkeimmät.

Django tutoriaali - Dataintensiivisiin web-sovelluksiin

Python-kielelle suunnniteltu Django web-framework tarjoaa data-analytiikasta kiinnostuneelle kaiken tarpeellisen. Näin pääset alkuun.

Techniques and Concepts of Big Data, Barton Poulson - Lynda.com

Videokurssi big datasta. Techniques and Concepts of Big Data, Barton Poulson.

Taukolaskuri - Paljonko tienaat tauon aikana?

Paljonko tienaat taukojen aikana? Javascriptilla koodattu web-laskuri.

Paikkatietojen hakukone

Paikkatietojen hakukoneen tietokantaa ei enää ylläpidetä helmikuussa 2017. Sovellus poistettiin käytöstä kokonaan heinäkuussa 2022. Montako asukasta Tampereella asuikaan? Paljonkohan meidän kylässä on kesämökkejä? Räätälöity hakukone antaa vastauksen kaikkeen tähän. Tilastokeskuksen luotettavaa dataa hyödyntävä hakukone esittää juuri sinua kiinnostavan datan tyylikkään visuaalisessa muodossa. Se on vähän niinkuin Wikipedia – mutta paljon siistimmän näköinen!

Beginning PHP and MySQL

Opetti PHP:sta kaiken tarvittavan. Suurin ongelma itselleni oli alussa oppia PHP yleinen toimintaperiaate, sillä kirjan esimerkit koskivat tilannetta, jossa käyttäjällä on oma palvelin. Itselläni oli käytössä jaettu palvelin, johon PHP:ta ja sen lisäpaketteja ei tarvinnutkaan asentaa erikseen.

HTML and CSS - Design And Build Websites, Jon Duckett

Tässä kirjassa mentiin perusteita syvemmälle nettisivujen ulkoasun suunnitteluun. Esimerkit olivat todella hyviä. Parempi kuin edellinen HTML - CSS kirja.

Head First JavaScript Programming, Elisabeth Robson & Eric Freeman

Arvio kirjasta Head First JavaScript Programming. Kirjoittanut Elisabeth Robson & Eric Freeman. Aiheena Javasrcipt-ohjelmointi.

Head First HTML and CSS, Elisabeth Robson & Eric Freeman

Opi muokkaamaan nettisivujen ulkoasua. HTML ja CSS tulevat yllättävän helposti vastaan työelämässä, jos olet missään tekemisissä nettisivujen kanssa. Kirjassa oli paljon ärsyttävää sälää, kuten kysymys- ja vastausosioita, jotka eivät sopineet suoraviivaiseen makuuni.

The Web Book, Robert Schifreen

Kirja-arvio. Kuinka nettisivut tehdään? Miten internet toimii? Mikä on webhotelli? Mitä ovat WordPress, CSS, HTML, JavaScript ja PHP?