Vertailu suurten pilvipalveluiden koneoppimisalustoista

Vertailu merkittävimpien pilvien koneoppimisalustoista. AWS SageMaker, Azure Machine Learning, Google Vertex AI ja Databricks.

PySpark-koodin suorituslogiikka ja optimointi

Kirjoituksessa selvitetään PySpark-ohjelmoinnin suorituslogiikka ja annetaan useita neuvoja PySpark-koodin optimoimiseksi.

Spark + Python tutoriaali datakehittäjille

Tutoriaali Spark-rinnakkaislaskentaan Python-ohjelmointikielellä. Esimerkki on ajettu AWS pilvilaskenta-alustalla AWS Glue-palvelussa.

Big data ETL - Johdatus AWS Glue-palveluun

AWS Glue soveltuu erityisesti suurten datamäärien, eli niin sanotun big datan prosessointiin eräajona. Kirjoitus Solitan Data-blogissa.