Vertailu suurten pilvipalveluiden koneoppimisalustoista
Vertailu merkittävimpien pilvien koneoppimisalustoista. AWS SageMaker, Azure Machine Learning, Google Vertex AI ja Databricks.
PySpark-koodin suorituslogiikka ja optimointi
Kirjoituksessa selvitetään PySpark-ohjelmoinnin suorituslogiikka ja annetaan useita neuvoja PySpark-koodin optimoimiseksi.
Spark + Python tutoriaali datakehittäjille
Tutoriaali Spark-rinnakkaislaskentaan Python-ohjelmointikielellä. Esimerkki on ajettu AWS pilvilaskenta-alustalla AWS Glue-palvelussa.
Big data ETL - Johdatus AWS Glue-palveluun
AWS Glue soveltuu erityisesti suurten datamäärien, eli niin sanotun big datan prosessointiin eräajona. Kirjoitus Solitan Data-blogissa.