https://mikaelahonen.com/en/data/spark-python-tutorial/