https://mikaelahonen.com/en/data/pyspark-execution-logic-and-code-optimization/