Usando PySpark e SQL pude modelar dados de modo a responder as propostas estabelecidas inicialmente.
Foi empregado uma base de dados de 2 GB obtidas no Kaggle onde constavam cerca de 6 milhões de partidas registradas, bem como seus resultados.
O link para acesso à base de dados é o que segue: https://www.kaggle.com/datasets/arevel/chess-games