In [None]:
# Analisi dati Formula 1: stagione 2008
# ---
# Uso Pandas per questo progetto perchè è adatta per gestire dati tabellari.
import pandas as pd

# Carico dati
url = "https://proai-datasets.s3.eu-west-3.amazonaws.com/formula1_data.csv"
df = pd.read_csv(url)

# Carico dataset per controllo iniziale(Prime 5 righe)
print("Dataset:")
print(df.head())

# Controllo se la colonna Position è di tipo int perché il dizionario dei punti usa numeri interi
df["Position"] = df["Position"].astype(int)

# Dizionario Punteggio
punteggio = {1:10, 2:8, 3:6, 4:5, 5:4, 6:3, 7:2, 8:1}


# 1 ANALISI PERFORMANCE INDIVIDUALI PILOTI

def pilota_stats(nome_pilota, df):
    """
    Restituisce una lista con:
    punti totali, numero vittorie (primi posti) e numero podi (top 3)
    """
    dati = df[df['Driver'] == nome_pilota]
    punti = dati["Position"].map(punteggio).fillna(0).sum()
    vittorie = (dati["Position"] == 1).sum()
    podi = (dati["Position"].isin([1, 2, 3])).sum() # Ho scelto di usare .isin([1,2,3]) invece che dati["Position"]<=3, per maggior chiarezza
    return [int(punti), int(vittorie), int(podi)]


# 2 CLASSIFICA FINALE PILOTI

def classifica_piloti(df):
    """
    Restituisce (nome_pilota: punti_totali), in ordine decrescente
    """
    if 'Punti' not in df.columns: # Controllo che 'Punti' esista, altrimenti la creo
        df['Punti'] = df['Position'].map(punteggio).fillna(0).astype(int)
    classifica = df.groupby('Driver')['Punti'].sum().sort_values(ascending=False)
    return classifica

classifica_dict = classifica_piloti(df).to_dict()
classifica = classifica_dict

# Salvo il file
with open("Drivers_Standings_2008.txt", "w", encoding="utf-8") as f:
    f.write("Drivers Standings 2008 Formula 1\n")
    for pilota, punti in classifica.items():
        f.write(f"{pilota}: {punti}\n")


# 3 CLASSIFICA COSTRUTTORI

def classifica_costruttori(df):
    """
    Restituisce (nome_team: punti_totali), in ordine decrescente
    """
    dati = df.copy()
    if 'Punti' not in dati.columns: # Qui lavoro su una copia per sicurezza
        dati['Punti'] = dati['Position'].map(punteggio).fillna(0).astype(int)
    classifica_team = dati.groupby('Team')['Punti'].sum().sort_values(ascending=False)
    return classifica_team

classifica_team_dict = classifica_costruttori(df).to_dict()
classifica_team = classifica_team_dict

# Stampo a video di ogni funzione per controllo
esempio_pilota = "Raikkonen"
print(f"\nStatistiche per {esempio_pilota}:", pilota_stats(esempio_pilota, df))
print()

print("Top 10 piloti:")
for i, (nome, pts) in enumerate(list(classifica.items())[:10], start=1):
    print(f"{i}. {nome}: {pts}")

print("\nTop 5 team:")
for i, (team, pts) in enumerate(list(classifica_team.items())[:5], start=1):
    print(f"{i}. {team}: {pts}")

# Downdload facoltativo file
from google.colab import files
files.download("Drivers_Standings_2008.txt")

# Richiamo help
help(pilota_stats)
help(classifica_piloti)
help(classifica_costruttori)

Dataset:
      Driver     Team       Race    Country  Position
0   Hamilton  McLaren  Melbourne  Australia         1
1      Massa  Ferrari  Melbourne  Australia         0
2  Raikkonen  Ferrari  Melbourne  Australia         8
3     Kubica      BMW  Melbourne  Australia         0
4     Alonso  Renault  Melbourne  Australia         4

Statistiche per Raikkonen: [75, 2, 9]

Top 10 piloti:
1. Hamilton: 98
2. Massa: 97
3. Raikkonen: 75
4. Kubica: 75
5. Alonso: 61
6. Heidfeld: 60
7. Kovalainen: 53
8. Vettel: 35
9. Trulli: 31
10. Glock: 25

Top 5 team:
1. Ferrari: 172
2. McLaren: 151
3. BMW: 135
4. Renault: 61
5. Toyota: 56


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

Help on function pilota_stats in module __main__:

pilota_stats(nome_pilota, df)
    Restituisce una lista con:
    punti totali, numero vittorie (primi posti) e numero podi (top 3)

Help on function classifica_piloti in module __main__:

classifica_piloti(df)
    Restituisce (nome_pilota: punti_totali), in ordine decrescente

Help on function classifica_costruttori in module __main__:

classifica_costruttori(df)
    Restituisce (nome_team: punti_totali), in ordine decrescente

