In [2]:
import requests
from bs4 import BeautifulSoup
import pandas as pd

# URL della pagina
url = "https://www.topmarcatori.it/serie-a/stagione-2015/2016"

# Richiedi la pagina
response = requests.get(url)
soup = BeautifulSoup(response.content, "html.parser")

# Trova la tabella con i dati
table = soup.find("table", class_="table table-striped")

# Inizializza le liste per i dati
giocatori, squadre, gol = [], [], []

# Scorri le righe della tabella per estrarre i dati
for row in table.find_all("tr")[1:]:  # Ignora la riga dell'intestazione
    cols = row.find_all("td")
    if len(cols) >= 4:
        # Estrai il nome del giocatore e della squadra
        nome_squadra = cols[1].get_text(strip=True, separator="\n").split("\n")
        giocatori.append(nome_squadra[0])
        squadre.append(nome_squadra[1] if len(nome_squadra) > 1 else "Non trovata")
        
        # Estrai i gol dal div con class "goals"
        gol_div = row.find("div", class_="goals")
        if gol_div:
            gol.append(gol_div.get_text(strip=True))
        else:
            gol.append("Non trovato")

# Crea un DataFrame con i dati
df = pd.DataFrame({
    "Giocatore": giocatori,
    "Squadra": squadre,
    "Gol": gol
})

# Mostra il risultato
print(df)


             Giocatore     Squadra Gol
0      Gonzalo Higuaín      Napoli  36
1         Paulo Dybala    Juventus  19
2         Carlos Bacca       Milan  18
3         Mauro Icardi       Inter  16
4   Leonardo Pavoletti       Genoa  14
5        Mohamed Salah        Roma  14
6                 Éder       Inter  13
7         Josip Ilicic  Fiorentina  13
8    Massimo Maccarone      Empoli  13
9       Andrea Belotti      Torino  12
10     Lorenzo Insigne      Napoli  12
11      Nikola Kalinic  Fiorentina  12
12       Cyril Thereau     Udinese  11
13   Alberto Gilardino     Palermo  10
14    Antonio Candreva       Lazio  10
15     Mario Mandzukic    Juventus  10
16      Miralem Pjanic        Roma  10
17      Daniel Ciofani   Frosinone   9
18    Federico Dionisi   Frosinone   9


In [3]:
#aggiungo la colonna anno
df["Anno"] = 2016
print(df)

             Giocatore     Squadra Gol  Anno
0      Gonzalo Higuaín      Napoli  36  2016
1         Paulo Dybala    Juventus  19  2016
2         Carlos Bacca       Milan  18  2016
3         Mauro Icardi       Inter  16  2016
4   Leonardo Pavoletti       Genoa  14  2016
5        Mohamed Salah        Roma  14  2016
6                 Éder       Inter  13  2016
7         Josip Ilicic  Fiorentina  13  2016
8    Massimo Maccarone      Empoli  13  2016
9       Andrea Belotti      Torino  12  2016
10     Lorenzo Insigne      Napoli  12  2016
11      Nikola Kalinic  Fiorentina  12  2016
12       Cyril Thereau     Udinese  11  2016
13   Alberto Gilardino     Palermo  10  2016
14    Antonio Candreva       Lazio  10  2016
15     Mario Mandzukic    Juventus  10  2016
16      Miralem Pjanic        Roma  10  2016
17      Daniel Ciofani   Frosinone   9  2016
18    Federico Dionisi   Frosinone   9  2016


In [4]:
#modifico il nome della colonna "Gol" in "Gol totali
df.rename(columns={"Gol": "Gol totali"}, inplace=True)
print(df)

             Giocatore     Squadra Gol totali  Anno
0      Gonzalo Higuaín      Napoli         36  2016
1         Paulo Dybala    Juventus         19  2016
2         Carlos Bacca       Milan         18  2016
3         Mauro Icardi       Inter         16  2016
4   Leonardo Pavoletti       Genoa         14  2016
5        Mohamed Salah        Roma         14  2016
6                 Éder       Inter         13  2016
7         Josip Ilicic  Fiorentina         13  2016
8    Massimo Maccarone      Empoli         13  2016
9       Andrea Belotti      Torino         12  2016
10     Lorenzo Insigne      Napoli         12  2016
11      Nikola Kalinic  Fiorentina         12  2016
12       Cyril Thereau     Udinese         11  2016
13   Alberto Gilardino     Palermo         10  2016
14    Antonio Candreva       Lazio         10  2016
15     Mario Mandzukic    Juventus         10  2016
16      Miralem Pjanic        Roma         10  2016
17      Daniel Ciofani   Frosinone          9  2016
18    Federi

In [5]:
#salviamo il DataFrame in un file CSV
df.to_csv("marcatori_serieA1516.csv", index=False, encoding='utf-8-sig')