In [1]:
import requests
from bs4 import BeautifulSoup
import pandas as pd

# URL della pagina
url = "https://www.topmarcatori.it/serie-a/stagione-2014/2015"

# Richiedi la pagina
response = requests.get(url)
soup = BeautifulSoup(response.content, "html.parser")

# Trova la tabella con i dati
table = soup.find("table", class_="table table-striped")

# Inizializza le liste per i dati
giocatori, squadre, gol = [], [], []

# Scorri le righe della tabella per estrarre i dati
for row in table.find_all("tr")[1:]:  # Ignora la riga dell'intestazione
    cols = row.find_all("td")
    if len(cols) >= 4:
        # Estrai il nome del giocatore e della squadra
        nome_squadra = cols[1].get_text(strip=True, separator="\n").split("\n")
        giocatori.append(nome_squadra[0])
        squadre.append(nome_squadra[1] if len(nome_squadra) > 1 else "Non trovata")
        
        # Estrai i gol dal div con class "goals"
        gol_div = row.find("div", class_="goals")
        if gol_div:
            gol.append(gol_div.get_text(strip=True))
        else:
            gol.append("Non trovato")

# Crea un DataFrame con i dati
df = pd.DataFrame({
    "Giocatore": giocatori,
    "Squadra": squadre,
    "Gol": gol
})

# Mostra il risultato
print(df)


              Giocatore   Squadra Gol
0             Luca Toni    Verona  22
1          Mauro Icardi     Inter  22
2          Carlos Tevez  Juventus  20
3       Gonzalo Higuaín    Napoli  18
4          Jérémy Menez     Milan  16
5      Domenico Berardi  Sassuolo  15
6     Manolo Gabbiadini    Napoli  15
7     Antonio Di Natale   Udinese  14
8    Fabio Quagliarella    Torino  13
9           Iago Falque     Genoa  13
10       Miroslav Klose     Lazio  13
11         Paulo Dybala   Palermo  13
12  José Maria Callejon    Napoli  11
13          Simone Zaza  Sassuolo  11
14     Antonio Candreva     Lazio  10
15        Cyril Thereau   Udinese  10
16      Felipe Anderson     Lazio  10
17       Franco Vazquez   Palermo  10
18         Marco Parolo     Lazio  10
19    Massimo Maccarone    Empoli  10


In [3]:
#aggiungo la colonna anno 
df['Anno'] = 2015
print(df)

              Giocatore   Squadra Gol  Anno
0             Luca Toni    Verona  22  2015
1          Mauro Icardi     Inter  22  2015
2          Carlos Tevez  Juventus  20  2015
3       Gonzalo Higuaín    Napoli  18  2015
4          Jérémy Menez     Milan  16  2015
5      Domenico Berardi  Sassuolo  15  2015
6     Manolo Gabbiadini    Napoli  15  2015
7     Antonio Di Natale   Udinese  14  2015
8    Fabio Quagliarella    Torino  13  2015
9           Iago Falque     Genoa  13  2015
10       Miroslav Klose     Lazio  13  2015
11         Paulo Dybala   Palermo  13  2015
12  José Maria Callejon    Napoli  11  2015
13          Simone Zaza  Sassuolo  11  2015
14     Antonio Candreva     Lazio  10  2015
15        Cyril Thereau   Udinese  10  2015
16      Felipe Anderson     Lazio  10  2015
17       Franco Vazquez   Palermo  10  2015
18         Marco Parolo     Lazio  10  2015
19    Massimo Maccarone    Empoli  10  2015


In [5]:
#modifico il nome della colonna "Gol" in "Gol totali
df.rename(columns={"Gol": "Gol totali"}, inplace=True)
print(df)

              Giocatore   Squadra Gol totali  Anno
0             Luca Toni    Verona         22  2015
1          Mauro Icardi     Inter         22  2015
2          Carlos Tevez  Juventus         20  2015
3       Gonzalo Higuaín    Napoli         18  2015
4          Jérémy Menez     Milan         16  2015
5      Domenico Berardi  Sassuolo         15  2015
6     Manolo Gabbiadini    Napoli         15  2015
7     Antonio Di Natale   Udinese         14  2015
8    Fabio Quagliarella    Torino         13  2015
9           Iago Falque     Genoa         13  2015
10       Miroslav Klose     Lazio         13  2015
11         Paulo Dybala   Palermo         13  2015
12  José Maria Callejon    Napoli         11  2015
13          Simone Zaza  Sassuolo         11  2015
14     Antonio Candreva     Lazio         10  2015
15        Cyril Thereau   Udinese         10  2015
16      Felipe Anderson     Lazio         10  2015
17       Franco Vazquez   Palermo         10  2015
18         Marco Parolo     Laz

In [6]:
#salviamo il DataFrame in un file CSV
df.to_csv("marcatori_serieA1415.csv", index=False, encoding='utf-8-sig')