# collect data for  one team (espernace sportive de tunis)

In [1]:
import requests
from bs4 import BeautifulSoup
import pandas as pd

In [2]:
# URL de la page des transferts
url = 'https://www.transfermarkt.fr/ligue-professionnelle-1/transfers/wettbewerb/TUN1'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, Gecko) Chrome/58.0.3029.110 Safari/537.3'
}

# Faire la requête
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.content, 'html.parser')

In [3]:
# Function to extract data from a table
def extract_table_data(table):
    rows = table.find_all('tr')[1:]  # Skip the header
    data = []
    for row in rows:
        cols = row.find_all('td')
        if len(cols) >= 8:  # Ensure there are enough columns
            player_name = cols[0].get_text(strip=True)
            age = cols[1].get_text(strip=True)
            nationality = cols[2].find('img')['alt'] if cols[2].find('img') else None  # Get the country name
            position = cols[3].get_text(strip=True)
            short_position = cols[4].get_text(strip=True)
            market_value = cols[5].get_text(strip=True)
            # Extracting the club name and country name for the "From" column
            from_team_info = cols[6].find('a')
            if from_team_info:
                from_team = cols[7].get_text(strip=True)
                from_full = f"{from_team} - {nationality}" if nationality else from_team
            else:
                from_full = None
            transfer_fee = cols[8].get_text(strip=True)
            data.append([player_name, age, nationality, position, short_position, market_value, from_full, transfer_fee])
    return data

In [4]:
# Extraction des données pour les arrivées
table_arrivees = soup.select_one('.box .responsive-table table:nth-of-type(1)')
if table_arrivees:
    arrivees_data = extract_table_data(table_arrivees)
    df_arrivees = pd.DataFrame(arrivees_data)

    # Adding team name and short name columns at the beginning
    df_arrivees.insert(0, 'Team', 'Espérance Sportive de Tunis')
    df_arrivees.insert(1, 'Short Name', 'EST')

    # Renaming columns
    df_arrivees.columns = [
        'Team',  # Added Team column
        'Short Name' , # Added Short Name column
        'Player Name',
        'Age',
        'Nationality',  # Country name
        'Position',
        'Short Position',
        'Market Value',
        'From',  # Team - Country
        'Transfer Fee'

    ]

    print("Arrivals:")
    print(df_arrivees)
else:
    print("Table des arrivées non trouvée.")


Arrivals:
                           Team Short Name  \
0   Espérance Sportive de Tunis        EST   
1   Espérance Sportive de Tunis        EST   
2   Espérance Sportive de Tunis        EST   
3   Espérance Sportive de Tunis        EST   
4   Espérance Sportive de Tunis        EST   
5   Espérance Sportive de Tunis        EST   
6   Espérance Sportive de Tunis        EST   
7   Espérance Sportive de Tunis        EST   
8   Espérance Sportive de Tunis        EST   
9   Espérance Sportive de Tunis        EST   
10  Espérance Sportive de Tunis        EST   
11  Espérance Sportive de Tunis        EST   
12  Espérance Sportive de Tunis        EST   
13  Espérance Sportive de Tunis        EST   
14  Espérance Sportive de Tunis        EST   
15  Espérance Sportive de Tunis        EST   
16  Espérance Sportive de Tunis        EST   
17  Espérance Sportive de Tunis        EST   
18  Espérance Sportive de Tunis        EST   
19  Espérance Sportive de Tunis        EST   
20  Espérance Sportive d

In [5]:
df_arrivees

Unnamed: 0,Team,Short Name,Player Name,Age,Nationality,Position,Short Position,Market Value,From,Transfer Fee
0,Espérance Sportive de Tunis,EST,Youcef BelaïliY. Belaïli,32,Algérie,Ailier gauche,AiG,"1,80 mio. €",MC Alger - Algérie,679 K €
1,Espérance Sportive de Tunis,EST,Abdramane KonatéA. Konaté,18,Côte d'Ivoire,Milieu central,MC,-,FC San Pedro - Côte d'Ivoire,500 K €
2,Espérance Sportive de Tunis,EST,Elias MokwanaE. Mokwana,25,Afrique du Sud,Ailier droit,AiD,750 K €,Sekhukhune - Afrique du Sud,370 K €
3,Espérance Sportive de Tunis,EST,Kebba SoweK. Sowe,18,Gambie,Avant-centre,AC,400 K €,AS Soliman - Gambie,90 K €
4,Espérance Sportive de Tunis,EST,Bechir Ben SaidB. Ben Said,31,Tunisie,Gardien de but,GdB,"1,20 mio. €",US Monastir - Tunisie,Tr. libre
5,Espérance Sportive de Tunis,EST,Larry AzouniL. Azouni,30,Tunisie,Milieu central,MC,450 K €,Al-Faisaly - Tunisie,Tr. libre
6,Espérance Sportive de Tunis,EST,Hamza JelassiH. Jelassi,32,Tunisie,Défenseur central,DC,500 K €,ES Sahel - Tunisie,Tr. libre
7,Espérance Sportive de Tunis,EST,Ayman Ben MohamedA. Ben Mohamed,29,Tunisie,Arrière gauche,ArG,350 K €,EA Guingamp - Tunisie,Tr. libre
8,Espérance Sportive de Tunis,EST,Youssef AbdelliY. Abdelli,25,Tunisie,Avant-centre,AC,450 K €,Sans club - Tunisie,Tr. libre
9,Espérance Sportive de Tunis,EST,Amanallah MjahedA. Mjahed,20,Tunisie,Arrière gauche,ArG,25 K €,Esp. Tunis U21 - Tunisie,-


In [6]:
# Check the number of tables to confirm their count
tables = soup.select('.responsive-table table')
print(f"Found {len(tables)} tables.")

# Try accessing the second table directly
if len(tables) > 1:
    table_departs = tables[1]
    departs_data = extract_table_data(table_departs)
    df_departs = pd.DataFrame(departs_data)

    # Adding team name and short name columns at the beginning
    df_departs.insert(0, 'Team', 'Espérance Sportive de Tunis')
    df_departs.insert(1, 'Short Team Name', 'EST')

    # Renaming columns
    df_departs.columns = [
        'Team',
        'Short Tean Name',
        'Player Name',
        'Age',
        'Nationality',
        'Position',
        'Short Position',
        'Market Value',
        'To',  # Team - Country
        'Transfer Fee'
    ]
    print("\nDepartures:")
    print(df_departs)
else:
    print("Table des départs non trouvée.")


Found 32 tables.

Departures:
                           Team Short Tean Name  \
0   Espérance Sportive de Tunis             EST   
1   Espérance Sportive de Tunis             EST   
2   Espérance Sportive de Tunis             EST   
3   Espérance Sportive de Tunis             EST   
4   Espérance Sportive de Tunis             EST   
5   Espérance Sportive de Tunis             EST   
6   Espérance Sportive de Tunis             EST   
7   Espérance Sportive de Tunis             EST   
8   Espérance Sportive de Tunis             EST   
9   Espérance Sportive de Tunis             EST   
10  Espérance Sportive de Tunis             EST   
11  Espérance Sportive de Tunis             EST   
12  Espérance Sportive de Tunis             EST   
13  Espérance Sportive de Tunis             EST   
14  Espérance Sportive de Tunis             EST   
15  Espérance Sportive de Tunis             EST   
16  Espérance Sportive de Tunis             EST   
17  Espérance Sportive de Tunis             EST   
1

In [7]:
df_departs

Unnamed: 0,Team,Short Tean Name,Player Name,Age,Nationality,Position,Short Position,Market Value,To,Transfer Fee
0,Espérance Sportive de Tunis,EST,Houssam GhachaH. Ghacha,28,Algérie,Ailier droit,AiD,900 K €,USM Alger - Algérie,250 K €
1,Espérance Sportive de Tunis,EST,Mohamed Ali Ben HammoudaM. Ben Hammouda,26,Tunisie,Avant-centre,AC,600 K €,El Mahalla - Tunisie,60 K €
2,Espérance Sportive de Tunis,EST,Aziz AbidAziz Abid,21,Tunisie,Ailier gauche,AiG,150 K €,Olympique Beja - Tunisie,Tr. libre
3,Espérance Sportive de Tunis,EST,Ghaylen ChaalaliG. Chaalali,30,Tunisie,Milieu central,MC,900 K €,Al-Ahli - Tunisie,Tr. libre
4,Espérance Sportive de Tunis,EST,Zied MachmoumZ. Machmoum,31,Tunisie,Arrière droit,ArD,150 K €,US Ben Guerdane - Tunisie,Tr. libre
5,Espérance Sportive de Tunis,EST,Oussema ShiliO. Shili,27,Tunisie,Arrière gauche,ArG,450 K €,Club Africain - Tunisie,Tr. libre
6,Espérance Sportive de Tunis,EST,Moez Ben CherifiaM. Ben Cherifia,33,Tunisie,Gardien de but,GdB,500 K €,Olympique Beja - Tunisie,Tr. libre
7,Espérance Sportive de Tunis,EST,Moemen RahmaniM. Rahmani,25,Tunisie,Ailier gauche,AiG,225 K €,ES Zarzis - Tunisie,Tr. libre
8,Espérance Sportive de Tunis,EST,Mouhib SelmiM. Selmi,21,Tunisie,Avant-centre,AC,50 K €,AS Gabès - Tunisie,Tr. libre
9,Espérance Sportive de Tunis,EST,Ghassen MahersiG. Mahersi,23,Tunisie,Arrière gauche,ArG,250 K €,ES Zarzis - Tunisie,Tr. libre


# collect data for all team ( 16 teams )

In [8]:
import requests
from bs4 import BeautifulSoup
import pandas as pd


In [9]:
# Liste des équipes avec leurs IDs
teams = {
    'EST': '#to-3342',
    'USMO': '#to-9890',
    'CSS': '#to-581',
    'ST': '#to-4812',
    'CA': '#to-819',
    'ESS': '#to-250',
    'OB': '#to-8117',
    'CAB': '#to-12717',
    'EGSG': '#to-18793',
    'UST': '#to-51774',
    'ESM': '#to-39801',
    'ASS': '#to-52128',
    'ESZ': '#to-2205',
    'JSO': '#to-88478',
    'USBG': '#to-30507',
    'ASG': '#to-22812'
}

# URL de la page des transferts
url = 'https://www.transfermarkt.fr/ligue-professionnelle-1/transfers/wettbewerb/TUN1'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, Gecko) Chrome/58.0.3029.110 Safari/537.3'
}

# Faire la requête
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.content, 'html.parser')


In [10]:

# Fonction pour extraire les données d'une table
def extract_table_data(table):
    rows = table.find_all('tr')[1:]  # Ignorer l'en-tête
    data = []
    for row in rows:
        cols = row.find_all('td')
        if len(cols) >= 8:  # Assurer qu'il y a assez de colonnes
            player_name = cols[0].get_text(strip=True)
            age = cols[1].get_text(strip=True)
            nationality = cols[2].find('img')['alt'] if cols[2].find('img') else None
            position = cols[3].get_text(strip=True)
            short_position = cols[4].get_text(strip=True)
            market_value = cols[5].get_text(strip=True)
            from_team_info = cols[6].find('a')
            from_full = f"{cols[7].get_text(strip=True)} - {nationality}" if from_team_info else None
            transfer_fee = cols[8].get_text(strip=True)
            data.append([player_name, age, nationality, position, short_position, market_value, from_full, transfer_fee])
    return data



In [11]:
# Listes pour stocker les données des arrivées et départs
all_arrivals = []
all_departures = []

# Boucle à travers les équipes pour extraire les données
for short_name, team_id in teams.items():
    print(f"\nDonnées pour l'équipe: {short_name}")

    # Extraction des données pour les arrivées
    table_arrivees = soup.select_one(f'.box {team_id} + .responsive-table table:nth-of-type(1)')
    if table_arrivees:
        arrivees_data = extract_table_data(table_arrivees)
        for data in arrivees_data:
            data.insert(0, 'Buy')  # Indique que ce sont des arrivées
            data.insert(1, short_name)  # Ajout du nom de l'équipe
            all_arrivals.append(data)
    else:
        print("Table des arrivées non trouvée.")

    # Extraction des données pour les départs
    tables = soup.select('.responsive-table table')
    if len(tables) > 1:
        table_departs = tables[1]  # Deuxième table pour les départs
        departs_data = extract_table_data(table_departs)
        for data in departs_data:
            data.insert(0, 'Sell')  # Indique que ce sont des départs
            data.insert(1, short_name)  # Ajout du nom de l'équipe
            all_departures.append(data)
    else:
        print("Table des départs non trouvée.")

# Création des DataFrames
df_arrivals = pd.DataFrame(all_arrivals, columns=[
    'Buy / Sell',
    'Team',
    'Player Name',
    'Age',
    'Nationality',
    'Position',
    'Short Position',
    'Market Value',
    'From / To',
    'Transfer Fee'
])

df_departures = pd.DataFrame(all_departures, columns=[
    'Buy / Sell',
    'Team',
    'Player Name',
    'Age',
    'Nationality',
    'Position',
    'Short Position',
    'Market Value',
    'From / To',
    'Transfer Fee'
])




Données pour l'équipe: EST

Données pour l'équipe: USMO

Données pour l'équipe: CSS

Données pour l'équipe: ST

Données pour l'équipe: CA

Données pour l'équipe: ESS

Données pour l'équipe: OB

Données pour l'équipe: CAB

Données pour l'équipe: EGSG

Données pour l'équipe: UST

Données pour l'équipe: ESM

Données pour l'équipe: ASS

Données pour l'équipe: ESZ

Données pour l'équipe: JSO

Données pour l'équipe: USBG

Données pour l'équipe: ASG


In [12]:
# Combiner les DataFrames
df_tun_ligue1_transfer = pd.concat([df_arrivals, df_departures], ignore_index=True)

# Sauvegarder dans un fichier Excel
df_tun_ligue1_transfer.to_excel('tun_ligue1_transfer.xlsx', index=False)

# Affichage des résultats
print("\nDataFrame combiné:")
print(df_tun_ligue1_transfer)


DataFrame combiné:
    Buy / Sell Team                         Player Name Age     Nationality  \
0          Buy  EST            Youcef BelaïliY. Belaïli  32         Algérie   
1          Buy  EST           Abdramane KonatéA. Konaté  18   Côte d'Ivoire   
2          Buy  EST             Elias MokwanaE. Mokwana  25  Afrique du Sud   
3          Buy  EST                   Kebba SoweK. Sowe  18          Gambie   
4          Buy  EST          Bechir Ben SaidB. Ben Said  31         Tunisie   
..         ...  ...                                 ...  ..             ...   
623       Sell  ASG  Mohamed Rayane HamrouniM. Hamrouni  21         Tunisie   
624       Sell  ASG                 André BukiaA. Bukia  29        RD Congo   
625       Sell  ASG                Wael ChaiebW. Chaieb  20         Tunisie   
626       Sell  ASG           Amanallah MjahedA. Mjahed  21         Tunisie   
627       Sell  ASG                   Kebba SoweK. Sowe  18          Gambie   

            Position Short Posi