# Finale

In [4]:
import requests
from bs4 import BeautifulSoup
import csv
import chardet
import os
import time

HEADERS = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) "
                  "AppleWebKit/537.36 (KHTML, like Gecko) "
                  "Chrome/120.0.0.0 Safari/537.36"
}


def get_club_names(url):
    """R√©cup√®re la liste des clubs d‚Äôun championnat √† partir de Transfermarkt."""
    response = requests.get(url, headers=HEADERS)
    if response.status_code != 200:
        print(f"‚ùå Erreur {response.status_code} pour {url}")
        return []

    soup = BeautifulSoup(response.text, "html.parser")
    table = soup.find("table", class_="items")
    if not table:
        print(f"‚ö†Ô∏è Tableau introuvable pour {url}")
        return []

    clubs = []
    rows = table.find("tbody").find_all("tr")
    for row in rows:
        cols = row.find_all("td")
        if len(cols) >= 3:
            team = cols[1].get_text(strip=True)
            clubs.append(team)
    return clubs


def save_to_csv(clubs, filename="clubs.csv"):
    """Sauvegarde les clubs dans un fichier CSV."""
    os.makedirs(os.path.dirname(filename), exist_ok=True)
    with open(filename, "w", newline="", encoding="utf-8") as f:
        writer = csv.writer(f)
        writer.writerow(["Championnat", "Club"])
        for championnat, club in clubs:
            writer.writerow([championnat, club])
    print(f"\nüíæ {len(clubs)} clubs sauvegard√©s dans {os.path.abspath(filename)}")


def lire_championnats_csv(fichier_csv):
    """Lit la liste des championnats depuis le CSV d‚Äôentr√©e."""
    with open(fichier_csv, "rb") as f:
        encodage = chardet.detect(f.read())["encoding"]
    with open(fichier_csv, "r", encoding=encodage) as f:
        reader = csv.reader(f)
        next(reader)  # ignorer l‚Äôen-t√™te
        for row in reader:
            if len(row) >= 3 and row[2].startswith("https"):
                yield row[0].strip(), row[2].strip()


def main():
    all_clubs = []
    fichier_csv = "../championnat/championnat_finale.csv"
    sortie = "clubs/clubs.csv"

    print("üöÄ D√©but du scraping des championnats...\n")

    for championnat, lien in lire_championnats_csv(fichier_csv):
        print(f"üîÑ Traitement en cours : {championnat}")
        clubs = get_club_names(lien)
        if clubs:
            for club in clubs:
                all_clubs.append((championnat, club))
            print(f"‚úÖ {len(clubs)} clubs trouv√©s pour {championnat}\n")
        else:
            print(f"‚ö†Ô∏è Aucun club trouv√© pour {championnat}\n")
        time.sleep(1.5)  # petite pause pour √©viter le blocage par Transfermarkt

    if all_clubs:
        save_to_csv(all_clubs, sortie)
    else:
        print("‚ùå Aucun club r√©cup√©r√©.")

    print("\nüèÅ Fin du programme.")


if __name__ == "__main__":
    main()


üöÄ D√©but du scraping des championnats...

üîÑ Traitement en cours : 1
‚úÖ 20 clubs trouv√©s pour 1

üîÑ Traitement en cours : 2
‚úÖ 20 clubs trouv√©s pour 2

üîÑ Traitement en cours : 3
‚úÖ 20 clubs trouv√©s pour 3

üîÑ Traitement en cours : 4
‚úÖ 18 clubs trouv√©s pour 4

üîÑ Traitement en cours : 5
‚úÖ 18 clubs trouv√©s pour 5

üîÑ Traitement en cours : 7
‚úÖ 24 clubs trouv√©s pour 7

üîÑ Traitement en cours : 6
‚úÖ 20 clubs trouv√©s pour 6

üîÑ Traitement en cours : 8
‚úÖ 18 clubs trouv√©s pour 8

üîÑ Traitement en cours : 11
‚úÖ 30 clubs trouv√©s pour 11

üîÑ Traitement en cours : 10
‚úÖ 18 clubs trouv√©s pour 10

üîÑ Traitement en cours : 9
‚úÖ 18 clubs trouv√©s pour 9

üîÑ Traitement en cours : 12
‚úÖ 18 clubs trouv√©s pour 12

üîÑ Traitement en cours : 13
‚úÖ 16 clubs trouv√©s pour 13

üîÑ Traitement en cours : 14
‚úÖ 30 clubs trouv√©s pour 14

üîÑ Traitement en cours : 15
‚úÖ 30 clubs trouv√©s pour 15

üîÑ Traitement en cours : 16
‚úÖ 16 clubs trouv√©s pour 1