In [1]:
!pip install google-api-python-client pandas



In [5]:
!pip install isodate


Collecting isodate
  Downloading isodate-0.7.2-py3-none-any.whl.metadata (11 kB)
Downloading isodate-0.7.2-py3-none-any.whl (22 kB)
Installing collected packages: isodate
Successfully installed isodate-0.7.2


In [23]:
from googleapiclient.discovery import build
import pandas as pd
from datetime import datetime
import isodate

# 1️⃣ Configurer l'API
api_key = "AIzaSyBv-is97z465BHqY9WbDh9G47TGy8-1pkM"
youtube = build('youtube', 'v3', developerKey=api_key)

# 2️⃣ Récupérer les catégories YouTube
def get_video_categories(youtube, region_code="FR"):
    request = youtube.videoCategories().list(
        part="snippet",
        regionCode=region_code
    )
    response = request.execute()

    return {item["id"]: item["snippet"]["title"] for item in response["items"]}


categories_fr = get_video_categories(youtube, "FR")

# 3️⃣ Traduction des genres en français
TRADUCTION_GENRES = {
    "Film & Animation": "Cinéma & Animation",
    "Autos & Vehicles": "Automobile",
    "Music": "Musique",
    "Pets & Animals": "Animaux",
    "Sports": "Sport & Fitness",
    "Travel & Events": "Voyage",
    "Gaming": "Jeux vidéo",
    "People & Blogs": "Lifestyle & Blogs",
    "Comedy": "Humour",
    "Entertainment": "Divertissement",
    "News & Politics": "Actualités",
    "Howto & Style": "Cuisine / Mode / Tutoriels",
    "Education": "Éducation",
    "Science & Technology": "Science & Technologie",
    "Nonprofits & Activism": "Associatif"
}

# 4️⃣ Paramètres
pays = ["FR", "US"]
max_videos_par_pays = 500
videos_par_page = 50

videos = []

# 5️⃣ Récupération des vidéos
for region in pays:
    next_page_token = None
    total_videos = 0

    while total_videos < max_videos_par_pays:
        request = youtube.videos().list(
            part="snippet,statistics,contentDetails",
            chart="mostPopular",
            regionCode=region,
            maxResults=min(videos_par_page, max_videos_par_pays - total_videos),
            pageToken=next_page_token
        )
        response = request.execute()

        for item in response.get("items", []):
            snippet = item.get("snippet", {})
            stats = item.get("statistics", {})
            content = item.get("contentDetails", {})

            # Durée
            duration = isodate.parse_duration(content.get("duration", "PT0S"))
            minutes, seconds = divmod(int(duration.total_seconds()), 60)

            # Genre
            category_id = snippet.get("categoryId")
            category_name = categories_fr.get(category_id, "Inconnu")
            category_fr = TRADUCTION_GENRES.get(category_name, category_name)

            # Chaîne / Youtubeur
            channel_name = snippet.get("channelTitle", "Inconnu")
            channel_id = snippet.get("channelId")
            channel_url = f"https://www.youtube.com/channel/{channel_id}"

            videos.append({
                "Titre": snippet.get("title", ""),
                "Description": snippet.get("description", ""),
                "Date de publication": datetime.strptime(
                    snippet.get("publishedAt"),
                    "%Y-%m-%dT%H:%M:%SZ"
                ).strftime("%d/%m/%Y %H:%M"),
                "Durée (min:sec)": f"{minutes}:{seconds:02}",
                "Vues": int(stats.get("viewCount", 0)),
                "Likes": int(stats.get("likeCount", 0)),
                "Commentaires": int(stats.get("commentCount", 0)),
                "Genre": category_fr,
                "Nom de la chaîne": channel_name,
                "Nom du youtubeur": channel_name,
                "Lien de la chaîne": channel_url,
                "Pays": region
            })

            total_videos += 1

        next_page_token = response.get("nextPageToken")
        if not next_page_token:
            break

# 6️⃣ DataFrame final
df = pd.DataFrame(videos)

# 7️⃣ Vérification
print(df.head())
print("Total vidéos :", len(df))
print(df["Genre"].value_counts())


                                               Titre  \
0  RnBoi & Nono La Grinta - AVEC MOI (Clip Officiel)   
1  LES K D'OR Bande Annonce (2026) Jeremy Ferrari...   
2  DÉSOLÉ ON PEUT PAS VOUS SERVIR VOUS ÊTES TROP ...   
3                                  EXO 엑소 'Crown' MV   
4  Bande annonce Les K d’or - Un film de Jérémy F...   

                                         Description Date de publication  \
0  “AVEC MOI” Feat. Nono La Grinta - nouveau sing...    16/01/2026 17:00   
1  ✩ Les Films à VOIR ?  Ils sont ICI ► https://w...    18/01/2026 17:34   
2  On prépare un bon shawarma pour nos clients mê...    18/01/2026 13:00   
3  EXO's 8th album "REVERXE" is out!\nListen and ...    19/01/2026 09:00   
4  LE 11 MARS AU CINÉMA \n\nRéservation pour les ...    18/01/2026 16:49   

  Durée (min:sec)    Vues   Likes  Commentaires               Genre  \
0            2:57  606617   32766          1022             Musique   
1            1:50   15764     453            57  Cinéma & Animat

In [25]:
df.head()

Unnamed: 0,Titre,Description,Date de publication,Durée (min:sec),Vues,Likes,Commentaires,Genre,Nom de la chaîne,Nom du youtubeur,Lien de la chaîne,Pays
0,RnBoi & Nono La Grinta - AVEC MOI (Clip Officiel),“AVEC MOI” Feat. Nono La Grinta - nouveau sing...,16/01/2026 17:00,2:57,606617,32766,1022,Musique,RnBoi,RnBoi,https://www.youtube.com/channel/UCEvTUVFFOBTRv...,FR
1,LES K D'OR Bande Annonce (2026) Jeremy Ferrari...,✩ Les Films à VOIR ? Ils sont ICI ► https://w...,18/01/2026 17:34,1:50,15764,453,57,Cinéma & Animation,FilmsActu,FilmsActu,https://www.youtube.com/channel/UC_i8X3p8oZNai...,FR
2,DÉSOLÉ ON PEUT PAS VOUS SERVIR VOUS ÊTES TROP ...,On prépare un bon shawarma pour nos clients mê...,18/01/2026 13:00,16:21,298278,25193,168,Jeux vidéo,Wankil Studio - Laink et Terracid,Wankil Studio - Laink et Terracid,https://www.youtube.com/channel/UCYGjxo5ifuhnm...,FR
3,EXO 엑소 'Crown' MV,"EXO's 8th album ""REVERXE"" is out!\nListen and ...",19/01/2026 09:00,3:32,869104,213955,31319,Musique,SMTOWN,SMTOWN,https://www.youtube.com/channel/UCEf_Bc-KVd7on...,FR
4,Bande annonce Les K d’or - Un film de Jérémy F...,LE 11 MARS AU CINÉMA \n\nRéservation pour les ...,18/01/2026 16:49,1:30,13328,702,30,Cinéma & Animation,JEREMY FERRARI,JEREMY FERRARI,https://www.youtube.com/channel/UCOeQ-23M6TlRZ...,FR
