# Utilisation de l'API Youtube pour rechercher des vid√©os

## Cr√©ation d'un projet sur Google Cloud Console

**Pour utiliser, la YouTube Data API v3 qui nous servira par la suite, il est n√©cessaire de cr√©er un projet sur Google Cloud Console.**

Etape 1 : Cr√©er un projet sur Google Cloud Console
-Aller sur [la Google Cloud Console](https://console.cloud.google.com).
-Cr√©er un nouveau projet en cliquant sur "Select a project" puis "New Project".
-Donner un nom √† votre projet et cliquer sur "Create".

Etape 2 : Activer l'API YouTube Data
-Aller dans le "API & Services" > "Library" dans la Google Cloud Console.
-Chercher YouTube Data API v3 et cliquez dessus.
-Cliquer sur "Enable" pour activer l'API.

Etape 3 : Cr√©er des identifiants pour l'API
- Aller dans "API & Services" > "Credentials".
- Cliquer sur "Create Credentials" et choisir "API key".
- L'API key g√©n√©r√©e appara√Ætra. Copier cette cl√©, vous en aurez besoin pour effectuer des requ√™tes.

**On cherche √† obtenir les sous-titres, titres et descriptions des vid√©os youtube sur des livres publi√©s en 2023**

In [None]:
import requests

# Remplacer key par sa propre cl√© API (voir ## 0 Creation d'un projet sur Google Cloud Console)

# Fonction python pour rechercher des vid√©os sur YouTube concernant des livres publi√©s en 2023
def get_videos(query, key):
    url = f'https://www.googleapis.com/youtube/v3/search?part=snippet&q={query}&type=video&key={key}'
    # part=snippet : r√©cup√©ration des informations de base sur la vid√©o (titre, description, etc.)  
    # q=nouveaut√©+livre+2023 : recherche avec des mots-cl√©s  
    # type=video : r√©cup√©ration uniquement de vid√©os (pas de playlists ou de cha√Ænes)  
    # key= Renseignement de la cl√© API  
    response = requests.get(url) # Requ√™te recherchant des vid√©os sur YouTube concernant des livres publi√©s en 2023
    return response.json()

# La r√©ponse de l'API contient des informations sur les vid√©os comme :  
# videoId : L'ID de la vid√©o qui peut √™tre utilis√© pour r√©cup√©rer les sous-titres et d'autres informations  
# title : Le titre de la vid√©o  
# description : La description de la vid√©o  

# Fonction python pour lister les sous-titres
def get_captions(video_id, key):
    url = f'https://www.googleapis.com/youtube/v3/captions?videoId={video_id}&key={key}'
    response = requests.get(url) # Requ√™te listant les sous-titres
    return response.json()

# Si des sous-titres existent pour une vid√©o,on peut ensuite r√©cup√©rer le contenu en utilisant l'ID du sous-titre.

# Fonction python pour r√©cup√©rer le texte des sous-titres
def get_captionstext(caption_id, key):
    url = f'https://www.googleapis.com/youtube/v3/captions/{caption_id}?key={key}'
    response = requests.get(url) # Requ√™te listant les textes des sous-titres
    return response.json()

# La requ√™te n'est pas utilisable, on obtient un message d'erreur:
# 'code': 401, 'message': 'API keys are not supported by this API. Expected OAuth2 access token or other authentication credentials that assert a principal.
# Il nous manque une autorisation

# Recherche des vid√©os sur YouTube concernant des livres publi√©s en 2023
query = "nouveaut√© livre 2023"
videos = get_videos(query, key)

for video in videos['items']: # Pour chaque vid√©o obtenue gr√¢ce √† la requ√™te,
    video_id = video['id']['videoId'] # on r√©cup√®re l'identifiant de la vid√©o
    title = video['snippet']['title'] # on r√©cup√®re le titre de la vid√©o
    description = video['snippet']['description'] # on r√©cup√®re la description de la vid√©o
    print(f"Titre: {title}\nDescription: {description}\n") # on renvoie le titre et la description

    # R√©cup√©rer les sous-titres si disponibles
    # captions = get_captions(video_id, key)
    # if 'items' in captions: # S'il y a des sous-titres √† la vid√©o,
        # for caption in captions['items']:
            # caption_id = caption['id'] # on r√©cup√®re l'identifiant des sous-titres
            # captiontext = get_captionstext(caption_id, key)
            # print(f"Sous-titres disponibles: {captiontext}\n") # on renvoie l'identifiant
    # else: # Sinon
        # print("Pas de sous-titres disponibles.") # on renvoie le message : "Pas de sous-titres disponibles"


Titre: Mon nouveau livre est sorti ! - Patrick Sardais
Description: Merci d'avoir regard√© cette video. N'h√©sitez pas √† me rejoindre sur TikTok : Patrick.Sardais Retrouvez mon livre sur Amazon ...

Titre: Le nouveau livre de Nicolas Sarkozy : &quot;Il sort la sulfateuse&quot;
Description: Le nouveau livre de Nicolas #Sarkozy : "Il sort la sulfateuse", selon Thomas Despr√© dans #RTLMatin avec Isabelle Choquet.

Titre: D√©couvrez Le Livre de Nathan, le nouveau roman de Nicolas Cartelet
Description: Le 7 juin, le nouveau roman de Nicolas Cartelet, Le Livre de Nathan, arrive en librairie ! D√©couvrez le destin improbable du ...

Titre: NOUVEAUT√â HAPPY 30 ‚ô•Ô∏è LIVRE-COACH üëå MON LIVRE PR√âF√âR√â DE 2023
Description: Dipl√¥m√©e en coaching sportif, je suis passionn√©e par la psychologie alimentaire, la chronobiologie, la physiologie et toutes ...

Titre: TOP &amp; FLOP DE L&#39;ANN√âE 2024 : c&#39;est l&#39;heure de faire le bilan ! üìö‚ù§Ô∏èüëé
Description: Hello tout le monde ! 20

**La requ√™te get_captionstext(caption_id, key) n'est pas utilisable**, on obtient un message d'erreur:  
 'code': 401, 'message': 'API keys are not supported by this API. Expected OAuth2 access token or other authentication credentials that assert a principal.  
Il nous manque une autorisation, on va donc essayer de les obtenir √† l'aide d'une autre m√©thode **(voir Sous_titres_youtube.ipynb)**

**Essayons d'obtenir plus que 5 r√©sultats de livres**

*On cherche aussi √† r√©cup√©rer les dates de publications √† titre informatif*

In [None]:
import pandas as pd
import requests

# Remplacez key par sa propre cl√© API (voir ## 0 Creation d'un projet sur Google Cloud Console)

# Fonction pour r√©cup√©rer les vid√©os
def get_videos(query, key, max_results=50):
    url = f'https://www.googleapis.com/youtube/v3/search?part=snippet&q={query}&type=video&maxResults={max_results}&key={key}'
    response = requests.get(url)  # Requ√™te pour rechercher des vid√©os
    data = response.json()

    videos = []
    for video in data['items']:
        video_info = {
            'video_id': video['id']['videoId'],
            'title': video['snippet']['title'],
            'description': video['snippet']['description'],
            'published_at': video['snippet']['publishedAt'],
            'channel_title': video['snippet']['channelTitle']
        }
        videos.append(video_info)

    # R√©cup√©rer les pages suivantes si n√©cessaire
    next_page_token = data.get('nextPageToken')
    while next_page_token:
        url = f'https://www.googleapis.com/youtube/v3/search?part=snippet&q={query}&type=video&maxResults={max_results}&pageToken={next_page_token}&key={key}'
        response = requests.get(url)
        data = response.json()
        for video in data['items']:
            video_info = {
                'video_id': video['id']['videoId'],
                'title': video['snippet']['title'],
                'description': video['snippet']['description'],
                'published_at': video['snippet']['publishedAt'],
                'channel_title': video['snippet']['channelTitle']
            }
            videos.append(video_info)
        next_page_token = data.get('nextPageToken')

    return videos

# Appel de la fonction pour r√©cup√©rer les vid√©os
query = "nouveaut√© livre 2023"
videos = get_videos(query, key, max_results=50)

# Convertir les donn√©es en DataFrame
df = pd.DataFrame(videos)

# Sauvegarder le DataFrame sous forme de fichier CSV
df.to_csv('youtube_nouveaut√©_livre_2023.csv', index=False)

print("Le fichier CSV a √©t√© cr√©√© avec succ√®s !")

Le fichier CSV a √©t√© cr√©√© avec succ√®s !


**On cherche √† obtenir les dates de publication, titres et descriptions des vid√©os youtube publi√©es entre 2019 et 2023 sur des livres**

In [None]:
import pandas as pd
import requests

# Remplacez key par sa propre cl√© API

# Fonction pour r√©cup√©rer les vid√©os avec des dates sp√©cifiques
def get_videos(query, key, start_date="2019-01-01T00:00:00Z", end_date="2023-12-31T23:59:59Z", max_results=50):
    url = f'https://www.googleapis.com/youtube/v3/search?part=snippet&q={query}&type=video&maxResults={max_results}&publishedAfter={start_date}&publishedBefore={end_date}&key={key}'
    response = requests.get(url)  # Requ√™te pour rechercher des vid√©os
    data = response.json()

    videos = []
    for video in data['items']:
        video_info = {
            'video_id': video['id']['videoId'],
            'title': video['snippet']['title'],
            'description': video['snippet']['description'],
            'published_at': video['snippet']['publishedAt'],
            'channel_title': video['snippet']['channelTitle']
        }	
        videos.append(video_info)

    # R√©cup√©rer les pages suivantes si n√©cessaire
    next_page_token = data.get('nextPageToken')
    while next_page_token:
        url = f'https://www.googleapis.com/youtube/v3/search?part=snippet&q={query}&type=video&maxResults={max_results}&pageToken={next_page_token}&publishedAfter={start_date}&publishedBefore={end_date}&key={key}'
        response = requests.get(url)
        data = response.json()
        for video in data['items']:
            video_info = {
                'video_id': video['id']['videoId'],
                'title': video['snippet']['title'],
                'description': video['snippet']['description'],
                'published_at': video['snippet']['publishedAt'],
                'channel_title': video['snippet']['channelTitle']
            }
            videos.append(video_info)
        next_page_token = data.get('nextPageToken')

    return videos

# Appel de la fonction pour r√©cup√©rer les vid√©os entre 2019 et 2023
query = "livre"
videos = get_videos(query, key, start_date="2019-01-01T00:00:00Z", end_date="2023-12-31T23:59:59Z", max_results=50)

# Convertir les donn√©es en DataFrame
df = pd.DataFrame(videos)

# Sauvegarder le DataFrame sous forme de fichier CSV
df.to_csv('youtube_livre_2019_2023.csv', index=False)

print("Le fichier CSV a √©t√© cr√©√© avec succ√®s !")

Le fichier CSV a √©t√© cr√©√© avec succ√®s !
