# "Script" baseado na Youtube Data API, visando retornar as estatísticas públicas de um canal e dados dos últimos vídeos publicados no canal

## Configuração do notebook

In [1]:
# Conexão do Colab ao Google Drive (arquivos)

from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [2]:
# Instalação das bibliotecas e módulos pyhton para uso das APIs dos produtos Google

!pip install --upgrade google-api-python-client google-auth-httplib2 google-auth-oauthlib

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting google-api-python-client
  Downloading google_api_python_client-2.85.0-py2.py3-none-any.whl (11.2 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m11.2/11.2 MB[0m [31m68.2 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: google-api-python-client
  Attempting uninstall: google-api-python-client
    Found existing installation: google-api-python-client 2.84.0
    Uninstalling google-api-python-client-2.84.0:
      Successfully uninstalled google-api-python-client-2.84.0
Successfully installed google-api-python-client-2.85.0


In [3]:
# Importação das bibliotecas e módulos necessários à extração e manipulação dos dados

import pandas as pd
import googleapiclient.discovery
from googleapiclient.discovery import build

## Autenticação na API 

In [4]:
# Credenciais de autenticação

api_service_name = "youtube"
api_version = "v3"
# A Youtube Data API é bastante robusta
# Para entender o script, leia a documentação
# Disponível em: https://developers.google.com/youtube/v3/docs?hl=pt-br

# Fornecida no projeto criado via Google Cloud Console
developer_key = # '<INSERT>' 


# Parâmetro da requsição
id_canal = 'UCC1QUJZGfqrSGwwYXvZhqig' # (@IsabelaBoscov)


In [5]:
# Variável de chamada à API
youtube = googleapiclient.discovery.build(
    api_service_name, api_version, developerKey=developer_key)

## Requisições e manipulação dos resultados

In [6]:
def stats_canal(youtube, id_canal):
    """
    Função para obter uma visão geral do canal, 
    tomando como parâmetros a variável de chamada a 
    API e o id do canal de interesse
    """
    
    request = youtube.channels().list(
        part='snippet,contentDetails,statistics',
        id=id_canal
    )
    response = request.execute()
    
    return response['items']

In [7]:
# Chamada à função
estatisticas_canal = stats_canal(youtube, id_canal)

In [8]:
# Exibição das estatísticas do canal
estatisticas_canal[0]['statistics']

{'viewCount': '41358128',
 'subscriberCount': '664000',
 'hiddenSubscriberCount': False,
 'videoCount': '510'}

In [9]:
# Obtenção do id de todas as playlists públicas do canal
playlist_id = estatisticas_canal[0]['contentDetails']

# Exibição dos ids de cada playlist
playlist_id

{'relatedPlaylists': {'likes': '', 'uploads': 'UUC1QUJZGfqrSGwwYXvZhqig'}}

In [10]:
# Obtenção do id da playlist de uploads 
upload_id = estatisticas_canal[0]['contentDetails']['relatedPlaylists']['uploads']

# Exibição do id da playlist
upload_id

'UUC1QUJZGfqrSGwwYXvZhqig'

In [11]:
def lista_uploads(youtube, upload_id):
    """
    Função para obter e armazenar todos os ids dos vídeos presentes na 
    playlist de upload do canal
    """

    # Lista vazia para armazenar ids
    lista_videos = []
    # Requisição 
    request = youtube.playlistItems().list(
        part="snippet,contentDetails",
        playlistId=upload_id,
        maxResults=50
    )
    # Uso de paginação de resultados
    next_page = True
    while next_page:
        response = request.execute()
        data = response['items']

        for video in data:
            video_id = video['contentDetails']['videoId']
            if video_id not in lista_videos:
                # Caso id do vídeo não esteja na lista, inserí-lo
                lista_videos.append(video_id)

        
        if 'nextPageToken' in response.keys():
            next_page = True
            request = youtube.playlistItems().list(
                part="snippet,contentDetails",
                playlistId=upload_id,
                pageToken=response['nextPageToken'],
                maxResults=50
            )
        else:
            # Caso não exista mais itens resultantes...
            next_page = False

    
    return lista_videos

In [12]:
# Chamada à função
video_lista = lista_uploads(youtube, upload_id)

# Exibição dos resultados
video_lista

['Daf4OYdiBOs',
 'sWHp6DqiWt0',
 'rXNXFsex8ro',
 'fPmYUJ5lTHY',
 'o1z2I_cE3xc',
 'Mbaycjcg5hk',
 'sv2b3vMELx8',
 'DI1Nh_HZe4Y',
 'bJuHwdMTTG4',
 'Jc7LLrw1FBg',
 '-yIvI0dxRRE',
 'soOl2eudEBE',
 'SwXB5xjReAo',
 '6pJFvCrlMRI',
 'QFx-D45bQE0',
 'daUBGH9XISQ',
 '-KE126zNnSw',
 'tsAAlDxe_Us',
 'GYznoetSGzA',
 'HiH34RT5Giw',
 'CESJUtyhyik',
 'EqCW20bdMnI',
 'kLa4Yu7FEwg',
 'vNiptUg78OY',
 'EPBAganvUnk',
 'vlplEAMfkCw',
 'KzYzCrnBzLQ',
 'ws2kxuCA8kY',
 '6HZ0_hl_JNc',
 'WT9vCYXLcY0',
 'FnIBCmNNkIg',
 'ahd1wBy_sFs',
 'GWiC7t5Akk0',
 'k5zTDcQn75I',
 'Y7YcmwRLtPw',
 'CBofTZV-YMc',
 'kdmv6bBBJ1A',
 'rbkUt3LuZts',
 '2OJ4paVGc3o',
 'tpG7W4aUm5I',
 'lSVessGJ8FU',
 'AV7DQ854f6g',
 '68-jMcGsV0M',
 'hO8UjKwY4ug',
 'DJZq7relLKk',
 'NOB_T-Ug06U',
 'cYRdD_1PG_A',
 'OvhC4eoZHCA',
 '9XsPXpYnN2c',
 '51Qtjqr7tBc',
 '0CrBq8s7mPg',
 'Clipn23waEM',
 '2pTpFfmym_c',
 'UM5N0VZeXPg',
 'vCjVRqjZP5s',
 'emsK8M8XAs4',
 '1ujYkrnSLfo',
 'eNxmj_8YeWY',
 'JqUG3nl3fog',
 'z7lSBx7B7wQ',
 '3xW_bqDb2VU',
 'vWVXEF81EGE',
 'skDiLL

In [13]:
def dados_videos(youtube, video_lista):
    """
    Função para pegar os dados públicos dos últimos vídeos 
    pulicados no canal
    """ 

    # Inicialização de lista vazia para guardar resultados
    stats_videos=[]

    
    for i in range(0, len(video_lista), 50):
        request= youtube.videos().list(
            part="snippet,contentDetails,statistics",
            id=video_lista[i:i+50]
        )

        data = request.execute()
        for video in data['items']:
            # Armazenar os dados em memória
            id=video['id']
            kind=video['kind']
            title=video['snippet']['title']
            published=video['snippet']['publishedAt']
            description=video['snippet']['description']
            duration=video['contentDetails']['duration']
            view_count=video['statistics'].get('viewCount',0)
            like_count=video['statistics'].get('likeCount',0)
            dislike_count=video['statistics'].get('dislikeCount',0)
            comment_count=video['statistics'].get('commentCount',0)

            # Converter conjunto de lista em dicionário
            stats_dict=dict(id=id, kind=kind, title=title, description=description, published=published, duration=duration, view_count=view_count, like_count=like_count, dislike_count=dislike_count, comment_count=comment_count)
            
            # Incluir dicionário na lista vazia iniciada após a declaração da função
            stats_videos.append(stats_dict)

    return stats_videos

In [14]:
# Chamada à função
videos_dados = dados_videos(youtube, video_lista)

# Visualização dos resultados
videos_dados

[{'id': 'Daf4OYdiBOs',
  'kind': 'youtube#video',
  'title': '"Succession" refaz a arte da tragédia',
  'description': 'Análise do três primeiros episódio da quarta temporada da série da HBO "Succession", criada por Jesse Armstrong, com Brian Cox, Jeremy Strong, Sarah Snook, Kieran Culkin, Alan Ruck, Matthew Macfadyen, Nicholas Braun, Zoe Winters, J. Smith-Cameron\n\nVisite as minhas redes sociais e o meu blog para ver críticas e dicas de filmes e séries.\nInstagram: https://www.instagram.com/realisabelaboscov/\nTikTok: https://www.tiktok.com/@isabelaboscov\nFacebook: https://www.facebook.com/isaboscov/videos\nTwitter: https://twitter.com/BoscovIsabela\nBlog: https://www.isabelaboscov.com',
  'published': '2023-04-12T18:28:42Z',
  'duration': 'PT16M51S',
  'view_count': '5702',
  'like_count': '2192',
  'dislike_count': 0,
  'comment_count': '141'},
 {'id': 'sWHp6DqiWt0',
  'kind': 'youtube#video',
  'title': '"Treta/Beef", na Netflix: nem te conheço, já te odeio',
  'description': 'Cr

In [15]:
# Transformação da estrutura de dados em dataframe
df=pd.DataFrame(videos_dados)

In [16]:
# Visualização do dataframe
df

Unnamed: 0,id,kind,title,description,published,duration,view_count,like_count,dislike_count,comment_count
0,Daf4OYdiBOs,youtube#video,"""Succession"" refaz a arte da tragédia",Análise do três primeiros episódio da quarta t...,2023-04-12T18:28:42Z,PT16M51S,5702,2192,0,141
1,sWHp6DqiWt0,youtube#video,"""Treta/Beef"", na Netflix: nem te conheço, já t...","Crítica da série ""Treta (Beef)"", que está na N...",2023-04-11T17:00:27Z,PT8M33S,44752,8456,0,279
2,rXNXFsex8ro,youtube#video,"""Super Mario Bros. – O Filme"" é fofo e acelerado","Crítica do filme ""Super Mario Bros. - O Filme ...",2023-04-06T20:46:22Z,PT7M39S,106449,20611,0,558
3,fPmYUJ5lTHY,youtube#video,"Em ""A Lição / The Glory"", na Netflix, a vingan...",Crítica da segunda temporada da série coreana ...,2023-04-04T19:45:50Z,PT7M8S,87455,16893,0,740
4,o1z2I_cE3xc,youtube#video,"""Cidade Invisível 2"" vai à fonte na Amazônia",Crítica da segunda temporada da série brasilei...,2023-04-01T21:39:33Z,PT8M27S,84086,16385,0,557
...,...,...,...,...,...,...,...,...,...,...
505,LYmbrIPl8lo,youtube#video,Crítica: Ruth & Alex,Visite o meu blog: http://isabelaboscov.com.br...,2015-11-06T20:08:32Z,PT2M20S,3381,178,0,21
506,qPUn707w7Es,youtube#video,Crítica: 007 Contra SPECTRE,Visite o meu blog: http://isabelaboscov.com.br...,2015-11-05T21:58:44Z,PT4M11S,10726,647,0,67
507,uHqUij3ON8g,youtube#video,Crítica: Os 33,Visite o meu blog: http://isabelaboscov.com.br...,2015-10-30T05:51:07Z,PT1M54S,4545,314,0,29
508,AFZzVc4G-ic,youtube#video,Crítica: O Último Caçador de Bruxas,Visite o meu blog: http://isabelaboscov.com.br...,2015-10-29T22:45:14Z,PT2M10S,7475,503,0,43


In [17]:
# Salvar dataframe como csv no Drive
df.to_csv(r'/content/drive/MyDrive/SCRIPTS/yb_data.csv')