# 01 Exploracion YouTube Api

Este notebook se encarga de explorar los datos de YouTube Data API v3
y revisar qué datos tenemos disponible y cómo están estruturados

In [1]:
import sys
print(sys.executable)


/Users/angelgarciachanga/repositorios/publico/youtube-v3-data-pipeline/venv/bin/python


In [2]:
#Sí sale True indica que el archivo .env fue encontrado y cargado con todas las variables que tiene dentro
import os
from dotenv import load_dotenv

load_dotenv()

True

In [3]:
#Recurso - channels - vista rápida
import requests
import os

API_KEY = os.getenv("YOUTUBE_API_KEY")
CHANNEL_ID = os.getenv("YOUTUBE_CHANNEL_ID")

url = "https://www.googleapis.com/youtube/v3/channels"

params = {
    "part": "snippet,statistics,contentDetails",
    "id": CHANNEL_ID,
    "key": API_KEY
}

response = requests.get(url, params=params)
response.raise_for_status()

channel_data = response.json()
channel_data

{'kind': 'youtube#channelListResponse',
 'etag': '273A7uCKMaRcgT9-pEtwVnKWAIQ',
 'pageInfo': {'totalResults': 1, 'resultsPerPage': 5},
 'items': [{'kind': 'youtube#channel',
   'etag': '1AHti4mR2E-qP5XINf2f0lIoplY',
   'id': 'UCUEOHBht8pnQhQvCfIcl-gg',
   'snippet': {'title': 'Angel García',
    'description': 'Hola, me llamo Angel.\nEn este canal encontrarás videos relacionados al análisis de datos y otros pasatiempos. Me gusta grabar lo que aprendo para practicarlo y recordarlo.\n\n',
    'customUrl': '@angelgarciadatablog',
    'publishedAt': '2017-02-10T22:27:16Z',
    'thumbnails': {'default': {'url': 'https://yt3.ggpht.com/wyD9NcUpCMtw3KboShIIPSKxJktXYqUqTvEetNGOqyFZgalklglgAcBNxIssEwNsGXl-GwvXGUY=s88-c-k-c0x00ffffff-no-rj',
      'width': 88,
      'height': 88},
     'medium': {'url': 'https://yt3.ggpht.com/wyD9NcUpCMtw3KboShIIPSKxJktXYqUqTvEetNGOqyFZgalklglgAcBNxIssEwNsGXl-GwvXGUY=s240-c-k-c0x00ffffff-no-rj',
      'width': 240,
      'height': 240},
     'high': {'url': 'http

In [4]:
# Guardar el JSON crudo de channels para analizar los datos
# Solo se guarda una parte para revisión, en la parte de extracción se usará la misma ruta para los datos reales de produccion

import os
import json

# Ruta base donde guardaremos el raw
base_path = "/Users/angelgarciachanga/repositorios/publico/youtube-v3-data-pipeline/data/raw/youtube"

# Asegurar que la carpeta existe
#os.makedirs(base_path, exist_ok=True)

# Ruta final del archivo
output_path = f"{base_path}/channels.json"

# Guardar el JSON crudo de channels
with open(output_path, "w", encoding="utf-8") as f:
    json.dump(channel_data, f, indent=2, ensure_ascii=False)

output_path


'/Users/angelgarciachanga/repositorios/publico/youtube-v3-data-pipeline/data/raw/youtube/channels.json'

In [5]:
#extraer y guardar el ID que es la llave de todos los videos del canal.
uploads_playlist_id = channel_data["items"][0]["contentDetails"]["relatedPlaylists"]["uploads"]
uploads_playlist_id

'UUUEOHBht8pnQhQvCfIcl-gg'

In [6]:
#Recurso - playlistItems - vista rápida
import requests
import os

API_KEY = os.getenv("YOUTUBE_API_KEY")

url = "https://www.googleapis.com/youtube/v3/playlistItems"

params = {
    "part": "snippet,contentDetails",
    "playlistId": uploads_playlist_id,
    "maxResults": 5,   # solo para probar
    "key": API_KEY
}

response = requests.get(url, params=params)
response.raise_for_status()

playlist_items = response.json()
playlist_items




{'kind': 'youtube#playlistItemListResponse',
 'etag': 'fMgAA7HZE9pdCx-FbJgxn191vtw',
 'nextPageToken': 'EAAaHlBUOkNBVWlFREJHTWpVek1UZzFRalZDUVVJNE1FTQ',
 'items': [{'kind': 'youtube#playlistItem',
   'etag': 'Qa5JLQ5STX6xOlxsQ4YFJBY5Be8',
   'id': 'VVVVRU9IQmh0OHBuUWhRdkNmSWNsLWdnLnhCNGVjSWtzSlNZ',
   'snippet': {'publishedAt': '2026-01-24T12:04:21Z',
    'channelId': 'UCUEOHBht8pnQhQvCfIcl-gg',
    'title': '4. Git Push - Actualizar cambios de un repositorio local a remoto',
    'description': '',
    'thumbnails': {'default': {'url': 'https://i.ytimg.com/vi/xB4ecIksJSY/default.jpg',
      'width': 120,
      'height': 90},
     'medium': {'url': 'https://i.ytimg.com/vi/xB4ecIksJSY/mqdefault.jpg',
      'width': 320,
      'height': 180},
     'high': {'url': 'https://i.ytimg.com/vi/xB4ecIksJSY/hqdefault.jpg',
      'width': 480,
      'height': 360},
     'standard': {'url': 'https://i.ytimg.com/vi/xB4ecIksJSY/sddefault.jpg',
      'width': 640,
      'height': 480},
     'maxres': {

In [7]:
# Guardar el JSON crudo de playlist_items para analizar los datos
# Solo se guarda una parte para revisión, en la parte de extracción se usará la misma ruta para los datos reales de produccion

import os
import json

# Ruta base del raw de YouTube
base_path = "/Users/angelgarciachanga/repositorios/publico/youtube-v3-data-pipeline/data/raw/youtube"

# Crear carpetas si no existen
os.makedirs(base_path, exist_ok=True)

# Ruta final del archivo
output_path = f"{base_path}/playlist_items.json"

# Guardar JSON crudo
with open(output_path, "w", encoding="utf-8") as f:
    json.dump(playlist_items, f, indent=2, ensure_ascii=False)

output_path


'/Users/angelgarciachanga/repositorios/publico/youtube-v3-data-pipeline/data/raw/youtube/playlist_items.json'

In [8]:
#Recurso - playlist - vista rápida
import os
import requests

API_KEY = os.getenv("YOUTUBE_API_KEY")
CHANNEL_ID = os.getenv("YOUTUBE_CHANNEL_ID")

url = "https://www.googleapis.com/youtube/v3/playlists"

params = {
    "part": "snippet,contentDetails",
    "channelId": CHANNEL_ID,
    "maxResults": 5,  # vista rápida
    "key": API_KEY
}

response = requests.get(url, params=params)
response.raise_for_status()

playlists = response.json()
playlists


{'kind': 'youtube#playlistListResponse',
 'etag': 'Jif-ZDZm424DdjVBUdOZFbQa8vA',
 'nextPageToken': 'CAUQAA',
 'pageInfo': {'totalResults': 18, 'resultsPerPage': 5},
 'items': [{'kind': 'youtube#playlist',
   'etag': 'acp1V-o0Z_UiNtjEa7kOzWwprYo',
   'id': 'PLV4oS06_KpqbsY_I8iR4HRvb6w3vXUBIM',
   'snippet': {'publishedAt': '2026-01-23T05:43:30.512825Z',
    'channelId': 'UCUEOHBht8pnQhQvCfIcl-gg',
    'title': 'SQL - Repaso',
    'description': '',
    'thumbnails': {'default': {'url': 'https://i.ytimg.com/vi/7bwkNrRpgw0/default.jpg',
      'width': 120,
      'height': 90},
     'medium': {'url': 'https://i.ytimg.com/vi/7bwkNrRpgw0/mqdefault.jpg',
      'width': 320,
      'height': 180},
     'high': {'url': 'https://i.ytimg.com/vi/7bwkNrRpgw0/hqdefault.jpg',
      'width': 480,
      'height': 360},
     'standard': {'url': 'https://i.ytimg.com/vi/7bwkNrRpgw0/sddefault.jpg',
      'width': 640,
      'height': 480},
     'maxres': {'url': 'https://i.ytimg.com/vi/7bwkNrRpgw0/maxresdef

In [9]:
# Guardar el JSON crudo de playlists para analizar los datos
# Solo se guarda una parte para revisión, en la parte de extracción se usará la misma ruta para los datos reales de produccion

import os
import json

# Ruta base del raw de YouTube
base_path = "/Users/angelgarciachanga/repositorios/publico/youtube-v3-data-pipeline/data/raw/youtube"

# Crear carpetas si no existen
os.makedirs(base_path, exist_ok=True)

# Ruta final del archivo
output_path = f"{base_path}/playlists.json"

# Guardar JSON crudo
with open(output_path, "w", encoding="utf-8") as f:
    json.dump(playlists, f, indent=2, ensure_ascii=False)

output_path

'/Users/angelgarciachanga/repositorios/publico/youtube-v3-data-pipeline/data/raw/youtube/playlists.json'

In [10]:
# Extraer videoId desde playlist_items
video_ids = [
    item["contentDetails"]["videoId"]
    for item in playlist_items["items"]
]

video_ids

['xB4ecIksJSY', '7bwkNrRpgw0', 'HDyKUodeuNw', 'Zj6uiqMvFOU', 'RiYjYfMTGvw']

In [11]:
#Recurso - videos - vista rápida
import requests
import os

API_KEY = os.getenv("YOUTUBE_API_KEY")

url = "https://www.googleapis.com/youtube/v3/videos"

params = {
    "part": "snippet,statistics,contentDetails",
    "id": ",".join(video_ids),
    "key": API_KEY
}

response = requests.get(url, params=params)
response.raise_for_status()

videos_data = response.json()
videos_data


{'kind': 'youtube#videoListResponse',
 'etag': 'LNSNeLFRvuM5OmSzqhohEwiWUek',
 'items': [{'kind': 'youtube#video',
   'etag': 'dL4lYlJ2VkOGtPb48WcX0rMiyGE',
   'id': 'xB4ecIksJSY',
   'snippet': {'publishedAt': '2026-01-24T12:04:21Z',
    'channelId': 'UCUEOHBht8pnQhQvCfIcl-gg',
    'title': '4. Git Push - Actualizar cambios de un repositorio local a remoto',
    'description': '',
    'thumbnails': {'default': {'url': 'https://i.ytimg.com/vi/xB4ecIksJSY/default.jpg',
      'width': 120,
      'height': 90},
     'medium': {'url': 'https://i.ytimg.com/vi/xB4ecIksJSY/mqdefault.jpg',
      'width': 320,
      'height': 180},
     'high': {'url': 'https://i.ytimg.com/vi/xB4ecIksJSY/hqdefault.jpg',
      'width': 480,
      'height': 360},
     'standard': {'url': 'https://i.ytimg.com/vi/xB4ecIksJSY/sddefault.jpg',
      'width': 640,
      'height': 480},
     'maxres': {'url': 'https://i.ytimg.com/vi/xB4ecIksJSY/maxresdefault.jpg',
      'width': 1280,
      'height': 720}},
    'channel

In [12]:
# Guardar el JSON crudo de videos para analizar los datos

import os
import json

# Ruta base del raw de YouTube
base_path = "/Users/angelgarciachanga/repositorios/publico/youtube-v3-data-pipeline/data/raw/youtube"

# Crear carpetas si no existen
os.makedirs(base_path, exist_ok=True)

# Ruta final del archivo
output_path = f"{base_path}/videos.json"

# Guardar JSON crudo
with open(output_path, "w", encoding="utf-8") as f:
    json.dump(videos_data, f, indent=2, ensure_ascii=False)

output_path

'/Users/angelgarciachanga/repositorios/publico/youtube-v3-data-pipeline/data/raw/youtube/videos.json'