
# Análisis de Películas y Plataformas de Streaming con TMDb API

### Creado por Alejandro Pérez y Yusmany Rejopachi

## Tabla de Contenidos

<ul>
  <li><a href="#intro">1. Introducción</a></li>
  <li><a href="#metodologia">2. Metodología</a></li>
  <li><a href="#wrangling">3. Extracción de Datos</a></li>
    <ul>
      <li><a href="#estructuraproyecto">3.1 Estructura del Proyecto</a>
      <li><a href="#muestra-json">3.2 Muestra de JSON</a></li>
    </ul>
  </li>
  <li><a href="#transformacionpreparaciondatos">4. Transformación y Preparación de Datos</a></li>
  <li><a href="#analisisdatosresultados">5. Análisis de Datos y Resultados</a>
    <ul>
      <li><a href="#genero-casting">5.1 Distribución de protagonistas por género</a></li>
      <li><a href="#generos-semana">5.2 Géneros más populares de la semana</a></li>
      <li><a href="#peliculas-populares">5.3 Películas más populares y su disponibilidad</a></li>
      <li><a href="#streaming-popular">5.4 Plataforma de streaming más popular</a></li>
    </ul>
  </li>
  <li><a href="#vis">6. Visualización</a></li>
  <li><a href="#extrprepdat">7. Extracción y Preparación de Datos</a>
    <ul>
      <li><a href="#estructura-json">7.1 Estructura del archivo peliculas_streaming.json</a></li>
    </ul>
  </li>
  <li><a href="#strucdatosexpini">8. Estructura de Datos y Exploración Inicial</a></li>
  <li><a href="#visres">9. Visualización de Resultados</a></li>
  <li><a href="#conclusiones">10. Conclusiones</a></li>
  <li><a href="#referencias">11. Referencias</a></li>
</ul>


<a id='intro'></a>
## 1. Introducción

El crecimiento de las plataformas de streaming ha transformado la manera en que las personas consumen contenido audiovisual en todo el mundo. Servicios como Netflix, Amazon Prime Video, Disney Plus y otros han diversificado sus catálogos y expandido su cobertura regional, generando una competencia directa por la atención de las audiencias. En este contexto, comprender qué tipos de contenido son más populares, en qué plataformas se encuentran disponibles y cómo se distribuyen los géneros cinematográficos se convierte en una herramienta estratégica tanto para usuarios, como para productores y distribuidores.

Este proyecto tiene como objetivo principal analizar un conjunto de datos extraído desde la API de The Movie Database (TMDb), con el fin de identificar patrones de consumo, distribución de películas por género, servicios más relevantes y tendencias semanales. El análisis se centra en una muestra de aproximadamente 10,000 películas populares que presentan disponibilidad en plataformas de streaming, permitiendo una visión general del ecosistema actual del entretenimiento digital.

Para lograr este propósito, se desarrolló un sistema automatizado en Python que se conecta a la API de TMDb, extrae la información de interés, la transforma y filtra, y finalmente genera una serie de visualizaciones que respaldan los hallazgos. Entre los aspectos explorados se encuentran: la distribución de protagonistas por género, los géneros más populares de la semana, los servicios de streaming con mayor cantidad de títulos destacados, y la relación entre calificaciones y disponibilidad.

La documentación que aquí se presenta detalla cada una de las etapas del proceso, incluyendo la preparación de datos, análisis exploratorio y visualizaciones generadas, con el propósito de ofrecer una perspectiva clara, visual y argumentada de los resultados obtenidos.


<a id='metodologia'></a>
## 2. Metodología

Para abordar el análisis de contenido disponible en plataformas de streaming, se siguió una metodología estructurada compuesta por cuatro fases principales: extracción, transformación, análisis y visualización de datos. A continuación, se describen cada una de estas etapas, junto con las herramientas utilizadas en el desarrollo del proyecto.

El conjunto de datos que se analizará en este informe es el de películas de TMDB, que contiene información sobre 10,000 películas de The Movie Database (TMDB). La información incluye datos básicos sobre las películas como el título, género y fecha de estreno, así como otras estadísticas relevantes como popularidad, valoración y votos. En este informe, el proceso de análisis de datos se utilizará para responder las siguientes preguntas:
- ¿Qué tipo de propiedades están asociadas con películas que tienen altos ingresos?
- ¿Qué géneros son más populares de año a año?
- ¿Cuáles son los géneros más vistos en plataformas de streaming?
- ¿Cuáles son las películas más vistas por semana y su posición en el ranking?
- ¿Qué géneros y películas tienen mayor índice de popularidad?
- ¿Cuáles son las películas con mayor calificación de los usuarios?


Este informe utilizará diversas bibliotecas de Python, incluyendo NumPy, Pandas y Matplotlib
para el análisis y visualización de datos; así como Requests, JSON, OS, Time y Datetime
para la obtención y manejo de información desde la API de TMDb.
A continuación se muestran las declaraciones de importación correspondientes:

In [None]:
# Herramientas utilizadas:
# Proyecto desarrollado en Python 3.10.
# Documentacion en Jupyter Notebook.
# Bibliotecas como numpy, pandas y matplotlib para análisis y visualización de datos.
# También se usan requests, json, os, time y datetime para manejo de peticiones, archivos y fechas.

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
import requests, json, os, time
from datetime import datetime


<a id='wrangling'></a>
## 3. Extracción de Datos

La recolección de datos se realizó mediante la API pública de The Movie Database (TMDb), que ofrece acceso a información detallada sobre películas, series, géneros, actores y servicios de distribución.
Se utilizó el endpoint trending/movie/week para obtener las películas más populares de la semana, combinando la solicitud con parámetros de idioma y región. La autenticación se realizó mediante token de acceso tipo Bearer.

Para obtener una muestra suficientemente representativa, se implementó un sistema de paginación que recorrió cientos de páginas de resultados, alcanzando cerca de 10,000 películas únicas. Posteriormente, se filtraron aquellas que no estaban disponibles en servicios de streaming mediante el endpoint watch/providers, conservando solo las relevantes para el objetivo del proyecto.


<a id='estructuraproyecto'></a>
### 3.1 Estructura del Proyecto

```plaintext
Big-Data-Proyecto-main/
│
├── documentacion/
│   ├── Documentacion.ipynb
│   └── tmdb-movie-dataset-analysis.ipynb
│
├── estadisticas/
│   ├── genero_casting.py
│   ├── genero_popular.py
│   ├── pelicula_popular.py
│   └── servicio_popular.py
│
├── filtros/
│   ├── crear_json_database.py
│   ├── filtro_servicio.py
│   ├── obtener_genero.py
│   ├── obtener_sexo.py
│   └── obtenerservicio.py
│
├── graficas/
│   ├── genero_casting.png
│   ├── generos_populares.png
│   ├── peliculas_con_streaming.png
│   └── proveedor_popular.png
│
├── movie_data/
│   ├── peliculas_streaming.json
│   └── generos.json
│
├── tests/
│   └── test_calculations.py
│
├── requirements.txt
├── dev-requirements.txt
└── README.md
```

<a id='muestra-json'></a>
### 3.2 Muestra de JSON

```json
{
  "metadata": {
    "total_movies": 9998,
    "pages_processed": 500,
    "start_timestamp": "20250403_185327",
    "end_timestamp": "20250403_190527"
  },
  "results": [
    {
      "adult": false,
      "backdrop_path": "/is9bmV6uYXu7LjZGJczxrjJDlv8.jpg",
      "genre_ids": [28, 12],
      "id": 1229730,
      "original_language": "fr",
      "original_title": "Carjackers",
      "overview": "De día, son invisibles: valets, recepcionistas y bármanes de un lujoso hotel. De noche, son los Criminales de lujo, un equipo de conductores que roba a los huéspedes ricos en el camino. Mientras planean su último golpe, la directora del hotel contrata a un cruel asesino para detenerlos a cualquier costo. Con el peligro tan cerca, ¿podrán Nora, Zoé, Steve y Prestance tener éxito con su mayor robo?",
      "popularity": 435.5444,
      "poster_path": "/rpAbueORafYSgTk2oSc2t6ayktb.jpg",
      "release_date": "2025-03-27",
      "title": "Criminales de lujo",
      "video": false,
      "vote_average": 7.0,
      "vote_count": 39,
      "page_number": 1
    },
    {
      "adult": false,
      "backdrop_path": "/gsQJOfeW45KLiQeEIsom94QPQwb.jpg",
      "genre_ids": [28, 53],
      "id": 987654,
      "original_language": "en",
      "original_title": "The Escape",
      "overview": "Un agente secreto intenta escapar de una trampa mortal mientras descubre una conspiración global.",
      "popularity": 312.212,
      "poster_path": "/poster_example.jpg",
      "release_date": "2025-04-01",
      "title": "La Fuga",
      "video": false,
      "vote_average": 6.8,
      "vote_count": 21,
      "page_number": 1
    }
  ],
}


<a id='transformacionpreparaciondatos'></a>
## 4. Transformación y Preparación de Datos


Los datos extraídos fueron almacenados en un archivo `peliculas_streaming.json`, con campos como: título, ID de película, fecha de estreno, popularidad, géneros, idioma, promedio de votos y proveedores de streaming. 

Se desarrollaron scripts de filtrado y preprocesamiento (ubicados en la carpeta `filtros/`) para extraer subgrupos de información útil, por ejemplo: identificación del género del reparto o asociación de servicios de distribución.

Además, se generó un archivo adicional `generos.json`, que traduce los `genre_ids` en nombres legibles para su análisis posterior.

A continuación, se muestra un fragmento del proceso utilizado para **filtrar las películas con disponibilidad en plataformas de streaming** y almacenar los resultados en un archivo JSON estructurado:

In [None]:
# Lista para almacenar películas con proveedores disponibles
peliculas_con_proveedores = []

# Recorremos 3 páginas del endpoint de películas populares
for page in range(1, 4):
    url = f"https://api.themoviedb.org/3/trending/movie/week?language=es-MX&page={page}"
    response = requests.get(url, headers=headers)
    data = response.json()

    for movie in data.get("results", []):
        movie_id = movie.get("id")
        providers = provedoresget(movie_id)  # Función que verifica si la película tiene streaming

        if providers:
            # Agregamos los nombres de los proveedores a la película
            movie["streaming_providers"] = list(providers.keys())
            peliculas_con_proveedores.append(movie)

# Guardamos los resultados filtrados en un archivo JSON estructurado
with open("peliculas_streaming.json", "w", encoding="utf-8") as f:
    json.dump(peliculas_con_proveedores, f, indent=4, ensure_ascii=False)


<a id='analisisdatosresultados'></a>
## 5. Análisis de Datos y Resultados

Una vez completada la recolección y transformación de los datos, se procedió a su análisis mediante scripts desarrollados en Python. Cada uno de estos scripts aborda un aspecto específico del comportamiento del contenido en plataformas de streaming. Los análisis se apoyan en visualizaciones generadas con la librería `matplotlib`, y permiten identificar tendencias significativas relacionadas con popularidad, géneros, distribución por plataformas y representatividad por género.

Los scripts utilizados se encuentran en la carpeta `estadisticas/` del proyecto, y los resultados visuales correspondientes se almacenan automáticamente en la carpeta `graficas/`.

A continuación, se detallan los análisis realizados:

<a id='genero-casting'></a>
### 5.1 Distribución de protagonistas por género

Este análisis, realizado mediante el script `genero_casting.py`, examina el reparto principal de cada película para calcular la proporción de protagonistas hombres y mujeres. Para ello, se utiliza la función `obtener_genero_casting(movie_id)` definida en `obtener_sexo.py`, que retorna el número de actores hombres y mujeres detectados por película.

Los datos se acumulan en el diccionario `conteo_generos` y se visualizan en una gráfica de pastel.

**Resultado esperado:** Determinar si existe una representación equilibrada entre géneros en el contenido popular disponible.


<img src="../graficas/genero_casting.png" alt="Distribución por género" width="400"/>



<a id='generos-semana'></a>
### 5.2 Géneros más populares de la semana

Este análisis se lleva a cabo mediante el script `genero_popular.py`, el cual utiliza los datos obtenidos desde el endpoint de películas trending y extrae los `genre_ids` de cada película. Posteriormente, se transforma esta información utilizando el diccionario generado por `get_generos()` desde `obtener_genero.py`, para representar los nombres de los géneros de forma legible.

Los datos se almacenan en la variable `genre_counts` y se grafican con `matplotlib` en un gráfico de pastel.

**Resultado esperado:** Visualizar qué géneros dominan las tendencias actuales entre las películas populares.

<img src="../graficas/generos_populares.png" alt="Géneros más populares" width="500"/>


<a id='peliculas-populares'></a>
### 5.3 Películas más populares y su disponibilidad

A través del script `pelicula_popular.py`, se procesan los resultados de la API (`data.get('results')`) para extraer el título (`movie.get('title')`), el ID (`movie.get('id')`) y la calificación promedio (`vote_average`). Luego, se consulta la función `provedoresget(movie_id)` para obtener los proveedores de streaming.

Los títulos, calificaciones y servicios se almacenan en las listas `filtered_titles`, `filtered_scores` y `providers_info` respectivamente. La visualización final usa un gráfico de barras horizontales con etiquetas combinadas.

**Resultado esperado:** Detectar qué películas tienen mayor aceptación del público y dónde se pueden ver.

<img src="../graficas/peliculas_con_streaming.png" alt="Películas más populares con streaming" width="600"/>



<a id='streaming-popular'></a>
### 5.4 Plataforma de streaming más popular

Este análisis se ejecuta mediante el script `servicio_popular.py`, que parte del resultado de la función `peliculas_streaming()` (ubicada en `filtro_servicio.py`). Esta función devuelve una lista de películas con su campo `streaming_providers` y el atributo `popularity`.

Los datos son acumulados en el diccionario `popularidad_por_proveedor`, agrupados en `agrupados_por_proveedor` y ordenados para generar la visualización final. El gráfico de barras representa la suma de popularidad por proveedor.

**Resultado esperado:** Identificar qué plataforma de streaming tiene mayor visibilidad o impacto en términos de contenido popular.

<img src="../graficas/proveedor_popular.png" alt="Proveedor más popular" width="500"/>

<a id='vis'></a>
## 6. Visualización

La visualización de los datos se realizó utilizando la biblioteca `matplotlib`, generando distintos tipos de gráficos como pasteles y barras horizontales y verticales. Cada análisis implementado en los scripts de la carpeta `estadisticas/` produce una gráfica correspondiente, la cual se guarda automáticamente en la carpeta `graficas/`.

#### Tabla de ejemplo – Recuento de género en el reparto

| Película                       | Mujeres | Hombres |
|-------------------------------|---------|---------|
| Criminales de lujo            | 2       | 3       |
| Moana 2                       | 1       | 2       |
| Paddington: Aventura en la selva | 1       | 4       |
| Frozen                        | 2       | 2       |
| Misión: Imposible             | 0       | 5       |


Estos datos fueron obtenidos haciendo llamadas individuales a la API para cada `movie_id`, utilizando la función `obtener_genero_casting(id)` del script `obtener_sexo.py`.

<a id='extrprepdat'></a>
## 7. Extracción y Preparación de Datos

Este proceso se ejecuta mediante el script `filtro_servicio.py`, ubicado en la carpeta `filtros/`. Su función principal `peliculas_streaming()` realiza solicitudes a la API de TMDb para obtener películas populares de la semana, recorriendo varias páginas del endpoint paginado.

Durante cada iteración, se extrae el identificador de cada película (`movie_id`) y se consulta su disponibilidad en servicios de streaming utilizando la función `provedoresget(movie_id)`, definida en `obtenerservicio.py`.

Solo las películas que tienen al menos un proveedor de streaming disponible son almacenadas, enriqueciendo la información original con el campo `streaming_providers`.

Los resultados se consolidan en una lista y se guardan en el archivo `peliculas_streaming.json`, dentro de la carpeta `movie_data/`. Este archivo contiene información clave como: título, fecha de estreno, popularidad, géneros y plataformas donde puede visualizarse cada película.

**Resultado esperado:** Obtener un conjunto de películas populares de la semana, filtrado exclusivamente por aquellas que estén disponibles en plataformas de streaming, y con los campos necesarios para el análisis posterior.


<a id='estructura-json'></a>
### 7.1 Estructura del archivo `peliculas_streaming.json`

El resultado del proceso de extracción y filtrado fue almacenado en un archivo JSON, ubicado en la carpeta `movie_data/`, que contiene una lista de películas con información sobre su disponibilidad en plataformas digitales.

Cada entrada del archivo contiene atributos claves:

- `id`: identificador único de la película
- `title`: título en español o idioma original
- `release_date`: fecha de lanzamiento
- `popularity`: métrica de popularidad en TMDb
- `genre_ids`: lista de IDs que representan los géneros
- `streaming_providers`: lista con los servicios donde la película está disponible


Ejemplo simplificado de una entrada en el archivo:

```json
{
  "id": 1254786,
  "title": "Mi lista de deseos",
  "release_date": "2025-03-27",
  "popularity": 133.0941,
  "genre_ids": [10749, 35, 18],
  "streaming_providers": ["Netflix", "Netflix basic with Ads"]
}
```


| Campo                | Valor de ejemplo                                           | Descripción                                                  |
|----------------------|------------------------------------------------------------|--------------------------------------------------------------|
| `id`                | `1254786`                                                  | Identificador único de la película                          |
| `title`             | `"Mi lista de deseos"`                                     | Título en español o idioma original                         |
| `release_date`      | `"2025-03-27"`                                             | Fecha oficial de estreno                                    |
| `popularity`        | `133.0941`                                                 | Puntuación de popularidad (calculada por TMDb)              |
| `genre_ids`         | `[10749, 35, 18]`                                          | Lista de identificadores de géneros                         |
| `streaming_providers` | `["Netflix", "Netflix basic with Ads"]`                   | Plataformas donde está disponible la película               |




<a id='strucdatosexpini'></a>
## 8. Estructura de Datos y Exploración Inicial

Este análisis se basa en el contenido del archivo `peliculas_streaming.json`, generado previamente mediante el script `filtro_servicio.py`. A través de este archivo se obtienen campos clave que describen cada película y se preparan para su análisis dentro de un DataFrame de `pandas`.



#### Estructura del conjunto de datos

Cada entrada del JSON contiene los siguientes atributos clave:

| Campo                | Tipo de dato     | Descripción                                                 |
|----------------------|------------------|-------------------------------------------------------------|
| `id`                | Entero           | Identificador único de la película                          |
| `title`             | String           | Título localizado (en español si está disponible)           |
| `original_title`    | String           | Título original                                              |
| `overview`          | String           | Sinopsis de la película                                      |
| `release_date`      | Fecha (string)   | Fecha de estreno en formato ISO (`YYYY-MM-DD`)              |
| `original_language` | String           | Idioma original de la película (`"en"`, `"es"`, `"fr"`, etc.) |
| `popularity`        | Float            | Métrica calculada por TMDb basada en interacción            |
| `vote_average`      | Float            | Promedio de calificaciones de usuarios                      |
| `vote_count`        | Entero           | Número total de votos recibidos                             |
| `genre_ids`         | Lista de enteros | Identificadores de géneros asociados a la película          |
| `streaming_providers` | Lista de strings | Plataformas donde está disponible                           |



### Visualización: distribución de popularidad

Este análisis está basado en el script `servicio_popular.py`, el cual obtiene el campo `popularity` de cada película y lo agrupa por proveedor. La suma de popularidad acumulada permite identificar qué plataformas concentran mayor visibilidad.

**Variables utilizadas:** `popularity`, `streaming_providers`  
**Resultado esperado:** Detectar si una plataforma domina en términos de contenido altamente popular.

<img src="../graficas/proveedor_popular.png" alt="Proveedor de streaming más popular" width="550"/>



### Visualización: calificaciones promedio de películas disponibles

A través del script `pelicula_popular.py`, se obtuvo la lista de películas populares disponibles en streaming y se ordenaron por su `vote_average`. La gráfica resultante permite observar qué títulos tienen mejor recepción crítica dentro de las plataformas.

**Variables utilizadas:** `vote_average`, `streaming_providers`  
**Resultado esperado:** Visualizar la calidad promedio del contenido más visible en plataformas.

<img src="../graficas/peliculas_con_streaming.png" alt="Películas populares disponibles en streaming" width="550"/>


<a id='analisis-resultados'></a>
## 6. Análisis de Resultados

En esta sección se presentan los análisis realizados a partir de los datos extraídos y preparados previamente. Cada uno se ejecutó mediante scripts personalizados ubicados en la carpeta `estadisticas/`, haciendo uso de funciones definidas en `filtros/`.



### Géneros más populares de la semana

Este análisis se ejecuta mediante el script `genero_popular.py`, que utiliza la API de TMDb para obtener las películas populares de la semana y extrae sus `genre_ids`. Posteriormente, se convierte cada identificador a su nombre correspondiente utilizando `generos.json`.

Se genera un gráfico de pastel que muestra la frecuencia relativa de los géneros más presentes en las películas populares recientes.

**Variables utilizadas:** `genre_ids`, `popularity`  
**Resultado esperado:** Identificar los géneros cinematográficos con mayor presencia en la actualidad.

<img src="../graficas/generos_populares.png" alt="Géneros más populares de la semana" width="400"/>



### Distribución de protagonistas por género

Este análisis, realizado mediante el script `genero_casting.py`, examina el reparto principal de cada película para calcular la proporción de protagonistas hombres y mujeres. Para ello, se accede a los créditos de cada película usando su `movie_id`.

La función `obtener_genero_casting()` permite obtener el conteo por género del reparto y generar la visualización correspondiente.

**Variables utilizadas:** `id`, información de créditos (`cast.gender`)  
**Resultado esperado:** Determinar si existe una representación equilibrada entre géneros en el contenido popular disponible.

<img src="../graficas/genero_casting.png" alt="Distribución de protagonistas por género" width="400"/>


<a id='visres'></a>
## 9. Visualización de Resultados


Todas las visualizaciones del proyecto fueron generadas utilizando la biblioteca `matplotlib`, integradas directamente desde los scripts en la carpeta `estadisticas/`. Cada gráfico se almacenó en la carpeta `graficas/` y posteriormente fue incluido en este informe en su sección correspondiente.

Se utilizaron distintos tipos de visualizaciones según la naturaleza del análisis:

- **Gráficos de pastel**: para mostrar distribuciones proporcionales (por ejemplo, géneros más comunes o proporción de protagonistas por género).
- **Gráficos de barras**: para comparar métricas cuantitativas entre categorías (por ejemplo, popularidad acumulada por plataforma).
- **Gráficos de barras horizontales**: para facilitar la lectura de títulos de películas y sus respectivas calificaciones.

**Objetivo de las visualizaciones:**  
Proveer una interpretación visual clara que facilite la detección de patrones, el comportamiento del público, la relevancia de ciertos géneros, y el posicionamiento de las plataformas de streaming.

 Todas las gráficas fueron guardadas en formato `.png` con dimensiones adecuadas para su visualización directa en este notebook.


<a id='conclusiones'></a>
## 10. Conclusiones

El desarrollo de este proyecto permitió aplicar técnicas de recopilación, transformación y análisis de datos a partir de una fuente real: la API de The Movie Database (TMDb). A través de la integración de herramientas de análisis en Python y la construcción de visualizaciones específicas, fue posible identificar patrones de comportamiento en torno al consumo de películas en servicios de streaming.

A continuación se resumen los principales hallazgos:

- **Plataformas dominantes en términos de popularidad**: Se identificó que plataformas como **Netflix**, **Disney Plus** y **Amazon Prime Video** concentran gran parte del contenido con mayor popularidad acumulada. Esta concentración sugiere que los proveedores que ofrecen contenido diverso y de alta rotación semanal tienen mayor visibilidad dentro del catálogo de tendencias globales.

- **Tendencias de género cinematográfico**: A través del análisis de los géneros más populares, se observó una alta presencia de películas de **aventura**, **acción**, **comedia** y **familiares**, lo cual puede estar directamente relacionado con las preferencias del público masivo, así como con los algoritmos de recomendación de las plataformas que promueven estos contenidos.

- **Equilibrio de género en los elencos**: El análisis del reparto de películas evidenció una **mayor representación masculina** entre los protagonistas. Esta tendencia, aunque histórica, continúa vigente en los contenidos recientes. La visualización de estos datos permite visibilizar la brecha y, eventualmente, establecer objetivos de mejora en términos de representación en pantalla.

- **Distribución de calificaciones y popularidad**: La mayoría de las películas analizadas presentan calificaciones promedio entre 6 y 7, lo cual es consistente con una curva de distribución centrada en valores medios. Asimismo, la popularidad muestra una concentración de títulos con puntajes bajos, y solo un pequeño conjunto de películas domina los niveles altos, lo cual refuerza el principio de Pareto (el 20% del contenido genera el 80% de la atención).

- **Valor del enfoque visual**: Las visualizaciones generadas con `matplotlib` demostraron ser esenciales para la identificación rápida de comportamientos colectivos, concentraciones temáticas y dinámicas de distribución entre plataformas. La integración de estos gráficos en el informe permitió complementar el análisis descriptivo con evidencia visual concreta.

- **Potencial de aplicación comercial**: Este tipo de análisis puede ser utilizado por equipos de marketing, curadores de contenido o inversores para tomar decisiones sobre adquisiciones estratégicas de licencias, creación de contenido original o predicciones de éxito basadas en métricas de popularidad y calificación histórica.

En conjunto, el proyecto demuestra cómo es posible utilizar herramientas accesibles de Big Data para obtener insights accionables a partir de grandes volúmenes de información, transformando datos sin estructura en conocimiento valioso para el ecosistema audiovisual.




<a id='referencias'></a>
## 11. Referencias

A continuación se listan las fuentes consultadas y utilizadas para el desarrollo de este proyecto, incluyendo documentación oficial, librerías de soporte y recursos de análisis de datos:

1. **The Movie Database (TMDb) API**  
   Fuente principal de datos del proyecto. Se utilizó para obtener información actualizada sobre películas populares, géneros y proveedores de streaming.  
   Sitio web: [https://www.themoviedb.org/documentation/api](https://www.themoviedb.org/documentation/api)

2. **Python Software Foundation**  
   Lenguaje principal utilizado para el desarrollo del análisis.  
   Sitio web: [https://www.python.org](https://www.python.org)

3. **pandas - Python Data Analysis Library**  
   Utilizada para manipulación, filtrado y estructuración de datos JSON en DataFrames.  
   Sitio web: [https://pandas.pydata.org/](https://pandas.pydata.org/)

4. **matplotlib - Visualization Library**  
   Biblioteca empleada para la creación de todas las visualizaciones del proyecto.  
   Sitio web: [https://matplotlib.org/](https://matplotlib.org/)

5. **Requests: HTTP for Humans**  
   Librería utilizada para realizar peticiones a la API de TMDb y manejar respuestas JSON.  
   Sitio web: [https://docs.python-requests.org/](https://docs.python-requests.org/)

6. **Stack Overflow y documentación de StackExchange**  
   Consultas técnicas específicas, recomendaciones de visualización, manejo de JSON y depuración de código.  
   Sitio web: [https://stackoverflow.com](https://stackoverflow.com)

7. **Visual Studio Code Docs - Data Science Overview**  
   Estructura base del entorno de trabajo y organización del proyecto.  
   Sitio web: [https://code.visualstudio.com/docs/datascience/overview](https://code.visualstudio.com/docs/datascience/overview)

8. **Guías de estilo de PEP8 para código Python**  
   Aplicadas para mantener consistencia en los scripts desarrollados.  
   Sitio web: [https://peps.python.org/pep-0008/](https://peps.python.org/pep-0008/)
