# Documentación del Proyecto Ampliada

---

## 1. Definición del Proyecto

**Título:** Estimación de ingresos de películas según su presupuesto y factores clave.

**Objetivo:** Determinar cómo se relaciona el presupuesto de producción y otros factores significativos con los ingresos en taquilla, ayudando a los productores a estimar de manera más precisa el retorno de inversión.

**Problema:** ¿Cómo influyen el presupuesto y otros factores seleccionados en los ingresos de una película?

**Fórmula inicial ampliada:**
$$ Y = b_0 + b_1 \cdot X + b_2 \cdot \text{Marketing} + b_3 \cdot \text{Género} + b_4 \cdot \text{Nº de Cines} + b_5 \cdot \text{Calificación por Edad} + \epsilon $$

Donde:
- \( Y \): Ingresos en taquilla (en millones de dólares).
- \( X \): Presupuesto de producción (en millones de dólares).
- \( \text{Marketing} \): Gasto destinado a promoción y publicidad (en millones de dólares).
- \( \text{Género} \): Variable categórica que representa el género de la película (ej.: acción, comedia, drama).
- \( \text{Nº de Cines} \): Número de cines donde la película se estrena.
- \( \text{Calificación por Edad} \): Clasificación por grupos de audiencia (ej.: G, PG-13, R).
- \( \epsilon \): Ruido aleatorio (factores impredecibles).

**Aplicación:** Guía para tomar decisiones estratégicas en la producción y promoción de películas.

**Datos requeridos:**
1. Presupuesto de producción.
2. Gasto en marketing.
3. Género de la película.
4. Número de cines en el estreno.
5. Clasificación por edad de la película.

## 2. Diagrama de Flujo del Proyecto

### Pasos:
1. **Inicio:** Recolección de datos relevantes (Presupuesto, Marketing, Género, Nº de Cines, Calificación, Ingresos).
2. **Procesamiento:** Limpieza y preprocesamiento de datos (tratamiento de valores faltantes, codificación de variables categóricas, etc.).
3. **Análisis Exploratorio:** Identificación de correlaciones entre las variables y los ingresos.
4. **Modelado:** Ajuste del modelo lineal ampliado para predecir ingresos.
5. **Validación:** Evaluación del modelo con datos de prueba.
6. **Predicción:** Estimación de ingresos futuros según nuevos datos.
7. **Fin:** Generación de resultados, conclusiones y recomendaciones.

## 3. Variables Clave Seleccionadas

1. **Presupuesto de Producción:**
   - Base de la fórmula. Representa los recursos destinados a la creación de la película.

2. **Gasto en Marketing:**
   - Justificación: Una promoción adecuada puede aumentar considerablemente la visibilidad y, por ende, los ingresos.

3. **Género de la Película:**
   - Justificación: Algunos géneros (acción, animación) suelen generar mayores ingresos que otros.

4. **Número de Cines en el Estreno:**
   - Justificación: Cuantos más cines proyecten la película, mayor será el alcance potencial y, por ende, los ingresos.

5. **Calificación por Edad:**
   - Justificación: Películas con clasificaciones más amplias (como PG-13) pueden atraer a una audiencia más diversa.

## 4. Planificación del Proyecto

| **Tarea**                     | **Duración (días)** | **Responsable** | **Herramientas**          |
|-------------------------------|---------------------|----------------|---------------------------|
| Recolección de datos          | 3                   | Fer             | Kaggle, IMDb datasets     |
| Limpieza y preprocesamiento   | 3                   | Omar            | Python, Pandas            |
| Exploración y análisis        | 3                   | Fer             | Python, Matplotlib, Seaborn |
| Creación del modelo           | 4                   | Omar           | Scikit-learn              |
| Validación del modelo         | 2                   | Fer             | Scikit-learn              |
| Documentación y presentación  | 2                   | Omar             | Jupyter Notebook, Markdown|

## 5. Herramientas y Bibliotecas

- **Python:** Lenguaje base.
- **Bibliotecas:**
  - Pandas: Manipulación de datos.
  - NumPy: Operaciones numéricas.
  - Matplotlib/Seaborn: Visualización.
  - Scikit-learn: Modelado y predicción.

---
*Se puede añadir código o diagramas adicionales según sea necesario.*