# G16 - Budget vs Box Office (2000-2024)

## ROI e Rischio nell'Industria Cinematografica

Questo scatter plot analizza la correlazione tra budget di produzione e performance al box office dal 2000 al 2024, rivelando l'evoluzione del rischio e del ritorno sugli investimenti nell'industria cinematografica.

### Obiettivi:
- Analizzare correlazione budget-performance
- Identificare outlier e successi inaspettati
- Comprendere l'evoluzione del rischio produttivo
- Valutare l'impatto dello streaming sui ritorni

In [None]:
# Import e analisi budget vs box office
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

csv_path = "budget_vs_boxoffice_2000_2024.csv"
df = pd.read_csv(csv_path)

df["Budget_MUSD"] = pd.to_numeric(df["Budget_MUSD"], errors="coerce")
df["BoxOffice_MUSD"] = pd.to_numeric(df["BoxOffice_MUSD"], errors="coerce")
df = df.dropna()

# Calcolo ROI
df['ROI'] = (df['BoxOffice_MUSD'] / df['Budget_MUSD']) - 1

print(f"Analisi {len(df)} film (2000-2024)")
print(f"Budget medio: ${df['Budget_MUSD'].mean():.1f}M")
print(f"Box office medio: ${df['BoxOffice_MUSD'].mean():.1f}M")
print(f"ROI medio: {df['ROI'].mean()*100:.1f}%")

# Correlazione
correlation = df['Budget_MUSD'].corr(df['BoxOffice_MUSD'])
print(f"Correlazione budget-box office: {correlation:.3f}")

# Creazione scatter plot
plt.figure(figsize=(9,6), facecolor='white')
ax = plt.gca()
ax.set_facecolor('white')

plt.scatter(df["Budget_MUSD"], df["BoxOffice_MUSD"], color="#cc0000", alpha=0.6, 
           s=30, edgecolor="#8b0000", linewidth=0.5, label="Film (2000-2024)")

# Linea di tendenza
z = np.polyfit(df["Budget_MUSD"], df["BoxOffice_MUSD"], 1)
p = np.poly1d(z)
plt.plot(df["Budget_MUSD"], p(df["Budget_MUSD"]), color="#660000", 
         linestyle="--", linewidth=2, alpha=0.8, label="Trend Line")

plt.xlabel("Budget (Milioni USD)", fontsize=12)
plt.ylabel("Box Office (Milioni USD)", fontsize=12)
plt.title("Budget vs Box Office Performance (2000-2024)", fontsize=14, fontweight='bold')
plt.grid(True, alpha=0.3)
plt.legend()

ax.spines['top'].set_visible(False)
ax.spines['right'].set_visible(False)
plt.subplots_adjust(left=0.11, bottom=0.083, right=0.617, top=0.61)

plt.savefig("budget_vs_boxoffice_chart.png", dpi=300, bbox_inches='tight', facecolor='white')
plt.show()

## Analisi Rischio-Rendimento

### Pattern Identificati:
- **Correlazione Positiva**: Budget più alti tendenzialmente maggiori incassi
- **Alta Varianza**: Molti outlier sopra e sotto la trend line
- **Diminishing Returns**: ROI decresce con budget crescenti
- **Rischio Asimmetrico**: Downside limitato, upside potenzialmente massivo

### Fattori di Successo:
- **Franchise Power**: IP consolidati outperformano
- **Genere Optimization**: Alcuni generi ROI superiori
- **Marketing Efficiency**: Spending ratio critico
- **Timing Release**: Finestre ottimali per massive returns

### Era Streaming Impact:
- **Alternative Revenue**: Box office non più metrica unica
- **Risk Mitigation**: Streaming rights guaranteed revenue
- **Production Budgets**: Spostamento verso contenuti TV premium
- **Global Markets**: Compensazione per domestic box office decline