# G3 - Heatmap Schermi Cinematografici UNESCO (2000-2010)

## Distribuzione Globale dell'Infrastruttura Cinematografica

Questo grafico mostra la distribuzione del numero di schermi cinematografici per paese nel periodo 2000-2010, utilizzando dati UNESCO per fornire una prospettiva globale sull'infrastruttura cinematografica pre-streaming.

### Obiettivi:
- Visualizzare la distribuzione globale degli schermi cinematografici
- Identificare i mercati cinematografici più sviluppati
- Fornire contesto geografico per l'analisi dell'impatto streaming

In [None]:
# Import delle librerie necessarie
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import os

print("Librerie importate con successo!")

In [None]:
# Caricamento e esplorazione dei dati UNESCO
csv_path = "unesco_cinema_worldwide_2000_2010.csv"
df = pd.read_csv(csv_path)

print("Dataset UNESCO caricato:")
print(f"Forma del dataset: {df.shape}")
print("\nColonne disponibili:")
print(df.columns.tolist())
print("\nPrime righe:")
df.head()

In [None]:
# Preparazione e pulizia dei dati
# Conversione dei campi numerici
df["Year"] = pd.to_numeric(df["Year"], errors="coerce")
df["Screens"] = pd.to_numeric(df["Screens"], errors="coerce")
df["FeatureFilmsProduced"] = pd.to_numeric(df["FeatureFilmsProduced"], errors="coerce")

# Filtra i dati e rimuove eventuali valori NaN
df = df.dropna()

print("Dati preparati:")
print(f"Periodo: {df['Year'].min()} - {df['Year'].max()}")
print(f"Numero di paesi: {df['Country'].nunique()}")
print(f"Anni disponibili: {sorted(df['Year'].unique())}")
print("\nPaesi con più dati:")
print(df['Country'].value_counts().head(10))

In [None]:
# Creazione della matrice pivot per l'heatmap
pivot_data = df.pivot_table(
    index='Country', 
    columns='Year', 
    values='Screens', 
    aggfunc='mean',
    fill_value=0
)

print(f"Matrice pivot creata: {pivot_data.shape}")
print("\nAnni nella matrice:")
print(pivot_data.columns.tolist())

In [None]:
# Filtraggio e selezione dei paesi più rilevanti
# Filtra solo i paesi con dati significativi
countries_with_data = pivot_data.sum(axis=1)
countries_filtered = countries_with_data[countries_with_data > 0].index
pivot_data_filtered = pivot_data.loc[countries_filtered]

# Ordina i paesi per numero medio di schermi
avg_screens = pivot_data_filtered.mean(axis=1).sort_values(ascending=False)
pivot_data_sorted = pivot_data_filtered.loc[avg_screens.index]

# Seleziona i top 15 paesi per migliore leggibilità
top_countries = 15
pivot_data_top = pivot_data_sorted.head(top_countries)

# Forza l'inclusione dell'Italia se disponibile
if 'Italy' in pivot_data_filtered.index and 'Italy' not in pivot_data_top.index:
    pivot_data_top = pivot_data_top.drop(pivot_data_top.index[-1])
    italy_data = pivot_data_filtered.loc[['Italy']]
    pivot_data_top = pd.concat([pivot_data_top, italy_data])
    print("🇮🇹 Italia aggiunta forzatamente alla visualizzazione!")

pivot_data_display = pivot_data_top

print(f"\nTop {len(pivot_data_display)} paesi selezionati:")
for country in pivot_data_display.index:
    avg_val = pivot_data_display.loc[country].mean()
    print(f"- {country}: {avg_val:.0f} schermi medi")

In [None]:
# Creazione dell'heatmap
plt.figure(figsize=(12,8), facecolor='white')

# Colormap personalizzato con rossi
colors = ['#ffeeee', '#ffcccc', '#ff9999', '#ff6666', '#cc0000', '#990000', '#660000']
custom_cmap = sns.blend_palette(colors, as_cmap=True)

# Creazione heatmap
heatmap = sns.heatmap(
    pivot_data_display,
    annot=True,
    fmt='.0f',
    cmap=custom_cmap,
    cbar_kws={'label': 'Numero di Schermi', 'shrink': 0.8},
    linewidths=1,
    linecolor='white',
    annot_kws={'size': 10, 'weight': 'bold', 'color': 'black'},
    square=False,
    xticklabels=True,
    yticklabels=True
)

print("Heatmap creata!")

In [None]:
# Personalizzazione e finalizzazione
plt.xlabel('Anno', fontsize=14, fontweight='bold')
plt.ylabel('Paese', fontsize=14, fontweight='bold')
plt.title('Schermi Cinematografici per Paese (2000-2010)', fontsize=16, fontweight='bold', pad=20)

# Ottimizzazione etichette
plt.xticks(rotation=0, fontsize=12)
plt.yticks(rotation=0, fontsize=11)

# Configurazione proporzioni
plt.subplots_adjust(left=0.15, bottom=0.1, right=0.9, top=0.85, wspace=0.2, hspace=0.2)

# Salvataggio
output_path = "G3_heatmap.png"
plt.savefig(output_path, dpi=300, bbox_inches='tight', facecolor='white')
print(f"Heatmap salvata come: {output_path}")

# Visualizzazione
plt.show()

## Analisi dei Risultati

### Pattern Identificati:
- **Concentrazione geografica**: I mercati sviluppati dominano il numero di schermi
- **Stabilità temporale**: Variazioni graduali nel numero di schermi per paese
- **Divario digitale**: Chiare differenze tra paesi sviluppati e in via di sviluppo

### Insights Chiave:
1. **Infrastruttura consolidata**: I paesi leader mantengono posizioni stabili
2. **Investimenti graduali**: Crescita incrementale dell'infrastruttura
3. **Mercati maturi**: Saturazione in alcuni paesi sviluppati

### Caratteristiche Tecniche:
- **Colori rossi**: Intensità proporzionale al numero di schermi
- **Top 15 paesi**: Focus sui mercati più significativi
- **Periodo 2000-2010**: Baseline pre-streaming
- **Risoluzione alta**: 300 DPI per presentazioni professionali

### Implicazioni Future:
Questa mappa dell'infrastruttura cinematografica globale servirà per comprendere come lo streaming abbia impattato differentemente i vari mercati geografici.