# Import dependencies

In [None]:
import pandas as pd
from datetime import datetime
import matplotlib.pyplot as plt
import matplotlib.dates as mdates

%matplotlib inline

# Functions

In [None]:
def plot_region(df, regione):
    df_regione = df[df["denominazione_regione"] == regione]
    province = list(df_regione["denominazione_provincia"].unique())
    
    plt.rcParams.update({"legend.fontsize": "x-large",
                         "figure.figsize": (20, 15),
                         'xtick.labelsize': 10})
    ax = plt.gca()
    formatter = mdates.DateFormatter("%m-%d")
    ax.xaxis.set_major_formatter(formatter)
    locator = mdates.DayLocator()
    ax.xaxis.set_major_locator(locator)

    for i in range(len(province)):
        df_provincia = df_regione[df_regione["denominazione_provincia"] == province[i]]
        
        data = df_provincia["data"].values
        totale_casi = df_provincia["totale_casi"].values
        plt.plot(data, totale_casi, label=province[i])
    
    totale_casi = (df[df["denominazione_regione"] == regione]
                   .groupby(["data"])["totale_casi"]
                   .sum().values)
    plt.plot(data, totale_casi, label="Totale %s" % regione)
    
    plt.legend(loc="upper left")
    plt.show()    

# Load data

In [None]:
dati_province_fpath = "../../dati-province/dpc-covid19-ita-province.csv"
df = pd.read_csv(dati_province_fpath, sep=",")

In [None]:
df.head()

## Coverti data: string to datetime object

In [None]:
df.loc[:, "data"] = df.loc[:, "data"].apply(lambda x: datetime.strptime(x, "%Y-%m-%d %H:%M:%S"))

In [None]:
df.head()

# Totale per regione

In [None]:
df_totale_regione = (df[ df["data"] == df["data"].max() ]
                     .groupby(["denominazione_regione"], as_index=False)["totale_casi"].sum()
                     .sort_values(["totale_casi"], ascending=[False])) 

In [None]:
df_totale_regione

In [None]:
df_totale_regione["totale_casi"].sum()

## Senza Lombardia

In [None]:
df_totale_regione = (df[ (df["data"] == df["data"].max()) & 
                         (df["denominazione_regione"] != "Lombardia") ]
                     .groupby(["denominazione_regione"], as_index=False)["totale_casi"].sum()
                     .sort_values(["totale_casi"], ascending=[False])) 

In [None]:
df_totale_regione["totale_casi"].sum()

# Andamento Lombardia

In [None]:
plot_region(df, "Lombardia")

# Andamento Emilia Romagna

In [None]:
plot_region(df, "Emilia Romagna")

# Andamento Veneto

In [None]:
plot_region(df, "Veneto")

# Andamento Sardegna

In [None]:
df_province = (df[(df["data"] == df["data"].max()) & 
         (df["denominazione_regione"] == "Sardegna")][["denominazione_provincia", "totale_casi"]]
     )

In [None]:
df_province

In [None]:
plot_region(df, "Sardegna")