# Dati nazionali generali

In [1]:
import os
import pandas as pd

import matplotlib.pyplot as plt
%matplotlib notebook

# change the cell width
from IPython.core.display import display, HTML
display(HTML("<style>.container { width:85% !important; }</style>"))

prociv_repo_dir = "/media/michele/DATA-2/Covid/prociv-covid"

In [2]:
andamento_nazionale_csv = os.path.join(prociv_repo_dir, "dati-andamento-nazionale/dpc-covid19-ita-andamento-nazionale.csv")

In [3]:
andamento_nazionale = pd.read_csv(andamento_nazionale_csv, parse_dates=[0])
andamento_nazionale['deceduti_giornalieri'] = andamento_nazionale.deceduti.diff()
andamento_nazionale.head()

Unnamed: 0,data,stato,ricoverati_con_sintomi,terapia_intensiva,totale_ospedalizzati,isolamento_domiciliare,totale_positivi,variazione_totale_positivi,nuovi_positivi,dimessi_guariti,...,casi_testati,note,ingressi_terapia_intensiva,note_test,note_casi,totale_positivi_test_molecolare,totale_positivi_test_antigenico_rapido,tamponi_test_molecolare,tamponi_test_antigenico_rapido,deceduti_giornalieri
0,2020-02-24 18:00:00,ITA,101,26,127,94,221,0,221,1,...,,,,,,,,,,
1,2020-02-25 18:00:00,ITA,114,35,150,162,311,90,93,1,...,,,,,,,,,,3.0
2,2020-02-26 18:00:00,ITA,128,36,164,221,385,74,78,3,...,,,,,,,,,,2.0
3,2020-02-27 18:00:00,ITA,248,56,304,284,588,203,250,45,...,,,,,,,,,,5.0
4,2020-02-28 18:00:00,ITA,345,64,409,412,821,233,238,46,...,,,,,,,,,,4.0


In [4]:
andamento_nazionale.columns

Index(['data', 'stato', 'ricoverati_con_sintomi', 'terapia_intensiva',
       'totale_ospedalizzati', 'isolamento_domiciliare', 'totale_positivi',
       'variazione_totale_positivi', 'nuovi_positivi', 'dimessi_guariti',
       'deceduti', 'casi_da_sospetto_diagnostico', 'casi_da_screening',
       'totale_casi', 'tamponi', 'casi_testati', 'note',
       'ingressi_terapia_intensiva', 'note_test', 'note_casi',
       'totale_positivi_test_molecolare',
       'totale_positivi_test_antigenico_rapido', 'tamponi_test_molecolare',
       'tamponi_test_antigenico_rapido', 'deceduti_giornalieri'],
      dtype='object')

In [5]:
f"Aggiornato al {andamento_nazionale['data'].max()}"

'Aggiornato al 2021-03-09 17:00:00'

### Smoothing

Smoothing 7, periodicità settimanale per i positivi

In [6]:
andamento_nazionale['nuovi_positivi_mov_avg'] = andamento_nazionale['nuovi_positivi'].rolling(7).mean()

Smoothing necessario anche per i deceduti, si riusa 7 per comodità

In [7]:
andamento_nazionale['deceduti_giornalieri_mov_avg'] = andamento_nazionale['deceduti_giornalieri'].rolling(7).mean()

### Andamento dall'inizio

In [10]:
sampling_x = [data for ix, data in enumerate(andamento_nazionale["data"]) if ix % 30 == 0]
andamento_nazionale.plot(
    x="data",
    xticks=sampling_x,
    y=["nuovi_positivi_mov_avg", "ricoverati_con_sintomi", "terapia_intensiva", "deceduti_giornalieri_mov_avg"],
    title=f"Andamento nazionale dall'inizio",
    ylabel="Unità",
    figsize=[14, 10]
);

<IPython.core.display.Javascript object>

### Filtro data

In [11]:
primo_ottobre = "2020-10-01 18:00:00"
inizio_zone_di_colore = "2020-11-06 18:00:00"  # DPCM 4 novembre 2020
andamento_nazionale_filtrato = andamento_nazionale[andamento_nazionale["data"] > "2020-10-01 18:00:00"]

In [13]:
sampling_filtrato_x = [data for ix, data in enumerate(andamento_nazionale_filtrato["data"]) if ix % 10 == 0]
andamento_nazionale_filtrato.plot(
    x="data",
    xticks=sampling_filtrato_x,
    y=["nuovi_positivi_mov_avg", "ricoverati_con_sintomi", "terapia_intensiva", "deceduti_giornalieri_mov_avg"],
    title="Andamento nazionale",
    ylabel="Unità",
    figsize=[14, 10]
);

<IPython.core.display.Javascript object>

In [14]:
andamento_nazionale_filtrato.plot(
    x="data",
    xticks=sampling_filtrato_x,
    y=["terapia_intensiva", "deceduti_giornalieri_mov_avg"],
    title="Andamento nazionale terapia intensiva e deceduti",
    ylabel="Unità",
    figsize=[14, 10]
);

<IPython.core.display.Javascript object>

### Normalizzazione

In [15]:
colonne_da_normalizzare = ["nuovi_positivi_mov_avg", "ricoverati_con_sintomi", "terapia_intensiva", "deceduti_giornalieri_mov_avg"]
for colonna_norm in colonne_da_normalizzare:
    andamento_nazionale_filtrato[colonna_norm + "_norm"] = \
        (andamento_nazionale_filtrato[colonna_norm] - andamento_nazionale_filtrato[colonna_norm].min()) / \
        (andamento_nazionale_filtrato[colonna_norm].max() - andamento_nazionale_filtrato[colonna_norm].min())

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  """


In [16]:
andamento_nazionale_filtrato.plot(
    x="data",
    xticks=sampling_filtrato_x,
    y=["nuovi_positivi_mov_avg_norm", "ricoverati_con_sintomi_norm", "terapia_intensiva_norm", "deceduti_giornalieri_mov_avg_norm"],
    title="Andamento nazionale normalizzato",
    figsize=[14, 10]
);

<IPython.core.display.Javascript object>