# Dati provinciali generali

In [5]:
import json
import os
import pandas as pd

import matplotlib.pyplot as plt
%matplotlib notebook

# change the cell width
from IPython.core.display import display, HTML
display(HTML("<style>.container { width:85% !important; }</style>"))

# Aggiornare con il proprio path locale
# prociv_repo_dir = "/media/michele/DATA-2/Covid/prociv-covid"
prociv_repo_dir = "/home/michele/Covid/prociv-covid"

Lettura dati Istat sulla popolazione

In [6]:
popolazione = pd.read_csv(os.path.join("dati_aggiuntivi", "popolazione_istat_2020.csv"))
popolazione.head()

Unnamed: 0,Zona,Popolazione
0,Italia,59641488
1,Piemonte,4311217
2,Torino,2230946
3,Vercelli,169390
4,Novara,364980


Lettura dati Protezione Civile

In [7]:
dati_province_csv = os.path.join(prociv_repo_dir, "dati-province/dpc-covid19-ita-province.csv")
andamento_province = pd.read_csv(dati_province_csv, parse_dates=[0])
andamento_province.head()

Unnamed: 0,data,stato,codice_regione,denominazione_regione,codice_provincia,denominazione_provincia,sigla_provincia,lat,long,totale_casi,note,codice_nuts_1,codice_nuts_2,codice_nuts_3
0,2020-02-24 18:00:00,ITA,13,Abruzzo,66,L'Aquila,AQ,42.351222,13.398438,0,,,,
1,2020-02-24 18:00:00,ITA,13,Abruzzo,67,Teramo,TE,42.658918,13.7044,0,,,,
2,2020-02-24 18:00:00,ITA,13,Abruzzo,68,Pescara,PE,42.464584,14.213648,0,,,,
3,2020-02-24 18:00:00,ITA,13,Abruzzo,69,Chieti,CH,42.351032,14.167546,0,,,,
4,2020-02-24 18:00:00,ITA,13,Abruzzo,979,In fase di definizione/aggiornamento,,,,0,,,,


In [8]:
andamento_province.columns

Index(['data', 'stato', 'codice_regione', 'denominazione_regione',
       'codice_provincia', 'denominazione_provincia', 'sigla_provincia', 'lat',
       'long', 'totale_casi', 'note', 'codice_nuts_1', 'codice_nuts_2',
       'codice_nuts_3'],
      dtype='object')

In [9]:
f"Aggiornato al {andamento_province['data'].max()}"

'Aggiornato al 2021-05-08 17:00:00'

## Selezione provincia

In [10]:
provincia = "Lucca"
andamento_provinciale = andamento_province[andamento_province["denominazione_provincia"] == provincia]
popolazione_provincia = int(popolazione[popolazione["Zona"] == provincia]["Popolazione"])
print(f"Provincia selezionata {provincia}, popolazione {popolazione_provincia}")

Provincia selezionata Lucca, popolazione 382543


### Smoothing e aggregazione

Sono disponibili solo i casi totali, si calcolano i nuovi positivi da qui

In [11]:
andamento_provinciale['nuovi_positivi'] = andamento_provinciale.totale_casi.diff()

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  """Entry point for launching an IPython kernel.


Smoothing 7, periodicità settimanale per i positivi

In [12]:
andamento_provinciale['nuovi_positivi_mov_avg'] = andamento_provinciale['nuovi_positivi'].rolling(7).mean()

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  """Entry point for launching an IPython kernel.


Nuovi positivi settimanali per 100 000 abitanti

In [13]:
andamento_provinciale['nuovi_positivi_settimanali_centomila_abitanti'] = andamento_provinciale['nuovi_positivi'].rolling(7).sum() * 100000 / popolazione_provincia

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  """Entry point for launching an IPython kernel.


## Andamento dall'inizio

In [14]:
sampling_x = [data for ix, data in enumerate(andamento_provinciale["data"]) if ix % 30 == 0]
andamento_provinciale.plot(
    x="data",
    xticks=sampling_x,
    y=["nuovi_positivi_mov_avg", "nuovi_positivi_settimanali_centomila_abitanti"],
    title=f"Andamento provincia {provincia}",
    ylabel="Unità",
    figsize=[12, 8]
);

<IPython.core.display.Javascript object>

## Andamento con filtro data

Analisi dati a partire dalla seconda ondata dove si ha maggiore copertura e affidabilità nella raccolta dati

In [15]:
primo_ottobre = "2020-10-01 18:00:00"
inizio_zone_di_colore = "2020-11-06 18:00:00"  # DPCM 3 novembre 2020
filtro_data = primo_ottobre

### Nuovi positivi

In [16]:
andamento_provinciale_filtrato = andamento_provinciale[andamento_provinciale["data"] >= filtro_data]
sampling_filtrato_x = [data for ix, data in enumerate(andamento_provinciale_filtrato["data"]) if ix % 10 == 0]
andamento_provinciale_filtrato.plot(
    x="data",
    xticks=sampling_filtrato_x,
    y=["nuovi_positivi_mov_avg"],
    title=f"Nuovi positivi filtrati {provincia} dal {filtro_data}",
    ylabel="Unità",
    figsize=[12, 8]
);

<IPython.core.display.Javascript object>

### Nuovi positivi settimanali per centomila abitanti

Limiti utilizzati anche per il cambio colore qui semplificato:
- sotto i 50 per 100 000 a settimana -> OK (limite zona bianca)
- sopra i 250 -> Rosso

In [17]:
inizio_soglia_allerta = 50
limite_soglia_allerta = 250

In [18]:
max_y = andamento_provinciale_filtrato["nuovi_positivi_settimanali_centomila_abitanti"].max()
sampling_y = range(0, int(max_y), 50)
andamento_provinciale_filtrato.plot(
    x="data",
    xticks=sampling_filtrato_x,
    yticks=sampling_y,
    y=["nuovi_positivi_settimanali_centomila_abitanti"],
    title=f"Nuovi positivi settimanali per centomila abitanti, provincia {provincia} dal {filtro_data}",
    ylabel="Unità",
    figsize=[12, 8]
)
plt.axhspan(inizio_soglia_allerta - 1, min(max_y, limite_soglia_allerta - 1), facecolor='orange', alpha=0.5)
if max_y >= limite_soglia_allerta:
    plt.axhspan(limite_soglia_allerta - 1, max_y, facecolor='r', alpha=0.4)
plt.show()

<IPython.core.display.Javascript object>