In [1]:
import pandas as pd
from time import sleep
import requests
from dotenv import load_dotenv
import os

In [2]:
# Load environment variables
load_dotenv()

headers = {
    'Accept': 'application/json, text/plain, */*',
    'Accept-Language': 'en-US,en;q=0.7',
    'Authorization': 'Bearer null',
    'Connection': 'keep-alive',
    'Referer': 'https://salute.regione.veneto.it/ivgStatistiche/',
    'Sec-Fetch-Dest': 'empty',
    'Sec-Fetch-Mode': 'cors',
    'Sec-Fetch-Site': 'same-origin',
    'Sec-GPC': '1',
    'User-Agent': os.getenv('USER_AGENT'),
    'dnt': '1',
    'sec-ch-ua': f'"Brave";v="{os.getenv("BROWSER_VERSION")}", "Chromium";v="{os.getenv("BROWSER_VERSION")}", "Not_A Brand";v="24"',
    'sec-ch-ua-mobile': '?0',
    'sec-ch-ua-platform': f'"{os.getenv("PLATFORM")}"',
}

In [3]:
aziende_ids = list(range(101, 123)) + list(range(501, 510)) + [901, 912]

anni_search = [1,2,3,4,5,6,7,8,9]

# Initialize empty lists to store the data
nomi = []
valori = []
anni = []

for anno in anni_search: 
  for aziende_id in aziende_ids:
    params = {
      'annoA': anno,
      'annoDa': anno,
      'idAzienda': aziende_id,
      'idTipoGrafico': '8',
      'isCategoriaEnable': 'false',
      'isCategoriaMax1': 'false',
    }

    response = requests.get('https://salute.regione.veneto.it/ivgStatistiche/api/grafico', params=params, headers=headers)
    data = response.json()

    if 'graficoTortaDto' not in data or data['graficoTortaDto'] is None:
        print(f"Skipping azienda {aziende_id} for year {anno} - no data found")
        continue

    aziende = data['graficoTortaDto']
    for azienda in aziende:
      nome = azienda['name']
      valore = azienda['value']
      print(f"{anno} - IVG {nome}: {valore}")

      # Append each nome and valore to their respective lists
      nomi.append(nome)
      valori.append(valore)
      anni.append(anno)

    sleep(1)

# Create the DataFrame after the loop is complete
df = pd.DataFrame({
    'nome_azienda': nomi,
    'valore': valori,
    'anno': anni
})

1 - IVG 101 - BELLUNO: 96.0
1 - IVG 102 - FELTRE: 120.0
1 - IVG 103 - BASSANO DEL GRAPPA: 128.0
1 - IVG 104 - THIENE: 183.0
1 - IVG 105 - ARZIGNANO: 152.0
1 - IVG 106 - VICENZA: 277.0
1 - IVG 107 - PIEVE DI SOLIGO: 314.0
1 - IVG 108 - ASOLO: 299.0
1 - IVG 109 - TREVISO: 358.0
1 - IVG 110 - S. DONA' DI PIAVE: 144.0
Skipping azienda 111 for year 1 - no data found
1 - IVG 112 - VENEZIANA: 496.0
1 - IVG 113 - MIRANO: 342.0
1 - IVG 114 - CHIOGGIA: 59.0
1 - IVG 115 - CITTADELLA: 178.0
1 - IVG 116 - PADOVA: 169.0
1 - IVG 117 - ESTE: 134.0
1 - IVG 118 - ROVIGO: 185.0
1 - IVG 119 - ADRIA: 32.0
1 - IVG 120 - VERONA: 141.0
1 - IVG 121 - LEGNAGO: 104.0
1 - IVG 122 - BUSSOLENGO: 52.0
1 - IVG 901 - AZIENDA OSPEDALE - UNIVERSITÀ PADOVA: 349.0
1 - IVG 912 - A.O. INTEGRATA CON UNIVERSITÀ - VERONA: 731.0
2 - IVG 101 - BELLUNO: 78.0
2 - IVG 102 - FELTRE: 121.0
2 - IVG 103 - BASSANO DEL GRAPPA: 105.0
2 - IVG 104 - THIENE: 200.0
2 - IVG 105 - ARZIGNANO: 163.0
2 - IVG 106 - VICENZA: 297.0
2 - IVG 107 - PIEV

In [4]:
anni_mapping = {
    1: 2015,
    2: 2016,
    3: 2017,
    4: 2018,
    5: 2019,
    6: 2020,
    7: 2021,
    8: 2022,
    9: 2023
}
df['anno_id'] = df['anno']
df['anno'] = df['anno_id'].map(anni_mapping)
df['valore'] = df['valore'].astype(int)

In [5]:
df.to_csv('../output/ivg_effettuate.csv', index=False, encoding='UTF-8')