In [13]:
import requests
import json
import pandas as pd
from time import sleep

In [14]:
df = pd.read_csv('../output/codici_umbria_er_20241117.csv', dtype=str)
df_comuni = df[df['tipo'] == 'CM']
# Filtering for only Emilia Romagna
df_er = df_comuni[df_comuni['cod_regione'] == '08']

In [15]:
df_er.head(2)

Unnamed: 0,cod,desc,tipo,tipo_comune,dt_agg,cod_ele,cod_regione,regione,cod_provincia,provincia,cod_provincia_2,cod_comune
3,80130130005,ALTO RENO TERME,CM,N,,7,8,EMILIA-ROMAGNA,13,BOLOGNA,13,5
4,80130130010,ANZOLA DELL'EMILIA,CM,N,,7,8,EMILIA-ROMAGNA,13,BOLOGNA,13,10


In [16]:
BASE_URL = 'https://eleapi.interno.gov.it/siel/PX/getprefeR/DE/20241117/TE/07/RE/'

df_er['url_aff'] = df_er.apply(
    lambda row: f"{BASE_URL}{row['cod_regione']}/PR/{row['cod_provincia_2']}/CM/{row['cod_comune']}", axis=1
)

df_er['url'] = df_er.apply(
    lambda row: f"https://elezioni.interno.gov.it/risultati/20241117/regionali/scrutini/italia/{row['cod_regione']}{row['cod_provincia']}{row['cod_comune']}", axis=1
)
df_er.sample(3)

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_er['url_aff'] = df_er.apply(
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_er['url'] = df_er.apply(


Unnamed: 0,cod,desc,tipo,tipo_comune,dt_agg,cod_ele,cod_regione,regione,cod_provincia,provincia,cod_provincia_2,cod_comune,url_aff,url
234,80610610250,GROPPARELLO,CM,N,,7,8,EMILIA-ROMAGNA,61,PIACENZA,61,250,https://eleapi.interno.gov.it/siel/PX/getprefe...,https://elezioni.interno.gov.it/risultati/2024...
224,80610610150,CERIGNALE,CM,N,,7,8,EMILIA-ROMAGNA,61,PIACENZA,61,150,https://eleapi.interno.gov.it/siel/PX/getprefe...,https://elezioni.interno.gov.it/risultati/2024...
3,80130130005,ALTO RENO TERME,CM,N,,7,8,EMILIA-ROMAGNA,13,BOLOGNA,13,5,https://eleapi.interno.gov.it/siel/PX/getprefe...,https://elezioni.interno.gov.it/risultati/2024...


In [17]:
headers = {
    'accept': 'application/json, text/plain, */*',
    'accept-language': 'en-US,en;q=0.6',
    'dnt': '1',
    'origin': 'https://elezioni.interno.gov.it',
    'priority': 'u=1, i',
    'referer': 'https://elezioni.interno.gov.it/',
    'sec-ch-ua-mobile': '?0',
    'sec-ch-ua-platform': '"macOS"',
    'sec-fetch-dest': 'empty',
    'sec-fetch-mode': 'cors',
    'sec-fetch-site': 'same-site',
    'sec-gpc': '1'
}

In [None]:
comuni_data = []

for idx, url in enumerate(df_er['url_aff']):
    print(f"\nProcessing record {idx + 1}")
    print(f"URL: {url}")

    response = requests.get(url, headers=headers)
    print(f"Response status code: {response.status_code}")
    
    data = response.json()

    comune = df_er.iloc[idx]['desc']
    provincia = df_er.iloc[idx]['provincia']
    regione = df_er.iloc[idx]['regione']
    url = df_er.iloc[idx]['url']

    print(f"Processing data for Comune: {comune}, Provincia: {provincia}")

    # Start with basic comune info
    comune_info = {
        'comune': comune,
        'provincia': provincia,
        'regione': regione,
        'url': url
    }
    
    # Add votes for each lista using lista description as column name
    if 'liste' in data:
        for lista in data['liste']:
            lista_desc = lista['desc']
            voti = lista.get('voti', 0)  # Use 0 if no votes found
            comune_info[lista_desc] = voti
            print(f"{lista_desc}: {voti} votes")

    if 'cand' in data:
        for cand in data['cand']:
            cand_desc = cand['nome'] + " " + cand['cogn']  # Use current candidate's name
            voti = cand['voti']
            comune_info[cand_desc] = voti
            print(f"{cand_desc}: {voti} votes")

    sezioni_scrutinate = data['liste'][0]['sez_perv']
    sezioni_tot = data['liste'][0]['sez_tot']

    # Optional: Verify consistency across lists
    if not all(lista.get('sez_perv') == sezioni_scrutinate for lista in data['liste']):
        print(f"Warning: Inconsistent scrutinized sections for {comune}")

    # Add to comune_info
    comune_info['sezioni_scrutinate'] = sezioni_scrutinate
    comune_info['sezioni_tot'] = sezioni_tot

    comuni_data.append(comune_info)
    
    print(f"Processed {comune}")
    sleep(0.1)

# Create DataFrame
print("\nCreating DataFrame...")
df_data = pd.DataFrame(comuni_data)

print("\nSample of processed data:")
print(df_data.head())


Processing record 1
URL: https://eleapi.interno.gov.it/siel/PX/getprefeR/DE/20241117/TE/07/RE/08/PR/013/CM/0005
Response status code: 200
Processing data for Comune: ALTO RENO TERME, Provincia: BOLOGNA
CIVICI, CON DE PASCALE PRESIDENTE: 0 votes
MOVIMENTO 5 STELLE: 0 votes
FRATELLI D'ITALIA - GIORGIA MELONI: 0 votes
LEGA SALVINI EMILIA-ROMAGNA - IL POPOLO DELLA FAMIGLIA: 0 votes
PARTITO DEMOCRATICO - DE PASCALE PRESIDENTE: 0 votes
RIFORMISTI EMILIA-ROMAGNA FUTURA - DE PASCALE PRESIDENTE: 0 votes
EMILIA-ROMAGNA PER LA PACE, L'AMBIENTE E IL LAVORO: 0 votes
RETE CIVICA - ELENA UGOLINI PRESIDENTE: 0 votes
LEALTA' COERENZA VERITA' - LUCA TEODORI: 0 votes
FORZA ITALIA - BERLUSCONI - UGOLINI PRESIDENTE - NOI MODERATI: 0 votes
ALLEANZA VERDI E SINISTRA - COALIZIONI CIVICHE - POSSIBILE: 0 votes
Processed ALTO RENO TERME

Processing record 2
URL: https://eleapi.interno.gov.it/siel/PX/getprefeR/DE/20241117/TE/07/RE/08/PR/013/CM/0010
Response status code: 200
Processing data for Comune: ANZOLA DEL

In [19]:
df_data

Unnamed: 0,comune,provincia,regione,url,"CIVICI, CON DE PASCALE PRESIDENTE",MOVIMENTO 5 STELLE,FRATELLI D'ITALIA - GIORGIA MELONI,LEGA SALVINI EMILIA-ROMAGNA - IL POPOLO DELLA FAMIGLIA,PARTITO DEMOCRATICO - DE PASCALE PRESIDENTE,RIFORMISTI EMILIA-ROMAGNA FUTURA - DE PASCALE PRESIDENTE,"EMILIA-ROMAGNA PER LA PACE, L'AMBIENTE E IL LAVORO",RETE CIVICA - ELENA UGOLINI PRESIDENTE,LEALTA' COERENZA VERITA' - LUCA TEODORI,FORZA ITALIA - BERLUSCONI - UGOLINI PRESIDENTE - NOI MODERATI,ALLEANZA VERDI E SINISTRA - COALIZIONI CIVICHE - POSSIBILE,sezioni_scrutinate,sezioni_tot
0,ALTO RENO TERME,BOLOGNA,EMILIA-ROMAGNA,https://elezioni.interno.gov.it/risultati/2024...,0,0,0,0,0,0,0,0,0.0,0,0,0,9
1,ANZOLA DELL'EMILIA,BOLOGNA,EMILIA-ROMAGNA,https://elezioni.interno.gov.it/risultati/2024...,0,0,0,0,0,0,0,0,0.0,0,0,0,11
2,ARGELATO,BOLOGNA,EMILIA-ROMAGNA,https://elezioni.interno.gov.it/risultati/2024...,0,0,0,0,0,0,0,0,0.0,0,0,0,9
3,BARICELLA,BOLOGNA,EMILIA-ROMAGNA,https://elezioni.interno.gov.it/risultati/2024...,0,0,0,0,0,0,0,0,0.0,0,0,0,7
4,BENTIVOGLIO,BOLOGNA,EMILIA-ROMAGNA,https://elezioni.interno.gov.it/risultati/2024...,0,0,0,0,0,0,0,0,0.0,0,0,0,5
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
325,SANT'AGATA FELTRIA,RIMINI,EMILIA-ROMAGNA,https://elezioni.interno.gov.it/risultati/2024...,0,0,0,0,0,0,0,0,0.0,0,0,0,5
326,SANTARCANGELO DI ROMAGNA,RIMINI,EMILIA-ROMAGNA,https://elezioni.interno.gov.it/risultati/2024...,0,0,0,0,0,0,0,0,0.0,0,0,8,20
327,SASSOFELTRIO,RIMINI,EMILIA-ROMAGNA,https://elezioni.interno.gov.it/risultati/2024...,0,0,0,0,0,0,0,0,0.0,0,0,2,3
328,TALAMELLO,RIMINI,EMILIA-ROMAGNA,https://elezioni.interno.gov.it/risultati/2024...,0,0,0,0,0,0,0,0,0.0,0,0,1,1


In [20]:
df_data['comune'] = df_data['comune'].str.title()
df_data['provincia'] = df_data['provincia'].str.title()
df_data['regione'] = df_data['regione'].str.title()
df_data

Unnamed: 0,comune,provincia,regione,url,"CIVICI, CON DE PASCALE PRESIDENTE",MOVIMENTO 5 STELLE,FRATELLI D'ITALIA - GIORGIA MELONI,LEGA SALVINI EMILIA-ROMAGNA - IL POPOLO DELLA FAMIGLIA,PARTITO DEMOCRATICO - DE PASCALE PRESIDENTE,RIFORMISTI EMILIA-ROMAGNA FUTURA - DE PASCALE PRESIDENTE,"EMILIA-ROMAGNA PER LA PACE, L'AMBIENTE E IL LAVORO",RETE CIVICA - ELENA UGOLINI PRESIDENTE,LEALTA' COERENZA VERITA' - LUCA TEODORI,FORZA ITALIA - BERLUSCONI - UGOLINI PRESIDENTE - NOI MODERATI,ALLEANZA VERDI E SINISTRA - COALIZIONI CIVICHE - POSSIBILE,sezioni_scrutinate,sezioni_tot
0,Alto Reno Terme,Bologna,Emilia-Romagna,https://elezioni.interno.gov.it/risultati/2024...,0,0,0,0,0,0,0,0,0.0,0,0,0,9
1,Anzola Dell'Emilia,Bologna,Emilia-Romagna,https://elezioni.interno.gov.it/risultati/2024...,0,0,0,0,0,0,0,0,0.0,0,0,0,11
2,Argelato,Bologna,Emilia-Romagna,https://elezioni.interno.gov.it/risultati/2024...,0,0,0,0,0,0,0,0,0.0,0,0,0,9
3,Baricella,Bologna,Emilia-Romagna,https://elezioni.interno.gov.it/risultati/2024...,0,0,0,0,0,0,0,0,0.0,0,0,0,7
4,Bentivoglio,Bologna,Emilia-Romagna,https://elezioni.interno.gov.it/risultati/2024...,0,0,0,0,0,0,0,0,0.0,0,0,0,5
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
325,Sant'Agata Feltria,Rimini,Emilia-Romagna,https://elezioni.interno.gov.it/risultati/2024...,0,0,0,0,0,0,0,0,0.0,0,0,0,5
326,Santarcangelo Di Romagna,Rimini,Emilia-Romagna,https://elezioni.interno.gov.it/risultati/2024...,0,0,0,0,0,0,0,0,0.0,0,0,8,20
327,Sassofeltrio,Rimini,Emilia-Romagna,https://elezioni.interno.gov.it/risultati/2024...,0,0,0,0,0,0,0,0,0.0,0,0,2,3
328,Talamello,Rimini,Emilia-Romagna,https://elezioni.interno.gov.it/risultati/2024...,0,0,0,0,0,0,0,0,0.0,0,0,1,1


In [21]:
df_data.to_csv('../output/risultati_er.csv', index=False, encoding='UTF-8-sig')