# ODD Data Processing for Maldonado

This cell performs the following tasks:
1. Imports necessary libraries (pandas and os)
2. Defines the path to the ODD data folder
3. Reads all Excel files in the folder
4. Combines data from all files into a single DataFrame
5. Filters the data for Maldonado
6. Saves the filtered data to a CSV file

The resulting DataFrame `maldonado_odd_data` contains all ODD data for Maldonado.

Note: This code includes error handling to catch and report any issues when reading Excel files.

In [2]:
import pandas as pd
import os

# Definir la ruta a la carpeta ODN
odd_folder = r'./ODD'

# Crear una lista para almacenar los datos de todos los archivos
all_data = []

# Recorrer todos los archivos en la carpeta ODD
for file_name in os.listdir(odd_folder):
    # Verificar si el archivo es un Excel moderno (xlsx)
    if file_name.endswith('.xlsx'):
        # Definir la ruta completa del archivo
        file_path = os.path.join(odd_folder, file_name)
        try:
            # Leer el archivo Excel, con el encabezado en la fila 9
            df = pd.read_excel(file_path, header=8, usecols='A:H')
            # Agregar los datos a la lista
            all_data.append(df)
        except Exception as e:
            print(f"Error leyendo el archivo {file_name}: {e}")

# Combinar todos los datos en un solo DataFrame
if all_data:
    combined_data = pd.concat(all_data, ignore_index=True)

    # Filtrar los datos donde la columna DEPTO es Montevideo
    maldonado_odd_data = combined_data[combined_data['DEPTO'] == 'Maldonado']

    # Mostrar los primeros registros del DataFrame filtrado
    print(maldonado_odd_data.head())

    # Guardar el DataFrame filtrado en un archivo CSV
    maldonado_odd_data.to_csv('maldonado_odd_dataset.csv', index=False)
else:
    print("No se encontraron datos válidos en los archivos Excel.")


          ACTO               CONVOCATORIA      DEPTO CIRCUITO SERIES  \
984 2024-06-30  Asamblea_Popular_-_O.D.D.  Maldonado       11    DAA   
985 2024-06-30  Asamblea_Popular_-_O.D.D.  Maldonado       12    DAA   
986 2024-06-30  Asamblea_Popular_-_O.D.D.  Maldonado       14    DAA   
987 2024-06-30  Asamblea_Popular_-_O.D.D.  Maldonado       24    DAA   
988 2024-06-30  Asamblea_Popular_-_O.D.D.  Maldonado       70    DAA   

        ESCRUTINIO  HOJA CNT_VOTOS  
984  Departamental  1326         3  
985  Departamental  1326         1  
986  Departamental  1326         2  
987  Departamental  1326         1  
988  Departamental  1326         1  


  combined_data = pd.concat(all_data, ignore_index=True)


# Data Cleaning and Transformation for Maldonado ODD Data

This cell performs the following tasks:
1. Renames the 'CONVOCATORIA' column to 'PARTIDO'
2. Defines a function to clean and format party names
3. Applies the cleaning function to the 'PARTIDO' column
4. Removes the 'ACTO' column if it exists
5. Displays the first few rows of the modified DataFrame

The resulting DataFrame `maldonado_odd_data` now has cleaned and standardized party names.

In [3]:
# Renombrar la columna 'CONVOCATORIA' a 'PARTIDO'
maldonado_odd_data.rename(columns={'CONVOCATORIA': 'PARTIDO'}, inplace=True)

# Función para modificar los valores de la columna 'PARTIDO'
def modificar_partido_odd(valor):
    # Separar el valor por '_-_' y tomar la primera parte
    partido = valor.split('_-_')[0]
    # Reemplazar '_' por espacios y agregar 'Partido' al inicio
    partido = partido.replace('_', ' ')
    # Eliminar el sufijo ' O.D.N.' si existe
    if 'O.D.D.' in partido:
        partido = partido.replace(' O.D.D.', '')
    return partido

# Aplicar la función a la columna 'PARTIDO'
maldonado_odd_data['PARTIDO'] = maldonado_odd_data['PARTIDO'].apply(modificar_partido_odd)

# Verificar si la columna 'ACTO' existe y eliminarla si es el caso
if 'ACTO' in maldonado_odd_data.columns:
    maldonado_odd_data.drop(columns=['ACTO'], inplace=True)

# Mostrar los primeros registros del DataFrame modificado
maldonado_odd_data.head()


A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  maldonado_odd_data.rename(columns={'CONVOCATORIA': 'PARTIDO'}, inplace=True)
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  maldonado_odd_data['PARTIDO'] = maldonado_odd_data['PARTIDO'].apply(modificar_partido_odd)
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  maldonado_odd_data.drop(columns=['ACTO'], inplace=True)


Unnamed: 0,PARTIDO,DEPTO,CIRCUITO,SERIES,ESCRUTINIO,HOJA,CNT_VOTOS
984,Asamblea Popular,Maldonado,11,DAA,Departamental,1326,3
985,Asamblea Popular,Maldonado,12,DAA,Departamental,1326,1
986,Asamblea Popular,Maldonado,14,DAA,Departamental,1326,2
987,Asamblea Popular,Maldonado,24,DAA,Departamental,1326,1
988,Asamblea Popular,Maldonado,70,DAA,Departamental,1326,1


# Save Modified ODD Dataset for Maldonado

This cell performs the following task:
1. Saves the modified `maldonado_odd_data` DataFrame to a CSV file named 'maldonado_odd_dataset_modificado.csv'

The resulting CSV file contains the cleaned and transformed ODD data for Maldonado, without including the index column.

In [4]:
maldonado_odd_data.to_csv('maldonado_odd_dataset_modificado.csv', index=False)

# Add Zone Information to ODD Data for Maldonado

This cell performs the following tasks:
1. Defines a dictionary mapping series to zones in Maldonado
2. Applies the mapping to add a 'ZONA' column to the ODD dataset
3. Displays the updated DataFrame
4. Saves the final DataFrame with zone information to a CSV file

The resulting CSV file 'maldonado_odd_dataset_con_zona.csv' contains the ODD data for Maldonado with added zone information.

In [5]:
# Diccionario de series y sus respectivas zonas
series_zonas = {
    'DAA': 'Maldonado Centro',
    'DAB': 'Punta del Este',
    'DAC': 'Los Ceibos',
    'DAF': 'Cerro Pelado',
    'DAH': 'Maldonado Nuevo',
    'DAJ': 'Las Delicias',
    'DBA': 'San Carlos',
    'DBD': 'Lavagna',
    'DBE': 'La Cuchilla',
    'DBF': 'Rodríguez Barrios',
    'DBG': 'Asturias',
    'DCA': 'Pan de Azúcar',
    'DCB': 'Piriápolis',
    'DCD': 'Gregorio Aznárez',
    'DCF': 'Estación Las Flores',
    'DCG': 'La Capuera',
    'DEF': 'Las Cañas',
    'DEH': 'Balneario Buenos Aires',
    'DFA': 'Aiguá',
    'DZZ': 'Maldonado Centro', # Placeholder mientras no sepa de donde es esta serie
    'DAD': 'Punta Ballena',
    'DAE': 'Pinares',
    'DAG': 'Hipódromo',
    'DAI': 'El Jaguel',
    'DAK': 'Cantegril',
    'DBC DDC': 'Carapé',
    'DDB': 'Guardia Vieja',
    'DEA': 'Garzón',
    'DED': 'La Barra',
    'DFB': 'Los Talas',
    'DEG': 'Faro José Ignacio',
    'DBB': 'Partido Norte',
    'DCE': 'Solís Arriba',
    'DDA': 'Mataojo',
    'DEA DEB': 'Garzón',
    'DEC': 'Garzón Abajo',
    'DEE': 'Rincón de José Ignacio',
    'DDD': 'Coronilla',
    'DCC': 'Sierras de Pan de Azúcar'
}

# Asignar la zona correspondiente a cada serie
maldonado_odd_data['ZONA'] = maldonado_odd_data['SERIES'].map(series_zonas)

print(maldonado_odd_data)

maldonado_odd_data.to_csv('maldonado_odd_dataset_con_zona.csv')

                      PARTIDO      DEPTO CIRCUITO SERIES     ESCRUTINIO  HOJA  \
984          Asamblea Popular  Maldonado       11    DAA  Departamental  1326   
985          Asamblea Popular  Maldonado       12    DAA  Departamental  1326   
986          Asamblea Popular  Maldonado       14    DAA  Departamental  1326   
987          Asamblea Popular  Maldonado       24    DAA  Departamental  1326   
988          Asamblea Popular  Maldonado       70    DAA  Departamental  1326   
...                       ...        ...      ...    ...            ...   ...   
219836  Partido de la Armonía  Maldonado      381    DEH  Departamental  1369   
219837  Partido de la Armonía  Maldonado      382    DEH  Departamental  1369   
219838  Partido de la Armonía  Maldonado      383    DEH  Departamental  1369   
219839  Partido de la Armonía  Maldonado      384    DEH  Departamental  1369   
219840  Partido de la Armonía  Maldonado     9000    DZZ  Departamental  1369   

       CNT_VOTOS           

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  maldonado_odd_data['ZONA'] = maldonado_odd_data['SERIES'].map(series_zonas)
