In [None]:
import pandas as pd
import matplotlib.pyplot as plt

## Armado del dataset

#### Votos validos

In [None]:
df = pd.read_csv('presidente_afirmativos.csv')

In [None]:
df.shape

In [None]:
df.columns

#### Mesas

In [None]:
mesas_df = df[['distrito_nombre', 'seccion_nombre', 'circuito_nombre', 'mesa_id', 'votos_cantidad']].groupby([
    'distrito_nombre', 'seccion_nombre', 'circuito_nombre', 'mesa_id'
]).sum().reset_index()

In [None]:
mesas_df.rename(columns = {'votos_cantidad': 'votos_mesa_total'}, inplace=True)

In [None]:
mesas_df = mesas_df[mesas_df['votos_mesa_total'] > 0]

In [None]:
df = pd.merge(df, mesas_df)

In [None]:
df['percentage'] = df['votos_cantidad'] / df['votos_mesa_total']

#### Ganadores por mesa

In [None]:
ganadores_por_mesa = df.sort_values('votos_cantidad', ascending=False).groupby(
    ['distrito_nombre', 'seccion_nombre', 'circuito_nombre', 'mesa_id'
]).first().reset_index()

#### Votos invalidos

In [None]:
invalidos = pd.read_csv('presidente_invalidos.csv')

In [None]:
invalidos.shape

In [None]:
invalidos['votos_tipo'].value_counts()

In [None]:
invalidos.head()

In [None]:
mesas_invalidos = invalidos.pivot(columns=['votos_tipo'], 
                index=[ 'distrito_nombre',
                        'seccion_nombre',
                        'circuito_nombre',
                        'mesa_id'],
               values='votos_cantidad').reset_index()

In [None]:
mesas_invalidos.head()

In [None]:
total_mesas = pd.merge(mesas_df, mesas_invalidos)

In [None]:
total_mesas['total_invalidos'] = total_mesas[
    ['COMANDO', 'IMPUGNADO', 'NULO', 'RECURRIDO']].sum(axis=1)

In [None]:
total_mesas['total_no_afirmativos'] = total_mesas[
    ['COMANDO', 'EN BLANCO', 'IMPUGNADO', 'NULO', 'RECURRIDO']].sum(axis=1)

In [None]:
main_df = pd.merge(total_mesas, ganadores_por_mesa)

In [None]:
main_df['invalidos_percentage'] = main_df['total_invalidos'] / main_df['votos_mesa_total']

#### Votos por agrupacion por mesa

In [None]:
votos_por_mesa = df.pivot(columns=['agrupacion_nombre'], 
                index=[ 'distrito_nombre',
                        'seccion_nombre',
                        'circuito_nombre',
                        'mesa_id'],
               values='votos_cantidad').reset_index()

In [None]:
votos_por_mesa = pd.merge(votos_por_mesa, total_mesas)

## Distribucion de mesas por % sacado

In [None]:
for a, a_df in df.groupby('agrupacion_nombre'):
    fig = plt.figure(figsize=(15, 8))
    plt.title(a)
    a_df['percentage'].hist(bins=100)

## Mesas con % de votos de un partido

In [None]:
set_percentage = 0.9

In [None]:
mesas_percentage = ganadores_por_mesa[ganadores_por_mesa['percentage'] >= set_percentage]

#### Cantidad de mesas por agrupacion

In [None]:
mesas_percentage['agrupacion_nombre'].value_counts()

In [None]:
mesas_percentage[mesas_percentage['agrupacion_nombre']=='UNION POR LA PATRIA'].sort_values(
    'percentage', ascending=False)

#### Cantidad de mesas por agrupacion y distrito

In [None]:
mesas_percentage[['agrupacion_nombre', 'distrito_nombre', 'votos_cantidad']].groupby(
    ['agrupacion_nombre', 'distrito_nombre']).count().sort_values(
    ['agrupacion_nombre', 'votos_cantidad'], ascending=False)

#### Cantidad de votos por agrupacion

In [None]:
mesas_percentage[['agrupacion_nombre', 'votos_cantidad']].groupby(
    'agrupacion_nombre').sum().sort_values('votos_cantidad', ascending=False)

#### Cantidad de mesas por agrupacion y distrito

In [None]:
mesas_percentage[['agrupacion_nombre', 'distrito_nombre', 'votos_cantidad']].groupby(
    ['agrupacion_nombre', 'distrito_nombre']).sum().sort_values(
    ['agrupacion_nombre', 'votos_cantidad'], ascending=False)

## Porcentaje de victoria

#### Total

In [None]:
percentage_dfs = []

In [None]:
for p, p_df in ganadores_por_mesa.groupby('agrupacion_nombre'):
    temp_df = p_df['percentage'].describe().to_frame()
    temp_df.columns = [p]
    percentage_dfs.append(temp_df.T)

In [None]:
pd.concat(percentage_dfs)

## Votos no validos

#### % de mesas sin invalidos por agrupacion ganadora

In [None]:
zero_invalidos = main_df[main_df['total_invalidos'] == 0].copy()

In [None]:
agrupacion_grp_sin = zero_invalidos['agrupacion_nombre'].value_counts().to_frame().reset_index()

In [None]:
agrupacion_grp_sin.columns = ['agrupacion_nombre', 'sin_invalidos']

In [None]:
agrupacion_grp_total = main_df['agrupacion_nombre'].value_counts().to_frame().reset_index()

In [None]:
agrupacion_grp_total.columns = ['agrupacion_nombre', 'total']

In [None]:
agrupaciones_ganadoras_invalidos = pd.merge(agrupacion_grp_sin, agrupacion_grp_total)

In [None]:
agrupaciones_ganadoras_invalidos['percentage'] = agrupaciones_ganadoras_invalidos[
    'sin_invalidos'] / agrupaciones_ganadoras_invalidos['total']

In [None]:
agrupaciones_ganadoras_invalidos.sort_values('percentage', ascending=False)

#### Mesas ganadores con mas invalidos por agrupacion

In [None]:
dfs = []

In [None]:
for p, p_df in main_df.groupby('agrupacion_nombre'):
    temp_df = p_df['invalidos_percentage'].describe().to_frame()
    temp_df.columns = [p]
    dfs.append(temp_df.T)

In [None]:
inv_dist_df = pd.concat(dfs)

In [None]:
inv_dist_df

In [None]:
for v in ['mean', '25%', '50%', '75%', 'max']:
    fig = plt.figure(figsize=(15, 8))
    plt.title(v)
    plot_df = inv_dist_df.sort_values(v)
    x_values = plot_df.index
    plt.bar(x_values, plot_df[v])

## Mesas con 0 votos

In [None]:
partido = 'LA LIBERTAD AVANZA'

In [None]:
zero_votos = votos_por_mesa[votos_por_mesa[partido] == 0]

In [None]:
zero_votos['total_invalidos'].value_counts()

In [None]:
zero_votos[zero_votos['total_invalidos']==96]