In [6]:
import pandas as pd

# Leer el archivo CSV especificando la codificación
df = pd.read_csv("urbanización_comunas.csv", encoding='windows-1252', sep=';')

# Ignorar la fila que contiene 'Unidad territorial', 'Variable', '2017'
df = df[df['Column1'] != 'Unidad territorial']

# Pivotar el DataFrame para reorganizar las variables como columnas
df_pivot = df.pivot(index='Column1', columns='Column2', values='Column3')

# Restaurar la columna de comunas desde el índice
df_pivot.reset_index(inplace=True)

# Verificar los nombres de las columnas después del pivot (opcional)
print("Nombres de las columnas después del pivot:")
print(df_pivot.columns)

# Ahora, ajusta los nombres de las columnas según sea necesario. Ejemplo:
# Si los nombres contienen espacios adicionales o caracteres especiales:
df_pivot.columns = df_pivot.columns.str.strip()  # Eliminar espacios en blanco

# Convertir las columnas 'Población zona Urbana', 'Población zona Rural', y 'Población total' a numérico
if 'Población zona Urbana' in df_pivot.columns:
    df_pivot['Población zona Urbana'] = pd.to_numeric(df_pivot['Población zona Urbana'], errors='coerce')
if 'Población zona Rural' in df_pivot.columns:
    df_pivot['Población zona Rural'] = pd.to_numeric(df_pivot['Población zona Rural'], errors='coerce')
if 'Población total' in df_pivot.columns:
    df_pivot['Población total'] = pd.to_numeric(df_pivot['Población total'], errors='coerce')

# Calcular nuevos porcentajes solo si las columnas de población están presentes
if 'Población zona Urbana' in df_pivot.columns and 'Población total' in df_pivot.columns:
    df_pivot['Porcentaje de población zona urbana'] = (df_pivot['Población zona Urbana'] / df_pivot['Población total']) * 100
if 'Población zona Rural' in df_pivot.columns and 'Población total' in df_pivot.columns:
    df_pivot['Porcentaje de población zona rural'] = (df_pivot['Población zona Rural'] / df_pivot['Población total']) * 100


# Guardar el nuevo DataFrame en un archivo CSV o imprimir el resultado
df_pivot.to_csv('urbanizacion_comunas.csv', index=False)

# Mostrar el DataFrame reorganizado
print(df_pivot.head())


Nombres de las columnas después del pivot:
Index(['Column1', ' Población total', ' Población zona Rural',
       ' Población zona Urbana', ' Porcentaje de población zona rural',
       ' Porcentaje de población zona urbana'],
      dtype='object', name='Column2')
Column2          Column1  Población total  Población zona Rural  \
0              Algarrobo           138170                 29180   
1                  Alhué            64440                 36600   
2            Alto Biobío            59230                 59230   
3        Alto Del Carmen            52990                 52990   
4          Alto Hospicio          1083750                 24910   

Column2  Población zona Urbana  Porcentaje de población zona rural  \
0                       108990                           21.118911   
1                        27840                           56.797020   
2                            0                          100.000000   
3                            0                       