## Censo de Población y Vivienda 2020

Los datos se obtuvieron de la página https://www.inegi.org.mx/programas/ccpv/2020/#Tabulados el día 12 de Abril del 2022. Se encuentran en la sección Tabulados > Tabulados_predefinidos > Cuestionario basico > estatal/municipal > Educacion. Los datos fueron filtrados para Sonora en el sitio web.

Nombre del archivo de datos crudos: cpv2020_b_son_07_educacion.xlsx

Se generaron dos Datasets limpios

* datos_netos_analfabetismo.csv: Contiene un dataset con datos totales para cada municipio
* porcentajes_analfabetismo_municipio.csv : Contiene ya porcentajes para cada municipio (porcentajes totales, por sexo y edad, ideal para usar en mapa)

In [219]:
#Importando librerias necesarias
import pandas as pd
import pathlib

#Todo lo relacionado a graficar
import plotly.express as px


In [220]:
#Definiendo el Path del archivo
path = pathlib.Path('..', 'data_dir/cpv2020_b_son_07_educacion.xlsx')

In [221]:
#Leyendo los datos
censo_educacion =  pd.read_excel(path, header =6)

In [222]:
censo_educacion

Unnamed: 0.1,Unnamed: 0,Unnamed: 1,Tabulado,Subtema,Desglose,Título
0,,,1,Aptitud para leer y escribir,Tamaño de localidad,Población de 6 a 14 años por tamaño de localid...
1,,,2,Aptitud para leer y escribir,Municipio,"Población de 6 a 14 años por municipio, sexo y..."
2,,,3,Alfabetismo,Tamaño de localidad,Población de 15 años y más por tamaño de local...
3,,,4,Alfabetismo,Municipio,"Población de 15 años y más por municipio, sexo..."
4,,,5,Asistencia escolar,Tamaño de localidad,Población de 3 años y más por tamaño de locali...
5,,,6,Asistencia escolar,Municipio,"Población de 3 años y más por municipio, sexo ..."
6,,,7,Escolaridad,Tamaño de localidad,Población de 3 años y más por tamaño de locali...
7,,,8,Escolaridad,Municipio,"Población de 3 años y más por municipio, sexo ..."


In [223]:
#Observando la información que tiene cada página del excel
for index, row in censo_educacion.iterrows():
    print(row['Tabulado'], ' : ' , row['Título'])

1  :  Población de 6 a 14 años por tamaño de localidad, sexo y edad desplegada según aptitud para leer y escribir
2  :  Población de 6 a 14 años por municipio, sexo y edad desplegada según aptitud para leer y escribir
3  :  Población de 15 años y más por tamaño de localidad, sexo y grupos quinquenales de edad según condición de alfabetismo
4  :  Población de 15 años y más por municipio, sexo y grupos quinquenales de edad según condición de alfabetismo
5  :  Población de 3 años y más por tamaño de localidad, sexo y edad según condición de asistencia escolar
6  :  Población de 3 años y más por municipio, sexo y edad según condición de asistencia escolar
7  :  Población de 3 años y más por tamaño de localidad, sexo y grupos de edad según escolaridad, tipo educativo, nivel y grados aprobados
8  :  Población de 3 años y más por municipio, sexo y grupos de edad según escolaridad, tipo educativo, nivel y grados aprobados


In [224]:
#Primero empezaremos leyendo la página #2, ya que lo tiene por municipio
censo_educacion =  pd.read_excel(path, header =5, sheet_name='02')

### Limpieza de datos

In [225]:
censo_educacion

Unnamed: 0,Entidad federativa,Municipio,Sexo,Edad desplegada,Población de 6 a 14 años,Aptitud para leer y escribir,Unnamed: 6,Unnamed: 7
0,,,,,,Sabe leer y escribir,No sabe leer y escribir,No especificado
1,,,,,,,,
2,26 Sonora,Total,Total,Total,456421.0,408131,46085,2205
3,26 Sonora,Total,Total,06 años,48561.0,20955,27371,235
4,26 Sonora,Total,Total,07 años,49264.0,38445,10530,289
...,...,...,...,...,...,...,...,...
2181,26 Sonora,069 Yécora,Mujeres,10 años,51.0,48,3,0
2182,26 Sonora,069 Yécora,Mujeres,11 años,48.0,46,2,0
2183,26 Sonora,069 Yécora,Mujeres,12 años,43.0,43,0,0
2184,26 Sonora,069 Yécora,Mujeres,13 años,48.0,47,1,0


In [226]:
#Renombraremos columnas 
censo_educacion = censo_educacion.rename({'Aptitud para leer y escribir': 'Sabe leer y escribir',
                        'Unnamed: 6': 'No sabe leer y escribir',
                        'Unnamed: 7': 'No especificado'},axis= 1)
censo_educacion.head()

Unnamed: 0,Entidad federativa,Municipio,Sexo,Edad desplegada,Población de 6 a 14 años,Sabe leer y escribir,No sabe leer y escribir,No especificado
0,,,,,,Sabe leer y escribir,No sabe leer y escribir,No especificado
1,,,,,,,,
2,26 Sonora,Total,Total,Total,456421.0,408131,46085,2205
3,26 Sonora,Total,Total,06 años,48561.0,20955,27371,235
4,26 Sonora,Total,Total,07 años,49264.0,38445,10530,289


In [227]:
#Podemos remover las primeras dos filas 
censo_educacion.drop([0,1],axis=0,inplace=True)

In [228]:
#Debido a que ya sabemos que los datos son de Sonora, removeremos la columna de entidad federativa
censo_educacion.drop('Entidad federativa', axis=1, inplace=True)
censo_educacion

Unnamed: 0,Municipio,Sexo,Edad desplegada,Población de 6 a 14 años,Sabe leer y escribir,No sabe leer y escribir,No especificado
2,Total,Total,Total,456421.0,408131,46085,2205
3,Total,Total,06 años,48561.0,20955,27371,235
4,Total,Total,07 años,49264.0,38445,10530,289
5,Total,Total,08 años,51030.0,46386,4247,397
6,Total,Total,09 años,48775.0,46529,1887,359
...,...,...,...,...,...,...,...
2181,069 Yécora,Mujeres,10 años,51.0,48,3,0
2182,069 Yécora,Mujeres,11 años,48.0,46,2,0
2183,069 Yécora,Mujeres,12 años,43.0,43,0,0
2184,069 Yécora,Mujeres,13 años,48.0,47,1,0


In [229]:
#Confirmamos que los tipos de datos sean correctos
censo_educacion.dtypes

Municipio                    object
Sexo                         object
Edad desplegada              object
Población de 6 a 14 años    float64
Sabe leer y escribir         object
No sabe leer y escribir      object
No especificado              object
dtype: object

In [230]:
#Cambiamos las ultimas 3 columnas a entero
censo_educacion[['Sabe leer y escribir', 'No sabe leer y escribir', 'No especificado']] = censo_educacion[['Sabe leer y escribir', 'No sabe leer y escribir', 'No especificado']].astype('int64')
censo_educacion.dtypes

Municipio                    object
Sexo                         object
Edad desplegada              object
Población de 6 a 14 años    float64
Sabe leer y escribir          int64
No sabe leer y escribir       int64
No especificado               int64
dtype: object

In [231]:
#Vemos los valores únicos en Municipios
censo_educacion.Municipio.unique()

array(['Total', '001 Aconchi', '002 Agua Prieta', '003 Alamos',
       '004 Altar', '005 Arivechi', '006 Arizpe', '007 Atil',
       '008 Bacadéhuachi', '009 Bacanora', '010 Bacerac', '011 Bacoachi',
       '012 Bácum', '013 Banámichi', '014 Baviácora', '015 Bavispe',
       '071 Benito Juárez', '016 Benjamín Hill', '017 Caborca',
       '018 Cajeme', '019 Cananea', '020 Carbó', '022 Cucurpe',
       '023 Cumpas', '024 Divisaderos', '025 Empalme', '026 Etchojoa',
       '027 Fronteras', '070 General Plutarco Elías Calles',
       '028 Granados', '029 Guaymas', '030 Hermosillo', '031 Huachinera',
       '032 Huásabas', '033 Huatabampo', '034 Huépac', '035 Imuris',
       '021 La Colorada', '036 Magdalena', '037 Mazatán', '038 Moctezuma',
       '039 Naco', '040 Nácori Chico', '041 Nacozari de García',
       '042 Navojoa', '043 Nogales', '044 Onavas', '045 Opodepe',
       '046 Oquitoa', '047 Pitiquito', '048 Puerto Peñasco',
       '049 Quiriego', '050 Rayón', '051 Rosario', '052 Sahua

In [232]:
#Removeremos los primeros tres números
censo_educacion.Municipio = censo_educacion.Municipio.apply(lambda x: x[3:] if x != 'Total' else 'Total')
censo_educacion

Unnamed: 0,Municipio,Sexo,Edad desplegada,Población de 6 a 14 años,Sabe leer y escribir,No sabe leer y escribir,No especificado
2,Total,Total,Total,456421.0,408131,46085,2205
3,Total,Total,06 años,48561.0,20955,27371,235
4,Total,Total,07 años,49264.0,38445,10530,289
5,Total,Total,08 años,51030.0,46386,4247,397
6,Total,Total,09 años,48775.0,46529,1887,359
...,...,...,...,...,...,...,...
2181,Yécora,Mujeres,10 años,51.0,48,3,0
2182,Yécora,Mujeres,11 años,48.0,46,2,0
2183,Yécora,Mujeres,12 años,43.0,43,0,0
2184,Yécora,Mujeres,13 años,48.0,47,1,0


In [233]:
#Por ultimo, removeremos los espacios en blanco que quedaron en la columna Municipio
censo_educacion['Municipio'] = censo_educacion['Municipio'].str.strip()

In [234]:
#Por ultimo, debido a que Python nos permite hacer calculos de datos totales de manera muy sencilla, 
# removeremos los datos totales ya calculados
censo_educacion = censo_educacion[censo_educacion['Municipio'] != 'Total' ]
censo_educacion = censo_educacion[censo_educacion['Edad desplegada'] != 'Total']
censo_educacion = censo_educacion[censo_educacion['Sexo'] != 'Total']



In [235]:
#Listo, ya tenemos los datos para analizarlos
censo_educacion

Unnamed: 0,Municipio,Sexo,Edad desplegada,Población de 6 a 14 años,Sabe leer y escribir,No sabe leer y escribir,No especificado
43,Aconchi,Hombres,06 años,20.0,8,12,0
44,Aconchi,Hombres,07 años,23.0,18,5,0
45,Aconchi,Hombres,08 años,21.0,20,1,0
46,Aconchi,Hombres,09 años,18.0,17,1,0
47,Aconchi,Hombres,10 años,30.0,30,0,0
...,...,...,...,...,...,...,...
2181,Yécora,Mujeres,10 años,51.0,48,3,0
2182,Yécora,Mujeres,11 años,48.0,46,2,0
2183,Yécora,Mujeres,12 años,43.0,43,0,0
2184,Yécora,Mujeres,13 años,48.0,47,1,0


In [236]:
censo_educacion.to_csv('../data_clean/datos_netos_analfabetismo.csv')

### Análisis de Datos Exploratorio

In [237]:
#Primero empezaremos viendo el panorama general de todos los municipios de Sonora
dff = censo_educacion[['Sabe leer y escribir', 'No sabe leer y escribir', 'No especificado']].sum()
fig = px.bar(dff, x=dff.values, y=dff.index, orientation='h',title = 'Población Sonorense de 6 a 14 años desplegada según su aptitud para leer y escribir',
            labels = {'index':"",
                        "x": "Número de personas" })
fig.show()

In [238]:
#Primero empezaremos viendo el panorama general de todos los municipios de Sonora

dff = censo_educacion.groupby('Sexo')[['Sabe leer y escribir', 'No sabe leer y escribir', 'No especificado']].sum().reset_index()
dff = pd.melt(dff, value_vars=['Sabe leer y escribir', 'No sabe leer y escribir', 'No especificado'], id_vars=['Sexo'])
dff
fig = px.bar(dff, x='value', y='variable', color='Sexo', orientation='h',title = 'Población Sonorense de 6 a 14 años, por Sexo desplegada según su aptitud para leer y escribir',
            labels = {'variable':"",
                        "value": "Número de personas" })
fig.show()

In [239]:
#Ahora veremos por edad
dff = censo_educacion.groupby('Edad desplegada')[['Sabe leer y escribir', 'No sabe leer y escribir', 'No especificado']].sum().reset_index()
dff = pd.melt(dff, value_vars=['Sabe leer y escribir', 'No sabe leer y escribir', 'No especificado'], id_vars=['Edad desplegada'])
dff
fig = px.bar(dff, x='value', y='variable', color='Edad desplegada', orientation='h',title = 'Población Sonorense de 6 a 14 años, por Edad desplegada según su aptitud para leer y escribir',
            labels = {'variable':"",
                        "value": "Número de personas",
                        "Edad desplegada":"Edad" })
fig.show()

In [240]:
# Visto de otra forma
#Ahora veremos por edad
dff = censo_educacion.groupby('Edad desplegada')[['Sabe leer y escribir', 'No sabe leer y escribir', 'No especificado']].sum().reset_index()
dff = pd.melt(dff, value_vars=['Sabe leer y escribir', 'No sabe leer y escribir', 'No especificado'], id_vars=['Edad desplegada'])
dff
fig = px.bar(dff, y='value', x='Edad desplegada', color='variable', orientation='v',title = 'Población Sonorense de 6 a 14 años, por Edad desplegada según su aptitud para leer y escribir',
            labels = {'variable':"",
                        "value": "Número de personas",
                        "Edad desplegada":"Edad" })
fig.show()

In [241]:
# Ahora veremos si esto pasa para los distintos sexos
dff = censo_educacion[censo_educacion['Sexo'] == 'Mujeres']
dff = dff.groupby('Edad desplegada')[['Sabe leer y escribir', 'No sabe leer y escribir', 'No especificado']].sum().reset_index()
dff = pd.melt(dff, value_vars=['Sabe leer y escribir', 'No sabe leer y escribir', 'No especificado'], id_vars=['Edad desplegada'])
dff
fig = px.bar(dff, y='value', x='Edad desplegada', color='variable', orientation='v',title = 'Población Sonorense de 6 a 14 años (Mujeres), por Edad desplegada según su aptitud para leer y escribir',
            labels = {'variable':"",
                        "value": "Número de personas",
                        "Edad desplegada":"Edad" })
fig.show()

In [242]:
# Ahora veremos si esto pasa para los distintos sexos
dff = censo_educacion[censo_educacion['Sexo'] == 'Hombres']
dff = dff.groupby('Edad desplegada')[['Sabe leer y escribir', 'No sabe leer y escribir', 'No especificado']].sum().reset_index()
dff = pd.melt(dff, value_vars=['Sabe leer y escribir', 'No sabe leer y escribir', 'No especificado'], id_vars=['Edad desplegada'])
dff
fig = px.bar(dff, y='value', x='Edad desplegada', color='variable', orientation='v',
    title = 'Población Sonorense de 6 a 14 años (Hombres), por Edad desplegada según su aptitud para leer y escribir',
            labels = {'variable':"",
                        "value": "Número de personas",
                        "Edad desplegada":"Edad" })
fig.show()

### Análisis por Municipio

Teniendo los datos en este formato nos facilita el análisis, y podemos comparar entre todos los municipios en un mismo gráfico interactivo, y al pasar el mouse por la serie de tiempo, podemos ver cuales casos son los que destacan.

In [243]:
dff = censo_educacion
dff = dff.groupby(['Municipio','Edad desplegada']).sum()[['Sabe leer y escribir', 'No sabe leer y escribir', 'No especificado']].copy()
dff['total'] = dff.sum(axis=1)
dff['porcentaje_analfabetismo'] = (dff['No sabe leer y escribir'] / dff['total'] ) * 100
dff['porcentaje_lectura'] = (dff['Sabe leer y escribir'] / dff['total'] ) * 100
dff['porcentaje_no_especificado'] = (dff['No especificado'] / dff['total'] ) * 100
dff.reset_index(inplace=True)
dff = pd.melt(dff, id_vars=['Municipio','Edad desplegada'], value_vars=['porcentaje_analfabetismo'])

fig = px.line(dff, x="Edad desplegada", y="value", color='Municipio',
                 title="Porcentaje de Analfabetismo por Edad para cada Municipio",
                 labels={'value':"Porcentaje de Analfabetismo"})
fig.show()

Si quisieramos ver como está el comportamiento de el Porcentaje de analfabetismo para los 10 municipios con más habitantes de entre 6 y 14 años, podemos hacer lo siguiente:

In [244]:
top_10_habitantes = list(censo_educacion.groupby('Municipio')['Población de 6 a 14 años'].sum().sort_values(ascending=False)[:9].index)
dff = censo_educacion[censo_educacion.Municipio.isin(top_10_habitantes)]
dff = dff.groupby(['Municipio','Edad desplegada']).sum()[['Sabe leer y escribir', 'No sabe leer y escribir', 'No especificado']].copy()
dff['total'] = dff.sum(axis=1)
dff['porcentaje_analfabetismo'] = (dff['No sabe leer y escribir'] / dff['total'] ) * 100
dff['porcentaje_lectura'] = (dff['Sabe leer y escribir'] / dff['total'] ) * 100
dff['porcentaje_no_especificado'] = (dff['No especificado'] / dff['total'] ) * 100
dff.reset_index(inplace=True)
dff = pd.melt(dff, id_vars=['Municipio','Edad desplegada'], value_vars=['porcentaje_analfabetismo'])

fig = px.line(dff, x="Edad desplegada", y="value", color='Municipio',
                 title="Porcentaje de Analfabetismo por Edad para los 10 municipios con mayor población de 6-14 años",
                 labels={'value':"Porcentaje de Analfabetismo"})
fig.show()

Ahora, si lo que queremos es una lista de cuales son los principales municipios con mayor y menor porcentaje de Analfabetismo, podemos hacer lo siguiente

In [245]:
dff = censo_educacion
dff = dff.groupby(['Municipio']).sum()[['Sabe leer y escribir', 'No sabe leer y escribir', 'No especificado']].copy()
dff['total'] = dff.sum(axis=1)
dff['porcentaje_analfabetismo'] = (dff['No sabe leer y escribir'] / dff['total'] ) * 100
dff = dff['porcentaje_analfabetismo'].sort_values(ascending=False)[:10].sort_values()
fig = px.bar(dff, orientation='h', title='Muncipios de Sonora con Mayor porcentaje de Analfabetismo en personas de 6-14 años',
                labels={'value':"Porcentaje %",})
fig.layout.update(showlegend=False) 
fig.show()

In [246]:
dff = censo_educacion
dff = dff.groupby(['Municipio']).sum()[['Sabe leer y escribir', 'No sabe leer y escribir', 'No especificado']].copy()
dff['total'] = dff.sum(axis=1)
dff['porcentaje_analfabetismo'] = (dff['No sabe leer y escribir'] / dff['total'] ) * 100
dff = dff['porcentaje_analfabetismo'].sort_values(ascending=True)[:10].sort_values()
fig = px.bar(dff, orientation='h', title='Muncipios con Menor porcentaje de Analfabetismo en personas de 6-14 años',
                labels={'value':"Porcentaje %",})
fig.layout.update(showlegend=False) 
fig.show()

### Propuesta

Lo ideal sería hacer un mapa donde se ponga el porcentaje general para cada municipio, y se de la opcion tambien de ver porcentaje específico para cada grupo de edad, por lo que haremos un dataset que tenga en cada columna ya los valores que se vayan a usar para el mapa, y el indice sean los municipios

In [247]:
dff = censo_educacion
dff = dff.groupby(['Municipio']).sum()[['Sabe leer y escribir', 'No sabe leer y escribir', 'No especificado']].copy()
dff['total'] = dff.sum(axis=1)
dff['porcentaje_analfabetismo'] = (dff['No sabe leer y escribir'] / dff['total'] ) * 100
dff = dff.rename({'porcentaje_analfabetismo': 'porcentaje_analfabetismo_total'}, axis=1)
dataframe_analfabetismo = dff[['porcentaje_analfabetismo_total']].copy()

In [248]:
dataframe_analfabetismo

Unnamed: 0_level_0,porcentaje_analfabetismo_total
Municipio,Unnamed: 1_level_1
Aconchi,7.486631
Agua Prieta,11.160968
Alamos,11.556545
Altar,11.174785
Arivechi,5.464481
...,...
Tubutama,10.945274
Ures,8.635097
Villa Hidalgo,8.230453
Villa Pesqueira,10.317460


A este dataframe le agregaremos cada uno de los porcentajes totales tambien pero para cada sexo


In [249]:
dff = censo_educacion
dff = dff.groupby(['Municipio','Sexo']).sum()[['Sabe leer y escribir', 'No sabe leer y escribir', 'No especificado']].copy()
dff['total'] = dff.sum(axis=1)
dff['porcentaje_analfabetismo'] = (dff['No sabe leer y escribir'] / dff['total'] ) * 100
dff = dff['porcentaje_analfabetismo'].unstack(level=-1)
dff.rename_axis("",axis=1,inplace=True)
dff.columns
dff = dff.rename({'Hombres':'porcentaje_analfabetismo_hombres_total',
            'Mujeres' :'porcentaje_analfabetismo_mujeres_total'}, axis=1)
dff

Unnamed: 0_level_0,porcentaje_analfabetismo_hombres_total,porcentaje_analfabetismo_mujeres_total
Municipio,Unnamed: 1_level_1,Unnamed: 2_level_1
Aconchi,9.359606,5.263158
Agua Prieta,11.785892,10.513447
Alamos,11.490978,11.627907
Altar,11.353211,10.996564
Arivechi,5.617978,5.319149
...,...,...
Tubutama,15.454545,5.494505
Ures,9.876543,7.254902
Villa Hidalgo,11.627907,4.385965
Villa Pesqueira,11.842105,8.000000


Una vez teniendo esto, lo unimos al dataframe_analfabetismo

In [250]:
dataframe_analfabetismo = pd.concat([dataframe_analfabetismo,dff] , axis=1)


In [251]:
dataframe_analfabetismo.head()

Unnamed: 0_level_0,porcentaje_analfabetismo_total,porcentaje_analfabetismo_hombres_total,porcentaje_analfabetismo_mujeres_total
Municipio,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Aconchi,7.486631,9.359606,5.263158
Agua Prieta,11.160968,11.785892,10.513447
Alamos,11.556545,11.490978,11.627907
Altar,11.174785,11.353211,10.996564
Arivechi,5.464481,5.617978,5.319149


Por ultimo, agregaremos los datos por edad

In [252]:
censo_educacion

Unnamed: 0,Municipio,Sexo,Edad desplegada,Población de 6 a 14 años,Sabe leer y escribir,No sabe leer y escribir,No especificado
43,Aconchi,Hombres,06 años,20.0,8,12,0
44,Aconchi,Hombres,07 años,23.0,18,5,0
45,Aconchi,Hombres,08 años,21.0,20,1,0
46,Aconchi,Hombres,09 años,18.0,17,1,0
47,Aconchi,Hombres,10 años,30.0,30,0,0
...,...,...,...,...,...,...,...
2181,Yécora,Mujeres,10 años,51.0,48,3,0
2182,Yécora,Mujeres,11 años,48.0,46,2,0
2183,Yécora,Mujeres,12 años,43.0,43,0,0
2184,Yécora,Mujeres,13 años,48.0,47,1,0


In [253]:
dff = censo_educacion
dff = dff.groupby(['Municipio','Sexo','Edad desplegada']).sum()[['Sabe leer y escribir', 'No sabe leer y escribir', 'No especificado']].copy()
dff['total'] = dff.sum(axis=1)
dff['porcentaje_analfabetismo'] = (dff['No sabe leer y escribir'] / dff['total'] ) * 100
dff = dff['porcentaje_analfabetismo'].unstack(level=-1)
dff.rename_axis("",axis=1,inplace=True)
dff = dff.add_prefix('porcentaje analfabetismo ').unstack(level=-1)
dff

Unnamed: 0_level_0,porcentaje analfabetismo 06 años,porcentaje analfabetismo 06 años,porcentaje analfabetismo 07 años,porcentaje analfabetismo 07 años,porcentaje analfabetismo 08 años,porcentaje analfabetismo 08 años,porcentaje analfabetismo 09 años,porcentaje analfabetismo 09 años,porcentaje analfabetismo 10 años,porcentaje analfabetismo 10 años,porcentaje analfabetismo 11 años,porcentaje analfabetismo 11 años,porcentaje analfabetismo 12 años,porcentaje analfabetismo 12 años,porcentaje analfabetismo 13 años,porcentaje analfabetismo 13 años,porcentaje analfabetismo 14 años,porcentaje analfabetismo 14 años
Sexo,Hombres,Mujeres,Hombres,Mujeres,Hombres,Mujeres,Hombres,Mujeres,Hombres,Mujeres,Hombres,Mujeres,Hombres,Mujeres,Hombres,Mujeres,Hombres,Mujeres
Municipio,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2,Unnamed: 8_level_2,Unnamed: 9_level_2,Unnamed: 10_level_2,Unnamed: 11_level_2,Unnamed: 12_level_2,Unnamed: 13_level_2,Unnamed: 14_level_2,Unnamed: 15_level_2,Unnamed: 16_level_2,Unnamed: 17_level_2,Unnamed: 18_level_2
Aconchi,60.000000,50.000000,21.739130,11.111111,4.761905,13.333333,5.555556,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000
Agua Prieta,62.589074,57.471264,24.502618,21.612903,9.803922,8.312958,5.788177,3.221809,2.428256,1.744186,1.836969,0.245700,0.720906,0.446429,0.982533,0.110132,0.219298,0.000000
Alamos,61.504425,57.142857,26.609442,20.571429,9.442060,11.111111,2.100840,3.108808,1.276596,1.694915,0.000000,1.851852,1.515152,1.276596,2.531646,0.000000,0.431034,0.000000
Altar,54.945055,57.009346,22.222222,21.568627,13.829787,7.142857,8.791209,3.125000,0.000000,0.961538,4.255319,0.000000,0.847458,2.298851,0.952381,0.943396,0.000000,0.000000
Arivechi,50.000000,12.500000,0.000000,33.333333,5.555556,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
Tubutama,56.250000,37.500000,44.444444,20.000000,12.500000,0.000000,20.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000
Ures,63.636364,46.666667,21.052632,19.607843,8.163265,6.666667,5.660377,3.278689,0.000000,0.000000,1.388889,0.000000,1.351351,0.000000,0.000000,0.000000,0.000000,0.000000
Villa Hidalgo,69.230769,37.500000,30.000000,10.000000,10.526316,0.000000,16.666667,6.250000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000
Villa Pesqueira,66.666667,100.000000,0.000000,37.500000,14.285714,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000


In [254]:
dataframe_analfabetismo = pd.concat([dataframe_analfabetismo,dff] , axis=1)
dataframe_analfabetismo

Unnamed: 0_level_0,porcentaje_analfabetismo_total,porcentaje_analfabetismo_hombres_total,porcentaje_analfabetismo_mujeres_total,"(porcentaje analfabetismo 06 años, Hombres)","(porcentaje analfabetismo 06 años, Mujeres)","(porcentaje analfabetismo 07 años, Hombres)","(porcentaje analfabetismo 07 años, Mujeres)","(porcentaje analfabetismo 08 años, Hombres)","(porcentaje analfabetismo 08 años, Mujeres)","(porcentaje analfabetismo 09 años, Hombres)",...,"(porcentaje analfabetismo 10 años, Hombres)","(porcentaje analfabetismo 10 años, Mujeres)","(porcentaje analfabetismo 11 años, Hombres)","(porcentaje analfabetismo 11 años, Mujeres)","(porcentaje analfabetismo 12 años, Hombres)","(porcentaje analfabetismo 12 años, Mujeres)","(porcentaje analfabetismo 13 años, Hombres)","(porcentaje analfabetismo 13 años, Mujeres)","(porcentaje analfabetismo 14 años, Hombres)","(porcentaje analfabetismo 14 años, Mujeres)"
Municipio,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
Aconchi,7.486631,9.359606,5.263158,60.000000,50.000000,21.739130,11.111111,4.761905,13.333333,5.555556,...,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000
Agua Prieta,11.160968,11.785892,10.513447,62.589074,57.471264,24.502618,21.612903,9.803922,8.312958,5.788177,...,2.428256,1.744186,1.836969,0.245700,0.720906,0.446429,0.982533,0.110132,0.219298,0.000000
Alamos,11.556545,11.490978,11.627907,61.504425,57.142857,26.609442,20.571429,9.442060,11.111111,2.100840,...,1.276596,1.694915,0.000000,1.851852,1.515152,1.276596,2.531646,0.000000,0.431034,0.000000
Altar,11.174785,11.353211,10.996564,54.945055,57.009346,22.222222,21.568627,13.829787,7.142857,8.791209,...,0.000000,0.961538,4.255319,0.000000,0.847458,2.298851,0.952381,0.943396,0.000000,0.000000
Arivechi,5.464481,5.617978,5.319149,50.000000,12.500000,0.000000,33.333333,5.555556,0.000000,0.000000,...,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
Tubutama,10.945274,15.454545,5.494505,56.250000,37.500000,44.444444,20.000000,12.500000,0.000000,20.000000,...,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000
Ures,8.635097,9.876543,7.254902,63.636364,46.666667,21.052632,19.607843,8.163265,6.666667,5.660377,...,0.000000,0.000000,1.388889,0.000000,1.351351,0.000000,0.000000,0.000000,0.000000,0.000000
Villa Hidalgo,8.230453,11.627907,4.385965,69.230769,37.500000,30.000000,10.000000,10.526316,0.000000,16.666667,...,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000
Villa Pesqueira,10.317460,11.842105,8.000000,66.666667,100.000000,0.000000,37.500000,14.285714,0.000000,0.000000,...,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000


In [255]:
dataframe_analfabetismo.to_csv('../data_clean/porcentajes_analfabetismo_municipio.csv')