<a href="https://colab.research.google.com/github/ghespinosa/iMMAPColombia/blob/master/LimpiezaDeMatrizAsentamientos_(V_actual).ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

**Lisa Troconis y Gustavo Espinosa** &emsp; &emsp; &emsp; &emsp; &emsp; &emsp; &emsp; &emsp; &emsp;   <img src= "https://i0.wp.com/immap.org/wp-content/uploads/2016/12/immap-logo-strap2.png?resize=300%2C45&ssl=1"> <br />
*Last updated: July 24th 2020*

# Limpieza de Matriz de Asentamientos

<br />

**GitHub Project Card:** https://github.com/ghespinosa/iMMAPColombia/projects/1#card-42450124


**OVERVIEW:** 
- Reads SuperMatrix dataframe and MasterDict dictionary
  - creates various sub-dictionaries to clean up the super matrix
- Encodes dummy variables for each of the reported elements (WASH only so far)
- Finds the most frequently reported response to polichotomous variables

**TO-DO:**
- Clean Matrix fully
    - uses if statements to turn old master matrix into new master matrix with easy to interpret values
    - clean Salud, SAN, Infraestructura/Multisector
    - check for mistakes manually

*See:* 
- https://github.com/ghespinosa/proyectoasentamiento
- https://docs.google.com/document/d/1ndzWfIIWBdPW4VuWG18oPgbHN-3HJlB4y4DSGqgr9WM/edit?usp=sharing

## Import Libraries and Data

In [None]:
# Import my Google Drive to be able to access files
from google.colab import drive
drive.mount('/content/drive')

# Import libraries
import pandas as pd
import pickle

import numpy as np

import math as mt

import matplotlib
import matplotlib.pyplot as plt

Go to this URL in a browser: https://accounts.google.com/o/oauth2/auth?client_id=947318989803-6bn6qk8qdgf4n4g3pfee6491hc0brc4i.apps.googleusercontent.com&redirect_uri=urn%3aietf%3awg%3aoauth%3a2.0%3aoob&response_type=code&scope=email%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdocs.test%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdrive%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdrive.photos.readonly%20https%3a%2f%2fwww.googleapis.com%2fauth%2fpeopleapi.readonly

Enter your authorization code:
··········
Mounted at /content/drive


In [None]:
# Load in the pickled Super Matrix that is stored in the Google Drive
SuperMatrix = pickle.load( open( '/content/drive/Shared drives/iMMAP Colombia/Equipo Datos/PREMISE/Asentamientos Nuevos/AnalisisDeAsentamientos (en Python)/SuperMatrix.p', "rb" ) )

In [None]:
# Load in the pickled Master Dictionary that is stored in the Google Drive
MasterDict = pickle.load( open( '/content/drive/Shared drives/iMMAP Colombia/Equipo Datos/PREMISE/Asentamientos Nuevos/AnalisisDeAsentamientos (en Python)/MasterDict.p', "rb" ) )

In [None]:
# Load in the cleaned up but un-merged validation and monitoring CSVs
validES = pickle.load( open( '/content/drive/Shared drives/iMMAP Colombia/Equipo Datos/PREMISE/Asentamientos Nuevos/AnalisisDeAsentamientos (en Python)/ValidES.p', "rb" ) )
monitES = pickle.load( open( '/content/drive/Shared drives/iMMAP Colombia/Equipo Datos/PREMISE/Asentamientos Nuevos/AnalisisDeAsentamientos (en Python)/MonitES.p', "rb" ) )

## Data Exploration and Dictionary Management

In [None]:
# Print some of the SuperMatrix
SuperMatrix.head(3) #look into why location_name is missing (probably because it was indexed and I dropped it)

Unnamed: 0_level_0,Departamento,Municipio,N° de Validaciones,N° de Monitoreos,N° de Respuestas Validación,N° de Respuestas Monitoreo,form_id,submission_id,locale,location_id,location_name,location_centroid,. Por favor tome una foto del asentamiento,. Por favor tome una foto del asentamiento desde un ángulo diferente,. ¿Existe un asentamiento en este punto?,. ¿Sabe desde hace cuanto comenzó el asentamiento?,. ¿Las calles están pavimentadas?,. Por favor tome una foto de una calle que muestre si está o no pavimentada,. Seleccione el aspecto de la comunidad que está reportando,. Díganos desde qué lugar esta reportando este elemento,. Por favor tome una foto del elemento que está reportando,. Por favor escriba en pocas palabras a qué se refiere con “otro” en la pregunta anterior.,. ¿El material de construcción de las viviendas parece ser improvisado?,. ¿Las casas tienen puertas?,. ¿De qué materiales están hechas las viviendas principalmente?,. Por favor tome una fotografía afuera de una vivienda o grupo de viviendas que nos permita entender mejor el tipo de material y cómo están construidas.,. ¿Sabe el nombre de este asentamiento?,. Por favor escriba el nombre de este asentamiento,. ¿Los residentes actuales del asentamiento son colombianos?,. Díganos desde qué lugar está reportando ete elemento,. Por favor tome una fotografía del elemento que está reportando,. Los establecimientos de venta de alimentos y abarrotes son en su mayoría:,. ¿Qué alimentos y abarrotes venden dentro del establecimiento?,. ¿Cuáles de los siguientes alimentos están disponibles dentro del establecimiento?,. La calidad de los alimentos ofertados es:,. Por favor tome una fotografía de un anaquel con algunos productos dentro de la tienda.,". ¿Cuántas cultivos, unidades agrícolas o pecuarias hay en este asentamiento?",. ¿Qué tipos de productos observa en los cultivos o en las unidades productivas identificadas?,. En términos generales ¿cómo son las condiciones de las viviendas?,. ¿Qué tipos de instalaciones públicas sanitarias existen para los habitantes del asentamiento?,. ¿ Cuántas construcciones (viviendas) nuevas percibe que hay?,". ¿El Asentamiento cuenta con algún espacio comunitario para la transformación adecuada de los productos alimenticios para consumo, como cocinas comunitarias o comedores?",. ¿Cuál es la capacidad de dichas cocinas comunitarias o comedores?,. ¿Cuánto tiempo requiere para acudir a la institución o centro de salud más cercana al asentamiento?,. ¿Cómo calificaría la calidad de la señal de celular en la zona?,. ¿Hay alguna institución de atención en salud de carácter internacional o nacional en el municipio cercano al asentamiento?,. ¿Cómo describiría el área en la que se encuentra el asentamiento?,. ¿Dentro del asentamiento se percibe gente adulta mayor?,. ¿Qué medidas observa se están implementando para prevenir o mitigar el COVID-?,. ¡Hemos terminado! Gracias por participar en esta tarea.
Asentamiento,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1,Unnamed: 25_level_1,Unnamed: 26_level_1,Unnamed: 27_level_1,Unnamed: 28_level_1,Unnamed: 29_level_1,Unnamed: 30_level_1,Unnamed: 31_level_1,Unnamed: 32_level_1,Unnamed: 33_level_1,Unnamed: 34_level_1,Unnamed: 35_level_1,Unnamed: 36_level_1,Unnamed: 37_level_1,Unnamed: 38_level_1,Unnamed: 39_level_1,Unnamed: 40_level_1,Unnamed: 41_level_1,Unnamed: 42_level_1,Unnamed: 43_level_1,Unnamed: 44_level_1,Unnamed: 45_level_1,Unnamed: 46_level_1,Unnamed: 47_level_1,Unnamed: 48_level_1,Unnamed: 49_level_1,Unnamed: 50_level_1
Alfonso Gomez,Norte de Santander,Cúcuta,6.0,6.0,180.0,354.0,"[6.68339E+15, 6.68339E+15, 6683389409361920, 6...","[4767148365053952, 5.49012E+15, 52135476029030...","[ES, ES, ES, ES, ES, ES]","[129468, 129468, 129523, 129523, 129523, 129468]",,"[7.9137219596446675,-72.545011018832511, 7.913...",[http://storage.googleapis.com/prod-premise-an...,[[http://storage.googleapis.com/prod-premise-a...,"[Si, Si, Si, Si, Si, Si]","[Entre 3 y 5 años, Entre 3 y 5 años, No estoy ...","[No, No, No, No, No, No]",[http://storage.googleapis.com/prod-premise-an...,"[[Recolección de agua de lluvia, Una vivienda ...","[[7.9117929,-72.5463268, 7.9118691,-72.5463518...",[[http://storage.googleapis.com/prod-premise-a...,"[[], [], [], [], [], []]","[Si, Si, Si, Si, Si, Si]","[Algunas de las casas tienen puertas, Si, toda...",[Madera | Latón | Metal corrugado | Lad...,[http://storage.googleapis.com/prod-premise-an...,"[Si, No, No, Si, Si, No]","[Alfonso Gómez 2, nan, nan, Alfonso Gomez, Alf...",[Hay una mezcla de residentes colombianos y re...,"[[7.9116735,-72.5454188, 7.9120141,-72.5461041...",[[http://storage.googleapis.com/prod-premise-a...,[[Pequeñas tiendas de barrio o negocio familia...,"[[Alimentos perecederos, procesados (Jugos y l...",[[Cereales y harinas | Carnes | Huevos |...,"[[Regular (presenta regular aspecto, comida a ...",[[http://storage.googleapis.com/prod-premise-a...,"[[De 1 a 3], [De 1 a 3], [De 1 a 3], [De 1 a 3...","[[Hortalizas de fruto comestible (berenjena, t...",[[Algunas viviendas NO se encuentran en buen e...,"[[], [Letrina], [], [], [Fosa séptica], []]","[[Entre 10 y 20], [Entre 10 y 20], [Entre 10 y...","[[No], [No], [No], [No], [De 1 a 3], [No]]","[nan, nan, nan, nan, Entre 20 y 50 personas, nan]",[En transporte público o automóvil más 30 minu...,"[Buena, Buena, Buena, Buena, Buena, Buena]","[Ninguna de las anteriores, Ninguna de las ant...","[Urbana, Urbana, Urbana, Urbana, Urbana, Urbana]","[Unos pocos, Unos pocos, Unos pocos, Unos poco...","[Ninguna, Ninguna, Distanciamiento Social, Dis...","[7.9123542,-72.5464926, 7.91221,-72.5454, 7.91..."
Arauca 1,Arauca,Arauca,1.0,0.0,33.0,,[5306469803360256],[4599512461213696],[ES],[129485],,"[7.0774010352701158,-70.738436922992321]",[http://storage.googleapis.com/prod-premise-an...,[[http://storage.googleapis.com/prod-premise-a...,[Si],[Hace no más de dos años],[No],[http://storage.googleapis.com/prod-premise-an...,"[[Salones comunales, Tiendas de comida, pequeñ...","[[7.0780825,-70.7392081, 7.0769614,-70.7388036...",[[http://storage.googleapis.com/prod-premise-a...,[[Puntillo Publico De Agua]],[Si],[Algunas de las casas tienen puertas],[Madera | Latón | Plástico corrugado | ...,[http://storage.googleapis.com/prod-premise-an...,[No],[nan],[Hay una mezcla de residentes colombianos y re...,,,,,,,,,,,,,,,,,,,,,
Arauca 6,Arauca,Arauca,1.0,0.0,23.0,,[5306469803360256],[5748402564628480],[ES],[129489],,"[7.0626514753507346,-70.742873367335321]",[http://storage.googleapis.com/prod-premise-an...,[[http://storage.googleapis.com/prod-premise-a...,[Si],[No estoy seguro],[No],[http://storage.googleapis.com/prod-premise-an...,[[Agua superficial (río o lago)]],"[[7.0634294,-70.7434624]]",[[http://storage.googleapis.com/prod-premise-a...,[[]],[Si],"[Si, todas las casas tienen puertas]",[Madera | Latón | Láminas de plástico |...,[http://storage.googleapis.com/prod-premise-an...,[No],[nan],[Hay una mezcla de residentes colombianos y re...,,,,,,,,,,,,,,,,,,,,,


In [None]:
# Print the original column names
for col in MasterDict.keys():
  print(col)

form_id
submission_id
locale
location_id
location_name
location_centroid
. Por favor tome una foto del asentamiento
. Por favor tome una foto del asentamiento desde un ángulo diferente
. ¿Existe un asentamiento en este punto?
. ¿Sabe desde hace cuanto comenzó el asentamiento?
. ¿Las calles están pavimentadas?
. Por favor tome una foto de una calle que muestre si está o no pavimentada
. Seleccione el aspecto de la comunidad que está reportando
. Díganos desde qué lugar esta reportando este elemento
. Por favor tome una foto del elemento que está reportando
. Por favor escriba en pocas palabras a qué se refiere con “otro” en la pregunta anterior.
. ¿El material de construcción de las viviendas parece ser improvisado?
. ¿Las casas tienen puertas?
. ¿De qué materiales están hechas las viviendas principalmente?
. Por favor tome una fotografía afuera de una vivienda o grupo de viviendas que nos permita entender mejor el tipo de material y cómo están construidas.
. ¿Sabe el nombre de este ase

In [None]:
# Using the Official Dictionary (https://docs.google.com/document/d/1ndzWfIIWBdPW4VuWG18oPgbHN-3HJlB4y4DSGqgr9WM/edit?usp=sharing),
  #match each original column name with the shorter variable name,
  #creating a new sub-dictionary for each group of variables, e.g. var_variable = {corto: [largo,largo]}
  #and under each group-level sub-dictionary, a variable-level glossary for polichotomous variables, e.g. dict_var = {largo:corto}

var_etiqueta = {'Asentamiento':'location_name',
                'Posible nombre':'. Por favor escriba el nombre de este asentamiento',
                'Coordenadas':'location_centroid',
                'Departamento':'Departamento',
                'Municipio':'Municipio'}

#General
var_gen = {'Existe':'. ¿Existe un asentamiento en este punto?',
           'Composición': '. ¿Los residentes actuales del asentamiento son colombianos?',
           'Tiempo de Conformación':'. ¿Sabe desde hace cuanto comenzó el asentamiento?',
           'Urbana/Rural': '. ¿Cómo describiría el área en la que se encuentra el asentamiento?'}

dict_exist = {} # no necesita
dict_comp = {'Hay una mezcla de residentes colombianos y residentes que vienen de otro país':'Mezcla indeterminada',
              'Si, hay más colombianos que residentes de otro país':'Mayoría colombiana',
              'No, hay más de otro país que colombianos':'Minoría colombiana',
              'No estoy seguro':'NS/NR'}
dict_conf = {'Hace no más de un año':'Menos de 1 año',
             'Hace no más de dos años':'1-2 años',
             'Entre 3 y 5 años':'3-5 años',
             'No estoy seguro':'NS/NR'}
dict_urbrur = {} # no necesita


#Salud
var_salud = {'Precauciones Covid-19':'. ¿Qué medidas observa se están implementando para prevenir o mitigar el COVID-?',
             'Presencia de gente adulta mayor':'. ¿Dentro del asentamiento se percibe gente adulta mayor?',
             'Centro de salud internacional o nacional':'. ¿Hay alguna institución de atención en salud de carácter internacional o nacional en el municipio cercano al asentamiento?',
             'Cercanía de un centro de salud':'. ¿Cuánto tiempo requiere para acudir a la institución o centro de salud más cercana al asentamiento?'}


dict_covid = {'Ninguna precaución':'',
             'Solo uso de tapabocas/guantes':'',
             'Solo distanciamiento social':'',
             'Ambas precauciones':''}
dict_mayor = {} # no necesita
dict_centro = {} # no necesita
dict_cercanía = {} # falta hacer


#SAN
var_SAN_elem = {'Tienda de comida':['Una tienda o establecimiento de venta de abarrotes dentro del asentamiento','Tiendas de comida, pequeños supermercados, o mercados'], 
                'Cultivo/jardin':['Cultivo, unidad agrícola o pecuaria','Un cultivo, o un jardín comunitario para auto-consumo o para la venta','Un lugar en donde se observa criado de ganado'],
                'Compostaje':['Espacios de compostaje de residuos de cocina']}

var_SAN_poli = {'Alimentos disponibles':['. ¿Qué alimentos y abarrotes venden dentro del establecimiento?', '. ¿Cuáles de los siguientes alimentos están disponibles dentro del establecimiento?'],
                'Tamaño de tienda de comida':['. Los establecimientos de venta de alimentos y abarrotes son en su mayoría:'],
                'Calidad de alimentos ofertados':['. La calidad de los alimentos ofertados es:'],
                'Comedor/cocina comunitaria':['. ¿El Asentamiento cuenta con algún espacio comunitario para la transformación adecuada de los productos alimenticios para consumo, como cocinas comunitarias o comedores?'],
                'Capacidad de cocinas comunitarias':['. ¿Cuál es la capacidad de dichas cocinas comunitarias o comedores?'],
                'Tipo de productos en cultivos':['. ¿Qué tipos de productos observa en los cultivos o en las unidades productivas identificadas?'],
                'N° de cultivos':['. ¿Cuántas cultivos, unidades agrícolas o pecuarias hay en este asentamiento?']}

dict_alim = {} # falta hacer
dict_tamaño = {} # falta hacer
dict_calidadalim = {} # falta hacer
dict_comed = {} # falta hacer
dict_capac = {} # falta hacer
dict_numerodecultivos = {} # falta hacer

#WASH

var_WASH = {'Acueducto':['Acueducto'], 
             'Agua estancada':['Agua estancada con criaderos de mosquitos o lugares donde pueden reproducirse'], 
             'Barril de agua':['Barril de agua en el exterior de una vivienda','Barriles de agua al frente de algunas viviendas'],
             'Bomba o pozo':['Bomba de funcionamiento de motor','Perforación o pozo con bomba de motor','Pozo abierto protegido'], 
             'Agua superficial':['Agua superficial (río o lago)'], 
             'Fuente de agua':['Llave de agua comunitaria','Llave de agua pública o comunal','Otra fuente pública de agua'],
             'Recolección de lluvia':['Recolección de agua de lluvia'],
             'Tuberías de agua':['Public_or_private_water_tubes_or_pipes', 'Tubería de agua pública o privada'] , 
             'Tuberías de agua negra':['Tubos de PVC que lleven aguas sucias hacia un sitio común', 'Tubos que llevan aguas negras hacia un sitio público'],
             'Vendedor de agua':['Vendedores de agua (carrotanques privados)'],
             'Instalación pública sanitaria':['Instalación pública sanitaria'],
             'Bote de basura':['Bote de basura visible desde el exterior de la vivienda']}
#Material

var_mat = {'Material':'. ¿De qué materiales están hechas las viviendas principalmente?'}

var_mat_elem = {'Plástico':['Plástico corrugado','Láminas de plástico'],
                'Metal':['Metal corrugado','Latón'],
                'Madera':['Madera'],
                'Ladrillo':['Ladrillo'],
                'Barro':['Barro']}

#Infraestructura

var_infr_elem = {'Alumbrado público':['Alumbrado público'],
                 'Andenes':['Andenes'],
                 'Salones comunales':['Salones comunales'],
                 'Señales de tránsito':['Señales de tránsito'],
                 'Nueva construcción':['Nueva construcción','Una vivienda o un desarrollo de viviendas'],
                 'Transporte público':['Parada de autobús'], # ,'Paradas de transporte público'], #because this variable is missing strangely from the elemento_matrix
                 'Parques':['Parques','Otros espacios de recreación social (kioskos, canchas de fútbol, etc.)'],
                 'Centro educativo':['Escuela o centro educativo'],
                 'Elemento de comunicación':['Elemento de información o comunicación (antenas de televisión en las viviendas, antenas de celulares,puestos de venta de periódicos o revistas)']}
           
var_infr_poli = {'Calidad de señal celular':['. ¿Cómo calificaría la calidad de la señal de celular en la zona?'],
                 'Calles pavimentadas':['. ¿Las calles están pavimentadas?'],
                 'Construcción improvisada':['. ¿El material de construcción de las viviendas parece ser improvisado?'],
                 'Puertas':['. ¿Las casas tienen puertas?'],
                 'Condición de las viviendas':['. En términos generales ¿cómo son las condiciones de las viviendas?'],
                 'N° de construcciones nuevas':['. ¿ Cuántas construcciones (viviendas) nuevas percibe que hay?']}
       
dict_calidcelu = {} # falta hacer
dict_calle = {} # no necesita
dict_improv = {} # falta hacer
dict_puert = {} # falta hacer
dict_condic = {} # falta hacer
dict_numerodeconstr = {} # falta hacer

### FindMode Function

In [None]:
# Define a function that takes the list/array of surveyor responses as an input
  #, and if there are multiple modes returns 'Mezcla indeterminada'
  #, otherwise if there is a single mode it returns the mode as the new_val

def FindMode(Responses):
  responses = Responses
  
  uq_responses = pd.unique(responses)

  a = []

  if (type(responses) == np.ndarray):
    responses = responses.tolist()

  for uq_res in uq_responses:
    a.append(responses.count(uq_res))

  m = max(a)

  idx = [i for i, j in enumerate(a) if j == m]
  idx

  if len(idx)>1:
    new_val = ('Mezcla indeterminada')
  else:
    most_freq = uq_responses[idx[0]]
    new_val = (most_freq)

  return new_val

## Pre-process SuperMatrix

In [None]:
#Prepare SuperMatrix for some specific variables that have different reliability methodologies

# Prepare for Precaucion Covid-19
for asen in SuperMatrix.index:

  values = str(SuperMatrix.loc[asen,'. ¿Qué medidas observa se están implementando para prevenir o mitigar el COVID-?'])

  if ('Distanciamiento Social' not in values) and (('guantes' not in values) or ('tapabocas' not in values)):
    new_val = [['Ninguna precuación']]
  elif ('Distanciamiento Social' in values) and (('guantes' not in values) or ('tapabocas' not in values)):
    new_val = [['Solo distanciamiento social']]
  elif (('guantes' in values) or ('tapabocas' in values)) and ('Distanciamiento Social' not in values):
    new_val = [['Solo uso de tapabocas/guantes']]
  elif (('guantes' in values) or ('tapabocas' in values)) and ('Distanciamiento Social' in values):
    new_val = [['Ambas precauciones']]
  else:
    new_val = 'Error: Condition not accounted for in If statements'
    print(asen +  ': Error: Condition not accounted for in If statements')
  
  SuperMatrix.loc[asen,'. ¿Qué medidas observa se están implementando para prevenir o mitigar el COVID-?'] = new_val

In [None]:
# Prepare for Centro de salud internacional o nacional

for asen in SuperMatrix.index:
  old_val = SuperMatrix.loc[asen,'. ¿Hay alguna institución de atención en salud de carácter internacional o nacional en el municipio cercano al asentamiento?']
  if type(old_val) != np.float:
    old_val = FindMode(old_val)
    if old_val == 'Ninguna de las anteriores':
      new_val = 'Ninguna'
    else:
      new_val = 'Si'
  elif (mt.isnan(old_val)):
    new_val = 'NS/NR'

  SuperMatrix.loc[asen,'. ¿Hay alguna institución de atención en salud de carácter internacional o nacional en el municipio cercano al asentamiento?'] = new_val

## Create an Element Matrix

In [None]:
# Create a matrix of elements

df3 = SuperMatrix[['Departamento','Municipio','. Seleccione el aspecto de la comunidad que está reportando']]

df3 = df3.rename(columns = {'. Seleccione el aspecto de la comunidad que está reportando' : 'Elemento'})

for asen in df3.index:
  lista = []
  for i in (df3.loc[asen,'Elemento']):
    for x in i:
      lista.append(x)
  
  lista_2 = str(lista).strip('[')
  lista_2 = lista_2.strip(']')
  df3.loc[asen,'Elemento'] = lista_2

df4 = df3.assign(Elemento = df3.Elemento.str.split('\', ')).explode('Elemento')

for i in range (0,len(df4)):
  df4.iloc[i,2] = df4.iloc[i,2].strip('\'')

dummies = pd.get_dummies(df4.Elemento)
df5 = pd.concat([df4,dummies],axis=1)

df5 = df5.reset_index(drop=False)

nueva_df5 = df5.groupby(['Asentamiento']).max()

#Subset the elements (make sure this includes all the elements)
nueva_df5 = nueva_df5[['Acueducto',
       'Agua estancada con criaderos de mosquitos o lugares donde pueden reproducirse',
       'Agua superficial (río o lago)', 'Alumbrado público', 'Andenes',
       'Barril de agua en el exterior de una vivienda',
       'Barriles de agua al frente de algunas viviendas',
       'Bomba de funcionamiento de motor',
       'Bote de basura visible desde el exterior de la vivienda',
       'Cultivo, unidad agrícola o pecuaria',
       'Elemento de información o comunicación (antenas de televisión en las viviendas, antenas de celulares,puestos de venta de periódicos o revistas)',
       'Escuela o centro educativo',
       'Espacios de compostaje de residuos de cocina',
       'Instalación pública sanitaria', 'Llave de agua comunitaria',
       'Llave de agua pública o comunal', 'Nueva construcción',
       'Otra fuente pública de agua',
       'Otros espacios de recreación social (kioskos, canchas de fútbol, etc.)',
       'Parada de autobús','Parques', 'Perforación o pozo con bomba de motor',
       'Pozo abierto protegido', 'Public_or_private_water_tubes_or_pipes',
       'Recolección de agua de lluvia', 'Salones comunales',
       'Señales de tránsito',
       'Tiendas de comida, pequeños supermercados, o mercados',
       'Tubería de agua pública o privada',
       'Tubos de PVC que lleven aguas sucias hacia un sitio común',
       'Tubos que llevan aguas negras hacia un sitio público',
       'Un cultivo, o un jardín comunitario para auto-consumo o para la venta',
       'Un lugar en donde se observa criado de ganado',
       'Una tienda o establecimiento de venta de abarrotes dentro del asentamiento',
       'Una vivienda o un desarrollo de viviendas',
       'Vendedores de agua (carrotanques privados)']]

#donde esta el elemento ['Paradas de transporte público'], sale en el MasterDict pero no aqui...

In [None]:
elemento_matrix = nueva_df5.copy()

elemento_matrix.head()

Unnamed: 0_level_0,Acueducto,Agua estancada con criaderos de mosquitos o lugares donde pueden reproducirse,Agua superficial (río o lago),Alumbrado público,Andenes,Barril de agua en el exterior de una vivienda,Barriles de agua al frente de algunas viviendas,Bomba de funcionamiento de motor,Bote de basura visible desde el exterior de la vivienda,"Cultivo, unidad agrícola o pecuaria","Elemento de información o comunicación (antenas de televisión en las viviendas, antenas de celulares,puestos de venta de periódicos o revistas)",Escuela o centro educativo,Espacios de compostaje de residuos de cocina,Instalación pública sanitaria,Llave de agua comunitaria,Llave de agua pública o comunal,Nueva construcción,Otra fuente pública de agua,"Otros espacios de recreación social (kioskos, canchas de fútbol, etc.)",Parada de autobús,Parques,Perforación o pozo con bomba de motor,Pozo abierto protegido,Public_or_private_water_tubes_or_pipes,Recolección de agua de lluvia,Salones comunales,Señales de tránsito,"Tiendas de comida, pequeños supermercados, o mercados",Tubería de agua pública o privada,Tubos de PVC que lleven aguas sucias hacia un sitio común,Tubos que llevan aguas negras hacia un sitio público,"Un cultivo, o un jardín comunitario para auto-consumo o para la venta",Un lugar en donde se observa criado de ganado,Una tienda o establecimiento de venta de abarrotes dentro del asentamiento,Una vivienda o un desarrollo de viviendas,Vendedores de agua (carrotanques privados)
Asentamiento,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1,Unnamed: 25_level_1,Unnamed: 26_level_1,Unnamed: 27_level_1,Unnamed: 28_level_1,Unnamed: 29_level_1,Unnamed: 30_level_1,Unnamed: 31_level_1,Unnamed: 32_level_1,Unnamed: 33_level_1,Unnamed: 34_level_1,Unnamed: 35_level_1,Unnamed: 36_level_1
Alfonso Gomez,1,1,0,0,0,1,0,0,1,1,1,0,0,1,1,0,1,0,0,1,0,0,0,0,1,0,0,0,0,0,0,0,0,1,1,0
Arauca 1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,1,0,0,0,0,0,0,0,0
Arauca 6,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
Arauca 7,0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,1,0,0,0,0,0,0,0,0
Arauquita 11,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0


## Create and Fill Clean Matrix

In [None]:
#Create a clean matrix with all the settlements and the first six columns
CleanMatrix = SuperMatrix[['Departamento','Municipio',	'N° de Validaciones',	'N° de Monitoreos',	'N° de Respuestas Validación',	'N° de Respuestas Monitoreo']]

### FillCleanMatrix 'Function'

In [None]:
# Define a function to automatically fill the clean matrix with 
  #the mode value in the super matrix, 'Mezcla Indeterminada', or 'NS/NR'

def FillMatrix(VarDict):
  for key in VarDict.keys():
    
    #initialize the old and new column names to iterate through a set of variables
    col_new = key
    col_org = VarDict.get(key)

    #create a new column with the new short column name
    CleanMatrix[col_new] = empty_col

    for asen in SuperMatrix.index:
      responses = SuperMatrix.loc[asen,col_org]

      #Check whether the value in the SuperMatrix is a np array/list or a missing value/float,
        #and if it is an array, make it a list and run the FindMode funciton, returning the mode or 'Mezcla indeterminada'
        #but if it is a float, 
      if ((type(responses)==np.ndarray)):
        responses = responses.tolist()
        new_val = FindMode(responses)
      elif (type(responses)== list):
        new_val = FindMode(responses)
      elif type(responses)== float:
        if (mt.isnan(responses)==True):
          new_val = 'NS/NR'
      else:
        print('ERROR: Type ' +str(type(responses))+ ' not handled by this function I made!')

      #shorten the entries manually or by loading in variable specific dictionaries
      if new_val == 'No estoy seguro':
        new_val = 'NS/NR'

      if new_val == 'Hay una mezcla de residentes colombianos y residentes que vienen de otro país':
        new_val = 'Mezcla indeterminada'

      for key in dict_conf:
        if new_val == key:
          new_val = dict_conf.get(key)

      for key in dict_comp:
        if new_val == key:
          new_val = dict_comp.get(key)

      CleanMatrix.loc[asen,col_new] = new_val

  # Why do I get an error prompting me to use .loc when I already am using it?

### CheckDictionary Function

In [None]:
def CheckElemDict(ElemDict):
  boooool = []

  for key in ElemDict:
    for col in ElemDict.get(key):
      b = col in elemento_matrix.columns.tolist()
      if b==False:
        print(str(b)+ ": " + col)
      boooool.append(b)
  print("Dictionary matches: " + str(all(boooool)))

### LongToShort Function

In [None]:
def LongToShort(ElemDict,ElemMat):
  for key in ElemDict:
    lista_de_largos = ElemDict.get(key)
    for largo in lista_de_largos:
      
      corto = key
      ElemMat = ElemMat.rename(columns = {largo : corto})
  return ElemMat

### GroupElem Function

In [None]:
#make a for loop that iterates through every key in the dictionary and every settlement and creates a cleaned element dataframe

def GroupElem(ElemDictDirty,ElemMat):
  d={}
  for key in ElemDictDirty.keys():
    d[key] = empty_col
  
  ElemDictClean = pd.DataFrame(index = ElemDictDirty.index,data=d)
  
  for key in ElemDictDirty.keys():
    for asen in ElemDictDirty.index:
      if type(ElemDictDirty.loc[asen,key].tolist()) == int: #If there is only one response, just grab the response
        val = ElemDictDirty.loc[asen,key]
      else: #But if there are more than one response (e.g. Barril de agua), assign the value a 1 if there is at least one 1 in the list
        if (ElemDictDirty.loc[asen,key].tolist().count(1) > 0):
          val = 1
        else:
          val = 0
      ElemDictClean.loc[asen,key] = val

  return ElemDictClean

### Variables de Etiqueta

In [None]:
var_etiqueta

{'Asentamiento': 'location_name',
 'Coordenadas': 'location_centroid',
 'Departamento': 'Departamento',
 'Municipio': 'Municipio',
 'Posible nombre': '. Por favor escriba el nombre de este asentamiento'}

In [None]:
# Coordenada

empty_col = (np.full(len(SuperMatrix), ''))

CleanMatrix['Coordenadas'] = empty_col

for i in range(0,len(SuperMatrix)):
  CleanMatrix.loc[CleanMatrix.index[i],'Coordenadas'] = SuperMatrix['location_centroid'][i][0]

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  """
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  self.obj[item] = s


### Variables generales

In [None]:
var_gen

{'Composición': '. ¿Los residentes actuales del asentamiento son colombianos?',
 'Existe': '. ¿Existe un asentamiento en este punto?',
 'Tiempo de Conformación': '. ¿Sabe desde hace cuanto comenzó el asentamiento?',
 'Urbana/Rural': '. ¿Cómo describiría el área en la que se encuentra el asentamiento?'}

In [None]:
FillMatrix(var_gen)

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  if sys.path[0] == '':
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  self.obj[item] = s


In [None]:
CleanMatrix['Existe'].unique()
CleanMatrix['Tiempo de Conformación'].unique()
CleanMatrix['Composición'].unique()
CleanMatrix['Urbana/Rural'].unique()

array(['Urbana', 'NS/NR', 'Rural', 'Periurbana', 'Mezcla indeterminada'],
      dtype=object)

In [None]:
CleanMatrix

Unnamed: 0_level_0,Departamento,Municipio,N° de Validaciones,N° de Monitoreos,N° de Respuestas Validación,N° de Respuestas Monitoreo,Coordenadas,Existe,Composición,Tiempo de Conformación,Urbana/Rural
Asentamiento,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
Alfonso Gomez,Norte de Santander,Cúcuta,6.0,6.0,180.0,354.0,"7.9137219596446675,-72.545011018832511",Si,Mezcla indeterminada,Mezcla indeterminada,Urbana
Arauca 1,Arauca,Arauca,1.0,0.0,33.0,,"7.0774010352701158,-70.738436922992321",Si,Mezcla indeterminada,1-2 años,NS/NR
Arauca 6,Arauca,Arauca,1.0,0.0,23.0,,"7.0626514753507346,-70.742873367335321",Si,Mezcla indeterminada,NS/NR,NS/NR
Arauca 7,Arauca,Arauca,1.0,0.0,37.0,,"7.0801870927625581,-70.735573158824",Si,Mezcla indeterminada,1-2 años,NS/NR
Arauquita 11,Arauca,,1.0,0.0,20.0,,"7.0248856195254463,-71.4326067861188",Si,Mezcla indeterminada,3-5 años,NS/NR
...,...,...,...,...,...,...,...,...,...,...,...
Uribia-2,La Guajira,,3.0,3.0,153.0,456.0,"11.734834066402694,-72.2672915671383",Si,Minoría colombiana,3-5 años,Periurbana
Uribia-3,La Guajira,,3.0,3.0,129.0,488.0,"11.713913623825952,-72.2827792763549",Si,Minoría colombiana,3-5 años,Periurbana
Uribia-4,La Guajira,,3.0,3.0,129.0,464.0,"11.718180248231935,-72.292290748378363",Si,Mayoría colombiana,3-5 años,Periurbana
Uribia-5,La Guajira,,3.0,0.0,136.0,,"11.705499001367256,-72.26079557354474",Si,Mezcla indeterminada,3-5 años,NS/NR


### Variables de Salud

In [None]:
# Call relevant dictionaries
var_salud

dict_covid #I definitely have to update this dictionary
#dict_mayor



{'Ambas precauciones': '',
 'Ninguna precaución': '',
 'Solo distanciamiento social': '',
 'Solo uso de tapabocas/guantes': ''}

In [None]:
FillMatrix(var_salud) # Fix errors with string class type...

ERROR: Type <class 'str'> not handled by this function I made!
ERROR: Type <class 'str'> not handled by this function I made!
ERROR: Type <class 'str'> not handled by this function I made!
ERROR: Type <class 'str'> not handled by this function I made!
ERROR: Type <class 'str'> not handled by this function I made!
ERROR: Type <class 'str'> not handled by this function I made!
ERROR: Type <class 'str'> not handled by this function I made!
ERROR: Type <class 'str'> not handled by this function I made!
ERROR: Type <class 'str'> not handled by this function I made!
ERROR: Type <class 'str'> not handled by this function I made!
ERROR: Type <class 'str'> not handled by this function I made!
ERROR: Type <class 'str'> not handled by this function I made!
ERROR: Type <class 'str'> not handled by this function I made!
ERROR: Type <class 'str'> not handled by this function I made!
ERROR: Type <class 'str'> not handled by this function I made!
ERROR: Type <class 'str'> not handled by this function 

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  if sys.path[0] == '':
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  self.obj[item] = s


In [None]:
# Clean up Centro de salud internacional o nacional

for asen in CleanMatrix.index:

  old_val = str(CleanMatrix.loc[asen,'Centro de salud internacional o nacional'])

  if old_val == 'Ninguna de las anteriores':
    new_val = 'Ninguna'
  elif old_val == 'NS/NR':
    new_val = old_val
  elif old_val == 'Mezcla indeterminada':
    new_val = old_val
  else:
    new_val = 'Si'

  CleanMatrix.loc[asen,'Centro de salud internacional o nacional'] = new_val

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  self.obj[item] = s


In [None]:
# Manually set the Clean Matrix 'centro de salud' column to match the corresponding prepped Super Matrix column

CleanMatrix['Centro de salud internacional o nacional'] = SuperMatrix['. ¿Hay alguna institución de atención en salud de carácter internacional o nacional en el municipio cercano al asentamiento?']

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  This is separate from the ipykernel package so we can avoid doing imports until


In [None]:
#CleanMatrix['Precauciones Covid-19'].unique()
#CleanMatrix['Presencia de gente adulta mayor'].unique()
#CleanMatrix['Centro de salud internacional o nacional'].unique() 
#CleanMatrix['Cercanía de un centro de salud'].unique()
#CleanMatrix

### Variables de SAN

In [None]:
#Display SAN dictionaries

print(var_SAN_elem)
print(var_SAN_poli)

{'Tienda de comida': ['Una tienda o establecimiento de venta de abarrotes dentro del asentamiento', 'Tiendas de comida, pequeños supermercados, o mercados'], 'Cultivo/jardin': ['Cultivo, unidad agrícola o pecuaria', 'Un cultivo, o un jardín comunitario para auto-consumo o para la venta', 'Un lugar en donde se observa criado de ganado'], 'Compostaje': ['Espacios de compostaje de residuos de cocina']}
{'Alimentos disponibles': ['. ¿Qué alimentos y abarrotes venden dentro del establecimiento?', '. ¿Cuáles de los siguientes alimentos están disponibles dentro del establecimiento?'], 'Tamaño de tienda de comida': ['. Los establecimientos de venta de alimentos y abarrotes son en su mayoría:'], 'Calidad de alimentos ofertados': ['. La calidad de los alimentos ofertados es:'], 'Comedor/cocina comunitaria': ['. ¿El Asentamiento cuenta con algún espacio comunitario para la transformación adecuada de los productos alimenticios para consumo, como cocinas comunitarias o comedores?'], 'Capacidad de c

In [None]:
# Check if the dictionary matches the original element names
CheckElemDict(var_SAN_elem)

Dictionary matches: True


In [None]:
#Shorten the names and prep for combining
elemento_matrix = LongToShort(var_SAN_elem,elemento_matrix)

elemento_matrix.head()

Unnamed: 0_level_0,Acueducto,Agua estancada con criaderos de mosquitos o lugares donde pueden reproducirse,Agua superficial (río o lago),Alumbrado público,Andenes,Barril de agua en el exterior de una vivienda,Barriles de agua al frente de algunas viviendas,Bomba de funcionamiento de motor,Bote de basura visible desde el exterior de la vivienda,Cultivo/jardin,"Elemento de información o comunicación (antenas de televisión en las viviendas, antenas de celulares,puestos de venta de periódicos o revistas)",Escuela o centro educativo,Compostaje,Instalación pública sanitaria,Llave de agua comunitaria,Llave de agua pública o comunal,Nueva construcción,Otra fuente pública de agua,"Otros espacios de recreación social (kioskos, canchas de fútbol, etc.)",Parada de autobús,Parques,Perforación o pozo con bomba de motor,Pozo abierto protegido,Public_or_private_water_tubes_or_pipes,Recolección de agua de lluvia,Salones comunales,Señales de tránsito,Tienda de comida,Tubería de agua pública o privada,Tubos de PVC que lleven aguas sucias hacia un sitio común,Tubos que llevan aguas negras hacia un sitio público,Cultivo/jardin,Cultivo/jardin,Tienda de comida,Una vivienda o un desarrollo de viviendas,Vendedores de agua (carrotanques privados)
Asentamiento,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1,Unnamed: 25_level_1,Unnamed: 26_level_1,Unnamed: 27_level_1,Unnamed: 28_level_1,Unnamed: 29_level_1,Unnamed: 30_level_1,Unnamed: 31_level_1,Unnamed: 32_level_1,Unnamed: 33_level_1,Unnamed: 34_level_1,Unnamed: 35_level_1,Unnamed: 36_level_1
Alfonso Gomez,1,1,0,0,0,1,0,0,1,1,1,0,0,1,1,0,1,0,0,1,0,0,0,0,1,0,0,0,0,0,0,0,0,1,1,0
Arauca 1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,1,0,0,0,0,0,0,0,0
Arauca 6,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
Arauca 7,0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,1,0,0,0,0,0,0,0,0
Arauquita 11,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0


In [None]:
#Take the element matrix, subset the SAN elements and store in a separate matrix

SAN_matrix = elemento_matrix[list(var_SAN_elem.keys())]

SAN_matrix.head()

Unnamed: 0_level_0,Tienda de comida,Tienda de comida,Cultivo/jardin,Cultivo/jardin,Cultivo/jardin,Compostaje
Asentamiento,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
Alfonso Gomez,0,1,1,0,0,0
Arauca 1,1,0,0,0,0,0
Arauca 6,0,0,0,0,0,0
Arauca 7,1,0,0,0,0,0
Arauquita 11,0,0,0,0,0,0


In [None]:
SAN_matrix = GroupElem(SAN_matrix,elemento_matrix)

SAN_matrix

Unnamed: 0_level_0,Tienda de comida,Cultivo/jardin,Compostaje
Asentamiento,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Alfonso Gomez,1,1,0
Arauca 1,1,0,0
Arauca 6,0,0,0
Arauca 7,1,0,0
Arauquita 11,0,0,0
...,...,...,...
Uribia-2,0,1,0
Uribia-3,0,1,0
Uribia-4,0,1,0
Uribia-5,0,0,0


In [None]:
CleanMatrix = pd.concat([CleanMatrix,SAN_matrix],axis = 1)
CleanMatrix.head(3)

Unnamed: 0_level_0,Departamento,Municipio,N° de Validaciones,N° de Monitoreos,N° de Respuestas Validación,N° de Respuestas Monitoreo,Coordenadas,Existe,Composición,Tiempo de Conformación,Urbana/Rural,Precauciones Covid-19,Presencia de gente adulta mayor,Centro de salud internacional o nacional,Cercanía de un centro de salud,Tienda de comida,Cultivo/jardin,Compostaje
Asentamiento,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1
Alfonso Gomez,Norte de Santander,Cúcuta,6.0,6.0,180.0,354.0,"7.9137219596446675,-72.545011018832511",Si,Mezcla indeterminada,Mezcla indeterminada,Urbana,Ambas precauciones,Unos pocos,Ninguna,En transporte público o automóvilmás de una hora,1,1,0
Arauca 1,Arauca,Arauca,1.0,0.0,33.0,,"7.0774010352701158,-70.738436922992321",Si,Mezcla indeterminada,1-2 años,NS/NR,Ninguna precuación,NS/NR,NS/NR,NS/NR,1,0,0
Arauca 6,Arauca,Arauca,1.0,0.0,23.0,,"7.0626514753507346,-70.742873367335321",Si,Mezcla indeterminada,NS/NR,NS/NR,Ninguna precuación,NS/NR,NS/NR,NS/NR,0,0,0


In [None]:
# FillMatrix(var_SAN_poli) # how to find out what the error is here

### Variables de WASH

In [None]:
#Display WASH dictionary
var_WASH

{'Acueducto': ['Acueducto'],
 'Agua estancada': ['Agua estancada con criaderos de mosquitos o lugares donde pueden reproducirse'],
 'Agua superficial': ['Agua superficial (río o lago)'],
 'Barril de agua': ['Barril de agua en el exterior de una vivienda',
  'Barriles de agua al frente de algunas viviendas'],
 'Bomba o pozo': ['Bomba de funcionamiento de motor',
  'Perforación o pozo con bomba de motor',
  'Pozo abierto protegido'],
 'Bote de basura': ['Bote de basura visible desde el exterior de la vivienda'],
 'Fuente de agua': ['Llave de agua comunitaria',
  'Llave de agua pública o comunal',
  'Otra fuente pública de agua'],
 'Instalación pública sanitaria': ['Instalación pública sanitaria'],
 'Recolección de lluvia': ['Recolección de agua de lluvia'],
 'Tuberías de agua': ['Public_or_private_water_tubes_or_pipes',
  'Tubería de agua pública o privada'],
 'Tuberías de agua negra': ['Tubos de PVC que lleven aguas sucias hacia un sitio común',
  'Tubos que llevan aguas negras hacia un

In [None]:
# Check if the dictionary matches the original element names
CheckElemDict(var_WASH)

Dictionary matches: True


In [None]:
#Shorten the names and prep for combining
elemento_matrix = LongToShort(var_WASH,elemento_matrix)

elemento_matrix.head()

Unnamed: 0_level_0,Acueducto,Agua estancada,Agua superficial,Alumbrado público,Andenes,Barril de agua,Barril de agua,Bomba o pozo,Bote de basura,Cultivo/jardin,"Elemento de información o comunicación (antenas de televisión en las viviendas, antenas de celulares,puestos de venta de periódicos o revistas)",Escuela o centro educativo,Compostaje,Instalación pública sanitaria,Fuente de agua,Fuente de agua,Nueva construcción,Fuente de agua,"Otros espacios de recreación social (kioskos, canchas de fútbol, etc.)",Parada de autobús,Parques,Bomba o pozo,Bomba o pozo,Tuberías de agua,Recolección de lluvia,Salones comunales,Señales de tránsito,Tienda de comida,Tuberías de agua,Tuberías de agua negra,Tuberías de agua negra,Cultivo/jardin,Cultivo/jardin,Tienda de comida,Una vivienda o un desarrollo de viviendas,Vendedor de agua
Asentamiento,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1,Unnamed: 25_level_1,Unnamed: 26_level_1,Unnamed: 27_level_1,Unnamed: 28_level_1,Unnamed: 29_level_1,Unnamed: 30_level_1,Unnamed: 31_level_1,Unnamed: 32_level_1,Unnamed: 33_level_1,Unnamed: 34_level_1,Unnamed: 35_level_1,Unnamed: 36_level_1
Alfonso Gomez,1,1,0,0,0,1,0,0,1,1,1,0,0,1,1,0,1,0,0,1,0,0,0,0,1,0,0,0,0,0,0,0,0,1,1,0
Arauca 1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,1,0,0,0,0,0,0,0,0
Arauca 6,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
Arauca 7,0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,1,0,0,0,0,0,0,0,0
Arauquita 11,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0


In [None]:
#Take the elment matrix, subset the WASH elements and store in a separate matrix

wash_matrix = elemento_matrix[list(var_WASH.keys())]

wash_matrix.head()

Unnamed: 0_level_0,Acueducto,Agua estancada,Barril de agua,Barril de agua,Bomba o pozo,Bomba o pozo,Bomba o pozo,Agua superficial,Fuente de agua,Fuente de agua,Fuente de agua,Recolección de lluvia,Tuberías de agua,Tuberías de agua,Tuberías de agua negra,Tuberías de agua negra,Vendedor de agua,Instalación pública sanitaria,Bote de basura
Asentamiento,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1
Alfonso Gomez,1,1,1,0,0,0,0,0,1,0,0,1,0,0,0,0,0,1,1
Arauca 1,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0
Arauca 6,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0
Arauca 7,0,0,0,0,0,0,0,1,0,0,1,0,0,0,0,0,0,0,0
Arauquita 11,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0


In [None]:
wash_matrix = GroupElem(wash_matrix,elemento_matrix)

In [None]:
# Concatenate WASH matrix to the clean matrix

CleanMatrix = pd.concat([CleanMatrix,wash_matrix],axis = 1)
CleanMatrix.head(3)

Unnamed: 0_level_0,Departamento,Municipio,N° de Validaciones,N° de Monitoreos,N° de Respuestas Validación,N° de Respuestas Monitoreo,Coordenadas,Existe,Composición,Tiempo de Conformación,Urbana/Rural,Precauciones Covid-19,Presencia de gente adulta mayor,Centro de salud internacional o nacional,Cercanía de un centro de salud,Tienda de comida,Cultivo/jardin,Compostaje,Acueducto,Agua estancada,Barril de agua,Bomba o pozo,Agua superficial,Fuente de agua,Recolección de lluvia,Tuberías de agua,Tuberías de agua negra,Vendedor de agua,Instalación pública sanitaria,Bote de basura
Asentamiento,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1,Unnamed: 25_level_1,Unnamed: 26_level_1,Unnamed: 27_level_1,Unnamed: 28_level_1,Unnamed: 29_level_1,Unnamed: 30_level_1
Alfonso Gomez,Norte de Santander,Cúcuta,6.0,6.0,180.0,354.0,"7.9137219596446675,-72.545011018832511",Si,Mezcla indeterminada,Mezcla indeterminada,Urbana,Ambas precauciones,Unos pocos,Ninguna,En transporte público o automóvilmás de una hora,1,1,0,1,1,1,0,0,1,1,0,0,0,1,1
Arauca 1,Arauca,Arauca,1.0,0.0,33.0,,"7.0774010352701158,-70.738436922992321",Si,Mezcla indeterminada,1-2 años,NS/NR,Ninguna precuación,NS/NR,NS/NR,NS/NR,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0
Arauca 6,Arauca,Arauca,1.0,0.0,23.0,,"7.0626514753507346,-70.742873367335321",Si,Mezcla indeterminada,NS/NR,NS/NR,Ninguna precuación,NS/NR,NS/NR,NS/NR,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0


### Variables de Material

In [None]:
## Identify unique materials
lol = []
for x in range(0,len(validES['. ¿De qué materiales están hechas las viviendas principalmente?'])):
  mat = validES['. ¿De qué materiales están hechas las viviendas principalmente?'][x]
  
  if type(mat) != np.float:
    mat = mat.split(' | ')
    for i in range(0,len(mat)):
      mat[i] = mat[i].strip(' ')
    lol.append(mat)

uq_lol = []
for bundle in lol:
  for item in bundle:
    if uq_lol.count(item) == 0:
      uq_lol.append(item)

uq_lol

['Madera',
 'Latón',
 'Metal corrugado',
 'Ladrillo',
 'Plástico corrugado',
 'Láminas de plástico',
 'Barro']

In [None]:
# Do something similar to fill CleanMatrix material columns with 1s and 0s for each of the 5 main materials

### Variables de Infraestructura

In [None]:
#Display Infraestructura dictionaries

print(var_infr_elem)
print(var_infr_poli)

{'Alumbrado público': ['Alumbrado público'], 'Andenes': ['Andenes'], 'Salones comunales': ['Salones comunales'], 'Señales de tránsito': ['Señales de tránsito'], 'Nueva construcción': ['Nueva construcción', 'Una vivienda o un desarrollo de viviendas'], 'Transporte público': ['Parada de autobús', 'Paradas de transporte público'], 'Parques': ['Parques', 'Otros espacios de recreación social (kioskos, canchas de fútbol, etc.)'], 'Centro educativo': ['Escuela o centro educativo'], 'Elemento de comunicación': ['Elemento de información o comunicación (antenas de televisión en las viviendas, antenas de celulares,puestos de venta de periódicos o revistas)']}
{'Calidad de señal celular': ['. ¿Cómo calificaría la calidad de la señal de celular en la zona?'], 'Calles pavimentadas': ['. ¿Las calles están pavimentadas?'], 'Construcción improvisada': ['. ¿El material de construcción de las viviendas parece ser improvisado?'], 'Puertas': ['. ¿Las casas tienen puertas?'], 'Condición de las viviendas': [

In [None]:
# Check if the dictionary matches the original element names
CheckElemDict(var_infr_elem)

#Note: 'Paradas de transporte público' was being wierd again... so I removed it from the element dictionary 

Dictionary matches: True


In [None]:
#Shorten the names and prep for combining
elemento_matrix = LongToShort(var_infr_elem,elemento_matrix)

elemento_matrix.head()

Unnamed: 0_level_0,Acueducto,Agua estancada,Agua superficial,Alumbrado público,Andenes,Barril de agua,Barril de agua,Bomba o pozo,Bote de basura,Cultivo/jardin,Elemento de comunicación,Centro educativo,Compostaje,Instalación pública sanitaria,Fuente de agua,Fuente de agua,Nueva construcción,Fuente de agua,Parques,Transporte público,Parques,Bomba o pozo,Bomba o pozo,Tuberías de agua,Recolección de lluvia,Salones comunales,Señales de tránsito,Tienda de comida,Tuberías de agua,Tuberías de agua negra,Tuberías de agua negra,Cultivo/jardin,Cultivo/jardin,Tienda de comida,Nueva construcción,Vendedor de agua
Asentamiento,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1,Unnamed: 25_level_1,Unnamed: 26_level_1,Unnamed: 27_level_1,Unnamed: 28_level_1,Unnamed: 29_level_1,Unnamed: 30_level_1,Unnamed: 31_level_1,Unnamed: 32_level_1,Unnamed: 33_level_1,Unnamed: 34_level_1,Unnamed: 35_level_1,Unnamed: 36_level_1
Alfonso Gomez,1,1,0,0,0,1,0,0,1,1,1,0,0,1,1,0,1,0,0,1,0,0,0,0,1,0,0,0,0,0,0,0,0,1,1,0
Arauca 1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,1,0,0,0,0,0,0,0,0
Arauca 6,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
Arauca 7,0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,1,0,0,0,0,0,0,0,0
Arauquita 11,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0


In [None]:
#Take the element matrix, subset the Infraestructura elements and store in a separate matrix

Infr_matrix = elemento_matrix[list(var_infr_elem.keys())]

Infr_matrix.head()

Unnamed: 0_level_0,Alumbrado público,Andenes,Salones comunales,Señales de tránsito,Nueva construcción,Nueva construcción,Transporte público,Parques,Parques,Centro educativo,Elemento de comunicación
Asentamiento,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
Alfonso Gomez,0,0,0,0,1,1,1,0,0,0,1
Arauca 1,0,0,1,0,0,0,0,0,0,0,0
Arauca 6,0,0,0,0,0,0,0,0,0,0,0
Arauca 7,1,0,1,0,0,0,0,0,0,0,0
Arauquita 11,0,0,0,0,0,0,0,0,0,0,0


In [None]:
Infr_matrix = GroupElem(Infr_matrix,elemento_matrix)

Infr_matrix

Unnamed: 0_level_0,Alumbrado público,Andenes,Salones comunales,Señales de tránsito,Nueva construcción,Transporte público,Parques,Centro educativo,Elemento de comunicación
Asentamiento,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1
Alfonso Gomez,0,0,0,0,1,1,0,0,1
Arauca 1,0,0,1,0,0,0,0,0,0
Arauca 6,0,0,0,0,0,0,0,0,0
Arauca 7,1,0,1,0,0,0,0,0,0
Arauquita 11,0,0,0,0,0,0,0,0,0
...,...,...,...,...,...,...,...,...,...
Uribia-2,0,0,0,0,1,0,0,0,1
Uribia-3,0,0,0,0,1,0,0,0,0
Uribia-4,0,0,0,0,1,0,0,0,1
Uribia-5,0,0,0,0,0,0,0,0,0


In [None]:
CleanMatrix = pd.concat([CleanMatrix,Infr_matrix],axis = 1)
CleanMatrix.head(3)

Unnamed: 0_level_0,Departamento,Municipio,N° de Validaciones,N° de Monitoreos,N° de Respuestas Validación,N° de Respuestas Monitoreo,Coordenadas,Existe,Composición,Tiempo de Conformación,Urbana/Rural,Precauciones Covid-19,Presencia de gente adulta mayor,Centro de salud internacional o nacional,Cercanía de un centro de salud,Tienda de comida,Cultivo/jardin,Compostaje,Acueducto,Agua estancada,Barril de agua,Bomba o pozo,Agua superficial,Fuente de agua,Recolección de lluvia,Tuberías de agua,Tuberías de agua negra,Vendedor de agua,Instalación pública sanitaria,Bote de basura,Alumbrado público,Andenes,Salones comunales,Señales de tránsito,Nueva construcción,Transporte público,Parques,Centro educativo,Elemento de comunicación
Asentamiento,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1,Unnamed: 25_level_1,Unnamed: 26_level_1,Unnamed: 27_level_1,Unnamed: 28_level_1,Unnamed: 29_level_1,Unnamed: 30_level_1,Unnamed: 31_level_1,Unnamed: 32_level_1,Unnamed: 33_level_1,Unnamed: 34_level_1,Unnamed: 35_level_1,Unnamed: 36_level_1,Unnamed: 37_level_1,Unnamed: 38_level_1,Unnamed: 39_level_1
Alfonso Gomez,Norte de Santander,Cúcuta,6.0,6.0,180.0,354.0,"7.9137219596446675,-72.545011018832511",Si,Mezcla indeterminada,Mezcla indeterminada,Urbana,Ambas precauciones,Unos pocos,Ninguna,En transporte público o automóvilmás de una hora,1,1,0,1,1,1,0,0,1,1,0,0,0,1,1,0,0,0,0,1,1,0,0,1
Arauca 1,Arauca,Arauca,1.0,0.0,33.0,,"7.0774010352701158,-70.738436922992321",Si,Mezcla indeterminada,1-2 años,NS/NR,Ninguna precuación,NS/NR,NS/NR,NS/NR,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0
Arauca 6,Arauca,Arauca,1.0,0.0,23.0,,"7.0626514753507346,-70.742873367335321",Si,Mezcla indeterminada,NS/NR,NS/NR,Ninguna precuación,NS/NR,NS/NR,NS/NR,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0


In [None]:
# FillMatrix(var_infr_poli) # how to find out what the error is here

## Clean Matrix Exploration

In [None]:
# Display the unique values for each of the columns in the Clean Matrix

for col in CleanMatrix.columns:
  print(col + ": " + str(CleanMatrix.loc[:,col].unique()))

## Visualizations

In [None]:
nds = CleanMatrix[CleanMatrix['Departamento']=='Norte de Santander']
nds

Unnamed: 0_level_0,Departamento,Municipio,N° de Validaciones,N° de Monitoreos,N° de Respuestas Validación,N° de Respuestas Monitoreo,Coordenadas,Existe,Composición,Tiempo de Conformación,Urbana/Rural,Precauciones Covid-19,Presencia de gente adulta mayor,Centro de salud internacional o nacional,Cercanía de un centro de salud,Tienda de comida,Cultivo/jardin,Compostaje,Acueducto,Agua estancada,Barril de agua,Bomba o pozo,Agua superficial,Fuente de agua,Recolección de lluvia,Tuberías de agua,Tuberías de agua negra,Vendedor de agua,Instalación pública sanitaria,Bote de basura,Alumbrado público,Andenes,Salones comunales,Señales de tránsito,Nueva construcción,Transporte público,Parques,Centro educativo,Elemento de comunicación
Asentamiento,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1,Unnamed: 25_level_1,Unnamed: 26_level_1,Unnamed: 27_level_1,Unnamed: 28_level_1,Unnamed: 29_level_1,Unnamed: 30_level_1,Unnamed: 31_level_1,Unnamed: 32_level_1,Unnamed: 33_level_1,Unnamed: 34_level_1,Unnamed: 35_level_1,Unnamed: 36_level_1,Unnamed: 37_level_1,Unnamed: 38_level_1,Unnamed: 39_level_1
Alfonso Gomez,Norte de Santander,Cúcuta,6.0,6.0,180.0,354.0,"7.9137219596446675,-72.545011018832511",Si,Mezcla indeterminada,Mezcla indeterminada,Urbana,Ambas precauciones,Unos pocos,Ninguna,En transporte público o automóvilmás de una hora,1,1,0,1,1,1,0,0,1,1,0,0,0,1,1,0,0,0,0,1,1,0,0,1
Cucuta 1,Norte de Santander,Cúcuta,4.0,3.0,100.0,180.0,"7.8830118242685119,-72.531722159446872",Si,Mezcla indeterminada,Mezcla indeterminada,Urbana,Ninguna precuación,Unos pocos,Ninguna,En transporte público o automóvil menos de 20 ...,1,1,0,1,1,1,0,0,0,1,0,0,0,1,0,0,0,0,0,1,0,0,0,1
Cucuta 2,Norte de Santander,Cúcuta,3.0,3.0,75.0,145.0,"7.9434489006159277,-72.491868855423576",Si,Minoría colombiana,3-5 años,Urbana,Ninguna precuación,Unos pocos,Ninguna,En transporte público o automóvil menos de 20 ...,1,1,0,1,0,1,0,0,0,1,1,0,0,1,1,0,0,0,0,1,0,0,0,1
Cucuta 3,Norte de Santander,Cúcuta,3.0,3.0,92.0,170.0,"7.9141576237404783,-72.555442429088686",Si,Mezcla indeterminada,NS/NR,Urbana,Ninguna precuación,En gran cantidad,Ninguna,En transporte público o automóvil más 30 minut...,1,1,0,1,1,1,0,0,0,1,1,0,0,1,1,0,0,0,0,1,0,0,0,1
Cucuta 4,Norte de Santander,Cúcuta,5.0,4.0,129.0,196.0,"7.9029505285086348,-72.562526872673516",Si,Mezcla indeterminada,NS/NR,Rural,Ambas precauciones,Unos pocos,Ninguna,En transporte público o automóvilmás de una hora,0,1,0,0,1,1,0,0,0,1,1,0,0,1,0,0,0,0,0,1,0,0,0,1
Cucuta 5,Norte de Santander,Cúcuta,3.0,3.0,72.0,116.0,"7.9112375834756143,-72.557552008649651",Si,Mezcla indeterminada,3-5 años,Urbana,Ambas precauciones,Unos pocos,Ninguna,En transporte público o automóvilmás de una hora,0,1,0,0,0,1,1,0,1,1,0,0,0,1,0,0,0,0,0,1,0,0,0,1
Cucuta 6,Norte de Santander,Cúcuta,3.0,3.0,97.0,172.0,"7.9105093986822261,-72.555416306098877",Si,Mezcla indeterminada,3-5 años,Urbana,Ninguna precuación,Unos pocos,Ninguna,En transporte público o automóvil más 30 minut...,1,1,0,0,1,1,0,0,0,1,1,0,0,1,1,0,0,0,0,1,0,0,0,1
El Talento Sector La Flor,Norte de Santander,Cúcuta,10.0,9.0,246.0,376.0,"7.9132058620853156,-72.549929656256353",Si,Mezcla indeterminada,3-5 años,Urbana,Ambas precauciones,Unos pocos,Ninguna,En transporte público o automóvil más 30 minut...,1,1,0,1,1,1,0,0,1,1,1,0,0,1,1,0,0,0,0,1,0,0,0,1
La Conquista,Norte de Santander,Cúcuta,3.0,3.0,78.0,166.0,"7.945533468321309,-72.526284910795127",Si,Mezcla indeterminada,3-5 años,Urbana,Solo distanciamiento social,En gran cantidad,Ninguna,Caminando o en bicicleta más de 30 minutos,1,1,0,1,1,1,0,0,0,0,0,0,0,0,1,0,0,0,0,1,1,0,0,1
Seis de Reyes,Norte de Santander,Cúcuta,6.0,6.0,142.0,172.0,"7.947370700328948,-72.491460564937242",Si,Mezcla indeterminada,3-5 años,Urbana,Ninguna precuación,Unos pocos,Ninguna,En transporte público o automóvil más 30 minut...,0,1,0,0,1,1,0,0,0,1,1,0,0,0,1,0,0,0,0,1,0,0,0,1


In [None]:
#Save the Norte de Santander

nds.to_csv('NorteDeSantander.csv')

In [None]:
nds2 = SuperMatrix[SuperMatrix['Departamento']=='Norte de Santander']
nds2

Unnamed: 0_level_0,Departamento,Municipio,N° de Validaciones,N° de Monitoreos,N° de Respuestas Validación,N° de Respuestas Monitoreo,form_id,submission_id,locale,location_id,location_name,location_centroid,. Por favor tome una foto del asentamiento,. Por favor tome una foto del asentamiento desde un ángulo diferente,. ¿Existe un asentamiento en este punto?,. ¿Sabe desde hace cuanto comenzó el asentamiento?,. ¿Las calles están pavimentadas?,. Por favor tome una foto de una calle que muestre si está o no pavimentada,. Seleccione el aspecto de la comunidad que está reportando,. Díganos desde qué lugar esta reportando este elemento,. Por favor tome una foto del elemento que está reportando,. Por favor escriba en pocas palabras a qué se refiere con “otro” en la pregunta anterior.,. ¿El material de construcción de las viviendas parece ser improvisado?,. ¿Las casas tienen puertas?,. ¿De qué materiales están hechas las viviendas principalmente?,. Por favor tome una fotografía afuera de una vivienda o grupo de viviendas que nos permita entender mejor el tipo de material y cómo están construidas.,. ¿Sabe el nombre de este asentamiento?,. Por favor escriba el nombre de este asentamiento,. ¿Los residentes actuales del asentamiento son colombianos?,. Díganos desde qué lugar está reportando ete elemento,. Por favor tome una fotografía del elemento que está reportando,. Los establecimientos de venta de alimentos y abarrotes son en su mayoría:,. ¿Qué alimentos y abarrotes venden dentro del establecimiento?,. ¿Cuáles de los siguientes alimentos están disponibles dentro del establecimiento?,. La calidad de los alimentos ofertados es:,. Por favor tome una fotografía de un anaquel con algunos productos dentro de la tienda.,". ¿Cuántas cultivos, unidades agrícolas o pecuarias hay en este asentamiento?",. ¿Qué tipos de productos observa en los cultivos o en las unidades productivas identificadas?,. En términos generales ¿cómo son las condiciones de las viviendas?,. ¿Qué tipos de instalaciones públicas sanitarias existen para los habitantes del asentamiento?,. ¿ Cuántas construcciones (viviendas) nuevas percibe que hay?,". ¿El Asentamiento cuenta con algún espacio comunitario para la transformación adecuada de los productos alimenticios para consumo, como cocinas comunitarias o comedores?",. ¿Cuál es la capacidad de dichas cocinas comunitarias o comedores?,. ¿Cuánto tiempo requiere para acudir a la institución o centro de salud más cercana al asentamiento?,. ¿Cómo calificaría la calidad de la señal de celular en la zona?,. ¿Hay alguna institución de atención en salud de carácter internacional o nacional en el municipio cercano al asentamiento?,. ¿Cómo describiría el área en la que se encuentra el asentamiento?,. ¿Dentro del asentamiento se percibe gente adulta mayor?,. ¿Qué medidas observa se están implementando para prevenir o mitigar el COVID-?,. ¡Hemos terminado! Gracias por participar en esta tarea.
Asentamiento,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1,Unnamed: 25_level_1,Unnamed: 26_level_1,Unnamed: 27_level_1,Unnamed: 28_level_1,Unnamed: 29_level_1,Unnamed: 30_level_1,Unnamed: 31_level_1,Unnamed: 32_level_1,Unnamed: 33_level_1,Unnamed: 34_level_1,Unnamed: 35_level_1,Unnamed: 36_level_1,Unnamed: 37_level_1,Unnamed: 38_level_1,Unnamed: 39_level_1,Unnamed: 40_level_1,Unnamed: 41_level_1,Unnamed: 42_level_1,Unnamed: 43_level_1,Unnamed: 44_level_1,Unnamed: 45_level_1,Unnamed: 46_level_1,Unnamed: 47_level_1,Unnamed: 48_level_1,Unnamed: 49_level_1,Unnamed: 50_level_1
Alfonso Gomez,Norte de Santander,Cúcuta,6.0,6.0,180.0,354.0,"[6.68339E+15, 6.68339E+15, 6683389409361920, 6...","[4767148365053952, 5.49012E+15, 52135476029030...","[ES, ES, ES, ES, ES, ES]","[129468, 129468, 129523, 129523, 129523, 129468]",,"[7.9137219596446675,-72.545011018832511, 7.913...",[http://storage.googleapis.com/prod-premise-an...,[[http://storage.googleapis.com/prod-premise-a...,"[Si, Si, Si, Si, Si, Si]","[Entre 3 y 5 años, Entre 3 y 5 años, No estoy ...","[No, No, No, No, No, No]",[http://storage.googleapis.com/prod-premise-an...,"[[Recolección de agua de lluvia, Una vivienda ...","[[7.9117929,-72.5463268, 7.9118691,-72.5463518...",[[http://storage.googleapis.com/prod-premise-a...,"[[], [], [], [], [], []]","[Si, Si, Si, Si, Si, Si]","[Algunas de las casas tienen puertas, Si, toda...",[Madera | Latón | Metal corrugado | Lad...,[http://storage.googleapis.com/prod-premise-an...,"[Si, No, No, Si, Si, No]","[Alfonso Gómez 2, nan, nan, Alfonso Gomez, Alf...",[Hay una mezcla de residentes colombianos y re...,"[[7.9116735,-72.5454188, 7.9120141,-72.5461041...",[[http://storage.googleapis.com/prod-premise-a...,[[Pequeñas tiendas de barrio o negocio familia...,"[[Alimentos perecederos, procesados (Jugos y l...",[[Cereales y harinas | Carnes | Huevos |...,"[[Regular (presenta regular aspecto, comida a ...",[[http://storage.googleapis.com/prod-premise-a...,"[[De 1 a 3], [De 1 a 3], [De 1 a 3], [De 1 a 3...","[[Hortalizas de fruto comestible (berenjena, t...",[[Algunas viviendas NO se encuentran en buen e...,"[[], [Letrina], [], [], [Fosa séptica], []]","[[Entre 10 y 20], [Entre 10 y 20], [Entre 10 y...","[[No], [No], [No], [No], [De 1 a 3], [No]]","[nan, nan, nan, nan, Entre 20 y 50 personas, nan]",[En transporte público o automóvil más 30 minu...,"[Buena, Buena, Buena, Buena, Buena, Buena]",Ninguna,"[Urbana, Urbana, Urbana, Urbana, Urbana, Urbana]","[Unos pocos, Unos pocos, Unos pocos, Unos poco...",[Ambas precauciones],"[7.9123542,-72.5464926, 7.91221,-72.5454, 7.91..."
Cucuta 1,Norte de Santander,Cúcuta,4.0,3.0,100.0,180.0,"[6.68339E+15, 6683389409361920, 6683389409361920]","[5722798989508608, 5051177169584128, 458766382...","[ES, ES, ES]","[129461, 129461, 129461]",,"[7.8830118242685119,-72.531722159446872, 7.883...",[http://storage.googleapis.com/prod-premise-an...,[[http://storage.googleapis.com/prod-premise-a...,"[Si, Si, Si, Si]","[Entre 3 y 5 años, No estoy seguro, No estoy s...","[No, No, No, No]",[http://storage.googleapis.com/prod-premise-an...,"[[Una vivienda o un desarrollo de viviendas, E...","[[7.8826296,-72.5316442, 7.8831009,-72.5319669...",[[http://storage.googleapis.com/prod-premise-a...,"[[], [], [], []]","[Si, Si, Si, Si]","[Si, todas las casas tienen puertas, Si, todas...",[Madera | Latón | Plástico corrugado | ...,[http://storage.googleapis.com/prod-premise-an...,"[Si, No, No, Si]","[Virgilio Barco Sector La Bruja, nan, nan, Vil...",[Hay una mezcla de residentes colombianos y re...,"[[7.8837508,-72.5322261, 7.8838039,-72.5321734...",[[http://storage.googleapis.com/prod-premise-a...,[[Pequeñas tiendas de barrio o negocio familia...,"[[Alimentos perecederos solamente (Frutas, leg...",[[Cereales y harinas | Vegetales frescos y ...,"[[Óptima], [Regular (presenta regular aspecto,...",[[http://storage.googleapis.com/prod-premise-a...,"[[De 1 a 3], [De 4 a 10], [De 1 a 3]]","[[Frutales dispersos], [Hortalizas de fruto co...",[[La mayoría de las viviendas NO se encuentran...,"[[Fosa séptica], [], [Fosa séptica | Excusa...","[[], [Menos de 5], [Menos de 10]]","[[No], [No], [No]]","[nan, nan, nan]",[En transporte público o automóvil menos de 20...,"[Regular, Regular, Buena]",Ninguna,"[Urbana, Urbana, Urbana]","[Unos pocos, Unos pocos, Unos pocos]",[Ninguna precuación],"[7.883801,-72.5324911, 7.8838079,-72.5322438, ..."
Cucuta 2,Norte de Santander,Cúcuta,3.0,3.0,75.0,145.0,"[6.68339E+15, 6.68339E+15, 6.68339E+15]","[4649286476496896, 6581654539993088, 600925592...","[ES, ES, ES]","[129463, 129463, 129463]",,"[7.9434489006159277,-72.491868855423576, 7.943...",[http://storage.googleapis.com/prod-premise-an...,[[http://storage.googleapis.com/prod-premise-a...,"[Si, Si, Si]","[Entre 3 y 5 años, Entre 3 y 5 años, Entre 3 y...","[No, No, No]",[http://storage.googleapis.com/prod-premise-an...,"[[Tubería de agua pública o privada, Una tiend...","[[7.9425443,-72.4924078], [7.9426872,-72.49223...",[[http://storage.googleapis.com/prod-premise-a...,"[[], [], []]","[Si, Si, Si]","[Si, todas las casas tienen puertas, Si, todas...",[Madera | Plástico corrugado | Láminas de...,[http://storage.googleapis.com/prod-premise-an...,"[Si, Si, Si]","[Colinas Del Tunal, Colinas Del Tunal, Colinas...","[No, hay más de otro país que colombianos, No,...","[[7.9432339,-72.4917077, 7.9429393,-72.491786,...",[[http://storage.googleapis.com/prod-premise-a...,[[Pequeñas tiendas de barrio o negocio familia...,"[[Alimentos perecederos, procesados (Jugos y l...",[[Cereales y harinas | Vegetales frescos y ...,"[[Regular (presenta regular aspecto, comida a ...",[[http://storage.googleapis.com/prod-premise-a...,"[[De 1 a 3], [De 1 a 3], [De 4 a 10]]","[[Hortalizas de fruto comestible (berenjena, t...","[[], [Algunas viviendas NO se encuentran en bu...","[[Letrina], [Excusado con agua corriente], [Ex...","[[Menos de 5], [], [Menos de 5]]","[[No], [No], [No]]","[nan, nan, nan]",[En transporte público o automóvil menos de 20...,"[Regular, Buena, Buena]",Ninguna,"[Urbana, Urbana, Urbana]","[Unos pocos, Unos pocos, Unos pocos]",[Ninguna precuación],"[7.9432734,-72.4917156, 7.943521,-72.4919108, ..."
Cucuta 3,Norte de Santander,Cúcuta,3.0,3.0,92.0,170.0,"[6683389409361920, 6.68339E+15, 6.68339E+15]","[6356623083962368, 6503028553416704, 476947140...","[ES, ES, ES]","[129462, 129462, 129462]",,"[7.9141576237404783,-72.555442429088686, 7.914...",[http://storage.googleapis.com/prod-premise-an...,[[http://storage.googleapis.com/prod-premise-a...,"[Si, Si, Si]","[Entre 3 y 5 años, No estoy seguro, No estoy s...","[No, No, Si]",[http://storage.googleapis.com/prod-premise-an...,[[Una tienda o establecimiento de venta de aba...,"[[7.9121472,-72.5556113, 7.9123018,-72.5556395...",[[http://storage.googleapis.com/prod-premise-a...,"[[Tubería De Servicio De Agua Publica], [], []]","[Si, Si, Si]","[Algunas de las casas tienen puertas, Algunas ...",[Madera | Latón | Láminas de plástico |...,[http://storage.googleapis.com/prod-premise-an...,"[Si, No, No]","[Alto Viento, nan, nan]",[Hay una mezcla de residentes colombianos y re...,"[[7.914719,-72.5556121, 7.9146417,-72.5550861,...",[[http://storage.googleapis.com/prod-premise-a...,[[Pequeñas tiendas de barrio o negocio familia...,"[[Alimentos perecederos, procesados (Jugos y l...",[[Huevos | Especies y condimentos | Bebid...,"[[Regular (presenta regular aspecto, comida a ...",[[http://storage.googleapis.com/prod-premise-a...,"[[De 1 a 3], [De 1 a 3], [De 1 a 3]]","[[Aves de Corral, huevos y carne], [Aves de Co...","[[], [Algunas viviendas NO se encuentran en bu...","[[Letrina], [Letrina], []]","[[Menos de 5], [Menos de 10], [Menos de 5]]","[[No], [No], [No]]","[nan, nan, nan]",[En transporte público o automóvilmás de una h...,"[Buena, Buena, Buena]",Ninguna,"[Urbana, Urbana, Urbana]","[En gran cantidad, Unos pocos, En gran cantidad]",[Ninguna precuación],"[7.914754,-72.5560025, 7.9147889,-72.5559086, ..."
Cucuta 4,Norte de Santander,Cúcuta,5.0,4.0,129.0,196.0,"[6.68339E+15, 6683389409361920, 6.68339E+15, 6...","[4643799575035904, 5043500640108544, 5.54203E+...","[ES, ES, ES, ES]","[129464, 129464, 129464, 129464]",,"[7.9029505285086348,-72.562526872673516, 7.902...",[http://storage.googleapis.com/prod-premise-an...,[[http://storage.googleapis.com/prod-premise-a...,"[Si, Si, Si, Si, Si]","[Entre 3 y 5 años, Entre 3 y 5 años, No estoy ...","[No, No, No, No, No]",[http://storage.googleapis.com/prod-premise-an...,"[[Un cultivo, o un jardín comunitario para aut...","[[7.9031064,-72.5618223, 7.9031372,-72.5618688...",[[http://storage.googleapis.com/prod-premise-a...,"[[], [], [], [], []]","[Si, Si, Si, Si, Si]","[Si, todas las casas tienen puertas, Si, todas...",[Madera | Latón | Plástico corrugado | ...,[http://storage.googleapis.com/prod-premise-an...,"[Si, Si, No, No, No]","[El Espinal, El Espinal, nan, nan, nan]",[Hay una mezcla de residentes colombianos y re...,"[[7.9027771,-72.5627615, 7.9027685,-72.5627272...",[[http://storage.googleapis.com/prod-premise-a...,"[[], [], [], []]","[[], [], [], []]","[[], [], [], []]","[[], [], [], []]","[[], [], [], []]","[[De 4 a 10], [De 1 a 3], [De 1 a 3], [De 4 a ...","[[Aves de Corral, huevos y carne, Raíces, tubé...","[[], [La mayoría de las viviendas NO se encuen...","[[Letrina], [Letrina], [Fosa séptica], [Letrina]]","[[Menos de 5], [Menos de 5], [], [Menos de 5]]","[[No], [No], [No], [No]]","[nan, nan, nan, nan]",[En transporte público o automóvilmás de una h...,"[Mala, Mala, Regular, Buena]",Ninguna,"[Rural, Rural, Urbana, Rural]","[Unos pocos, Unos pocos, Unos pocos, Unos pocos]",[Ambas precauciones],"[7.9027701,-72.5619732, 7.9027221,-72.5616008,..."
Cucuta 5,Norte de Santander,Cúcuta,3.0,3.0,72.0,116.0,"[6.68339E+15, 6.68339E+15, 6.68339E+15]","[6053065935552512, 5854812367486976, 4.70699E+15]","[ES, ES, ES]","[129467, 129467, 129467]",,"[7.9112375834756143,-72.557552008649651, 7.911...",[http://storage.googleapis.com/prod-premise-an...,[[http://storage.googleapis.com/prod-premise-a...,"[Si, Si, Si]","[No estoy seguro, Entre 3 y 5 años, Entre 3 y ...","[No, Si, No]",[http://storage.googleapis.com/prod-premise-an...,"[[Recolección de agua de lluvia, Instalación p...","[[7.9114482,-72.5571223], [7.9112808,-72.55770...",[[http://storage.googleapis.com/prod-premise-a...,"[[], [], []]","[Si, Si, Si]","[Si, todas las casas tienen puertas, Si, todas...",[Madera | Latón | Plástico corrugado | ...,[http://storage.googleapis.com/prod-premise-an...,"[Si, Si, Si]","[Alto Viento, Alto Viento Parte Baja, Alto Vie...","[No, hay más de otro país que colombianos, Hay...","[[7.9113884,-72.5575146, 7.9112782,-72.5574576...",[[http://storage.googleapis.com/prod-premise-a...,"[[], [], []]","[[], [], []]","[[], [], []]","[[], [], []]","[[], [], []]","[[], [De 1 a 3], []]","[[], [Hortalizas de fruto comestible (berenjen...","[[], [Algunas viviendas NO se encuentran en bu...","[[Letrina], [], [Letrina]]","[[Menos de 5], [Menos de 5], [Menos de 5]]","[[No], [De 1 a 3], [No]]","[nan, Entre 20 y 50 personas, nan]",[En transporte público o automóvilmás de una h...,"[Buena, Buena, Buena]",Ninguna,"[Urbana, Urbana, Urbana]","[Unos pocos, Unos pocos, Unos pocos]",[Ambas precauciones],"[7.9111103,-72.5573975, 7.9113275,-72.5577533,..."
Cucuta 6,Norte de Santander,Cúcuta,3.0,3.0,97.0,172.0,"[6.68339E+15, 6683389409361920, 6.68339E+15]","[4553067767005184, 5267797972353024, 531629372...","[ES, ES, ES]","[129466, 129466, 129466]",,"[7.9105093986822261,-72.555416306098877, 7.910...",[http://storage.googleapis.com/prod-premise-an...,[[http://storage.googleapis.com/prod-premise-a...,"[Si, Si, Si]","[Entre 3 y 5 años, No estoy seguro, Entre 3 y ...","[No, No, No]",[http://storage.googleapis.com/prod-premise-an...,"[[Tubería de agua pública o privada, Instalaci...","[[7.911165,-72.5560428], [7.9113436,-72.555584...",[[http://storage.googleapis.com/prod-premise-a...,"[[], [], [Tubería De Agua Limpia Pública]]","[Si, Si, Si]","[Si, todas las casas tienen puertas, Si, todas...","[Madera | Láminas de plástico | Ladrillo,...",[http://storage.googleapis.com/prod-premise-an...,"[Si, No, Si]","[Alto Viento, nan, Alto Viento 2]",[Hay una mezcla de residentes colombianos y re...,"[[7.9113683,-72.5557601, 7.9110727,-72.5551394...",[[http://storage.googleapis.com/prod-premise-a...,[[Pequeñas tiendas de barrio o negocio familia...,"[[Alimentos perecederos, procesados (Jugos y l...",[[Huevos | Leguminosas | Leche y producto...,"[[Óptima], [], [Regular (presenta regular aspe...",[[http://storage.googleapis.com/prod-premise-a...,"[[De 4 a 10], [], [De 4 a 10]]","[[Aves de Corral, huevos y carne], [], [Hortal...",[[La mayoría de las viviendas NO se encuentran...,"[[Letrina], [Letrina], [Letrina]]","[[Menos de 10], [Menos de 10], [Menos de 10]]","[[No], [No], [No]]","[nan, nan, nan]",[En transporte público o automóvil más 30 minu...,"[Buena, Buena, Buena]",Ninguna,"[Urbana, Urbana, Urbana]","[Unos pocos, Unos pocos, Unos pocos]",[Ninguna precuación],"[7.9114183,-72.5557703, 7.9114261,-72.5556387,..."
El Talento Sector La Flor,Norte de Santander,Cúcuta,10.0,9.0,246.0,376.0,"[6.68339E+15, 6.68339E+15, 6.68339E+15, 6.6833...","[6.28609E+15, 5.46442E+15, 6248168046198784, 6...","[ES, ES, ES, ES, ES, ES, ES, ES, ES]","[129522, 129471, 129522, 129470, 129471, 12947...",,"[7.9132058620853156,-72.549929656256353, 7.914...",[http://storage.googleapis.com/prod-premise-an...,[[http://storage.googleapis.com/prod-premise-a...,"[Si, Si, Si, Si, Si, Si, Si, Si, Si, Si]","[No estoy seguro, Entre 3 y 5 años, Entre 3 y ...","[No, No, No, No, No, No, No, No, No, No]",[http://storage.googleapis.com/prod-premise-an...,"[[Cultivo, unidad agrícola o pecuaria, Una tie...","[[7.9125219,-72.5521116], [7.9138189,-72.54832...",[[http://storage.googleapis.com/prod-premise-a...,"[[], [], [], [], [Mangueras De Servicio De Agu...","[Si, Si, Si, Si, Si, Si, Si, Si, Si, Si]","[Si, todas las casas tienen puertas, Si, todas...",[Madera | Latón | Plástico corrugado | ...,[http://storage.googleapis.com/prod-premise-an...,"[Si, Si, Si, No, Si, Si, Si, Si, Si, Si]","[La Flores, El Talento Sector La Flor, Las Flo...","[Si, hay más colombianos que residentes de otr...","[[7.9148314,-72.5500177, 7.9145038,-72.5496989...",[[http://storage.googleapis.com/prod-premise-a...,[[Pequeñas tiendas de barrio o negocio familia...,"[[Alimentos perecederos, procesados (Jugos y l...","[[Huevos], [], [Cereales y harinas | Vegeta...","[[Regular (presenta regular aspecto, comida a ...",[[http://storage.googleapis.com/prod-premise-a...,"[[De 1 a 3], [], [De 1 a 3], [De 4 a 10], [], ...","[[Otros], [], [Hortalizas de fruto comestible ...",[[Algunas viviendas NO se encuentran en buen e...,"[[], [], [Letrina], [Fosa séptica], [], [Letri...","[[Menos de 5], [], [], [], [], [Menos de 5], [...","[[No], [No], [No], [De 1 a 3], [No], [No], [No...","[nan, nan, nan, Entre 20 y 50 personas, nan, n...",[En transporte público o automóvil más 30 minu...,"[Buena, Buena, Buena, Regular, Mala, Buena, Bu...",Ninguna,"[Urbana, Urbana, Urbana, Urbana, Urbana, Urban...","[Unos pocos, Unos pocos, Unos pocos, Unos poco...",[Ambas precauciones],"[7.9148883,-72.5504275, 7.9142413,-72.5513042,..."
La Conquista,Norte de Santander,Cúcuta,3.0,3.0,78.0,166.0,"[6.68339E+15, 6683389409361920, 6.68339E+15]","[5511097434243072, 6141429720285184, 473797209...","[ES, ES, ES]","[129520, 129520, 129520]",,"[7.945533468321309,-72.526284910795127, 7.9455...",[http://storage.googleapis.com/prod-premise-an...,[[http://storage.googleapis.com/prod-premise-a...,"[Si, Si, Si]","[Entre 3 y 5 años, Entre 3 y 5 años, Entre 3 y...","[No, No, No]",[http://storage.googleapis.com/prod-premise-an...,[[Barril de agua en el exterior de una viviend...,"[[7.9468883,-72.5273224, 7.9469024,-72.5272707...",[[http://storage.googleapis.com/prod-premise-a...,"[[], [], []]","[Si, Si, Si]","[Si, todas las casas tienen puertas, Si, todas...","[Madera | Metal corrugado | Ladrillo, Made...",[http://storage.googleapis.com/prod-premise-an...,"[Si, Si, Si]","[La Conquista, La Conquista, La Conquista]",[Hay una mezcla de residentes colombianos y re...,"[[7.9450537,-72.5275818, 7.9447377,-72.5282363...",[[http://storage.googleapis.com/prod-premise-a...,[[Pequeñas tiendas de barrio o negocio familia...,"[[Alimentos perecederos, procesados (Jugos y l...",[[Cereales y harinas | Huevos | Leche y p...,"[[Regular (presenta regular aspecto, comida a ...",[[http://storage.googleapis.com/prod-premise-a...,"[[De 1 a 3], [], []]","[[Raíces, tubérculos, leguminosas. (papa, yuca...",[[Algunas viviendas NO se encuentran en buen e...,"[[], [], []]","[[], [Más de 20], [Más de 20]]","[[No], [No], [No]]","[nan, nan, nan]",[En transporte público o automóvil menos de 20...,"[Regular, Buena, Buena]",Ninguna,"[Urbana, Urbana, Urbana]","[Unos pocos, En gran cantidad, En gran cantidad]",[Solo distanciamiento social],"[7.9450487,-72.5275233, 7.9459599,-72.5261463,..."
Seis de Reyes,Norte de Santander,Cúcuta,6.0,6.0,142.0,172.0,"[6.68339E+15, 6.68339E+15, 6683389409361920, 6...","[6.7275E+15, 4.93215E+15, 5175379503611904, 51...","[ES, ES, ES, ES, ES, ES]","[129521, 129469, 129469, 129469, 129521, 129521]",,"[7.947370700328948,-72.491460564937242, 7.9473...",[http://storage.googleapis.com/prod-premise-an...,[[http://storage.googleapis.com/prod-premise-a...,"[Si, Si, Si, Si, Si, Si]","[Entre 3 y 5 años, Entre 3 y 5 años, Entre 3 y...","[No, No, No, No, No, No]",[http://storage.googleapis.com/prod-premise-an...,[[Barril de agua en el exterior de una viviend...,"[[7.9467332,-72.4917093], [7.9462749,-72.49222...",[[http://storage.googleapis.com/prod-premise-a...,"[[], [], [], [], [], []]","[Si, Si, No, Si, Si, Si]","[Si, todas las casas tienen puertas, Si, todas...","[Madera | Latón | Láminas de plástico, M...",[http://storage.googleapis.com/prod-premise-an...,"[Si, Si, No, Si, Si, No]","[6 De Reyes, Seis De Reyes, nan, 6 De Reyes, S...","[No, hay más de otro país que colombianos, Hay...","[[7.9461736,-72.4922201], [7.9466826,-72.49215...",[[http://storage.googleapis.com/prod-premise-a...,"[[], [], [], [], [], []]","[[], [], [], [], [], []]","[[], [], [], [], [], []]","[[], [], [], [], [], []]","[[], [], [], [], [], []]","[[], [De 1 a 3], [De 1 a 3], [De 1 a 3], [], []]","[[], [Hortalizas de hoja (acelga, espinaca lec...","[[], [], [], [], [], []]","[[], [], [], [], [], []]","[[], [Menos de 5], [Menos de 5], [Menos de 5],...","[[No], [No], [No], [No], [No], [No]]","[nan, nan, nan, nan, nan, nan]",[En transporte público o automóvil más 30 minu...,"[Buena, Buena, Buena, Buena, Regular, Buena]",Ninguna,"[Urbana, Urbana, Urbana, Urbana, Urbana, Urbana]","[Unos pocos, Unos pocos, Unos pocos, Unos poco...",[Ninguna precuación],"[7.9462862,-72.4921023, 7.9463104,-72.4923443,..."


In [None]:
nds2.to_csv('NorteDeSantander2.csv')

### Estatus de Validación y Monitoreo de Asentamientos en el Norte de Santander

In [None]:
asen = nds.index
valid = nds['N° de Validaciones']
monit = nds['N° de Monitoreos']

x = asen
y = valid
w = monit

fig,ax = plt.subplots()  # a figure with a single Axes
ax.set_title("Estatus de Validación y Monitoreo de Asentamientos en el Norte de Santander")
ax.set_xlabel('Asentamiento')  # Add an x-label to the axes.
ax.set_ylabel('N° de Encuestas')  # Add a y-label to the axes.
plt.xticks(rotation=90)
#plt.yticks(stats_matrix['N° de Validaciones'].unique())

ax.scatter(x,y,label='Validación',color = (0,0,0,.75),marker='$V$')
ax.bar(x,y,label='Validación',color = (0,0,0,.75),width=0.05)
ax.scatter(x,w,label='Monitoreo',color = (0,0,0,0.50),marker='$M$')
ax.bar(x,w,label='Monitoreo',color = (0,0,0,0.25),width=0.05)

x_coordinates = [asen[0],asen[len(asen)-1]]
y_coordinatesMax = [nds['N° de Validaciones'].max(),nds['N° de Validaciones'].max()]
y_coordinates3 = [3,3]
y_coordinates2 = [2,2]
y_coordinates1 = [1,1]
y_coordinates0 = [0,0]

plt.plot(x_coordinates,y_coordinates3,color='g')
plt.plot(x_coordinates,y_coordinates2,color='r')

#plt.rcParams["figure.figsize"] = [8, 5]

ax.fill_between(x_coordinates,y_coordinatesMax,y_coordinates3,color='g',alpha=.25) #
ax.fill_between(x_coordinates,y_coordinates2,y_coordinates0,color='r',alpha=.25)#

ax.legend()  # Add a legend.

plt.show()

### Pie Charts

In [None]:
def PieChart(Col):
  col = Col
  lbls = nds[col].tolist()

  sizes = []
  for res in pd.unique(lbls):
    sizes.append(lbls.count(res)/len(lbls))

  labels = pd.unique(lbls)
  sizes = sizes 

  fig1, ax1 = plt.subplots()
  ax1.set_title(col + ": Asentamientos en el Norte de Santander")

  ax1.pie(sizes, labels=labels, autopct='%1.1f%%',
          shadow=True, startangle=90) 
  ax1.axis('equal')  # Equal aspect ratio ensures that pie is drawn as a circle.

  plt.show()

In [None]:
#General Pie Charts

for key in var_gen.keys():
  PieChart(key)

In [None]:
for key in var_WASH.keys():
  PieChart(key)