## Iteración con *for*- loops

Al igual que muchos otros lenguajes de programación, Python ofrece la posibilidad de ejecutar repetidamente un bloque de código a través de la introducción de **métodos de iteración**.

Una de las formas más habituales de ejecutar repetidamente un programa es a través de ***bucles*** o **loops**. 

In [2]:
#Cargar la base de datos de trabajo

#Importar bibliotecas requeridas
import pandas as pd
import numpy as np

#Importar el archivo de texto de extensión .csv
df = pd.read_csv("D:/Documentos/Otros/Aplicaciones/DESI/Muertes_maternas_2002_2021.csv")

La construcción de un loop puede estar motivada por la necesidad de repetir un bloque de código hasta que se observe el cumplimiento de una condición (método `while`) o bien por la necesidad de aplicar un **mismo procedimiento o transformación** a un ***objeto secuencial***.

Este último tipo de loop corresponde a los bucles generados utilizando la palabra reservada `for` y son aplicables a objetos de tipo: `list, string, tuple, set, array` y `dataframe`.

![alternative text](https://res.cloudinary.com/dyd911kmh/image/upload/f_auto,q_auto:best/v1508331558/Loop_2-2_igl4qt.jpg)

Dado un conjunto de elementos organizados en un objeto secuencial, un **for-loop** puede ser utilizado para iterar a través de cada uno de estos elementos para aplicarle el procedimiento especificado. 

A fin de iterar a través de un objeto, el método `for` utiliza la función `range`. Esta función genera una *lista de números* que es utilizada para estructurar el **orden** y **duración** de ejecución del bucle. 

In [2]:
#Generar un bucle con 'for'
for i in range(10):
    #Imprimir con índice ajustado
    print(i+1)

1
2
3
4
5
6
7
8
9
10


El índice de los ***for-loops*** en Python comienza en **cero**; por lo que el proceso de iteración comenzará en el **índice cero** del objeto sobre el que se itera o en la **posición inicial** de la secuencia generada.

El ejemplo anterior imprime en pantalla una secuencia de números que va del 1 al 10. A fin de que la repetición iniciara en cero, fue necesario adicionar 1 al argumento `i`.

Este argumento es equivalente al número de cada repetición del bucle. En este sentido, la instrucción puede  leerse como: *por cada **i** (cada repetición) dada por la secuencia que va de 0 a 9...*

In [3]:
#Generar un bucle con 'for' para un string
for i in "Programación":
    #Imprimir los carácteres
    print(i)

P
r
o
g
r
a
m
a
c
i
ó
n


Como en el caso anterior, la instrucción especificada en el cuerpo del bucle permite imprimir en pantalla cada uno de los *elementos* que integran el objeto string. 

El bucle *itera* a través de la cadena de carácteres. En este contexto, cada uno de los carácteres es considerado como un **elemento** de la secuencia.

In [4]:
#Definir una  lista 
ls = [5, 15, 25, 35, 45, 55, 65, 75, 85, 95]

#Generar un bucle con 'for' aplicado a una lista
for i in ls:
    print(i, "multiplicado por 5 es igual a:", i*5)

5 multiplicado por 5 es igual a: 25
15 multiplicado por 5 es igual a: 75
25 multiplicado por 5 es igual a: 125
35 multiplicado por 5 es igual a: 175
45 multiplicado por 5 es igual a: 225
55 multiplicado por 5 es igual a: 275
65 multiplicado por 5 es igual a: 325
75 multiplicado por 5 es igual a: 375
85 multiplicado por 5 es igual a: 425
95 multiplicado por 5 es igual a: 475


Al iterar a través de una lista, el cuerpo del bucle llama a los elementos de manera ordenada. En este sentido, la ***i*** indica cuál es el elemento de la lista al que se le deben aplicar las operaciones especificadas en el cuerpo del bucle. 

También es posible hacer referencia a los elementos de una lista mediante su **índice** o la posición que mantienen al interior del objeto. Para hacerlo, es necesario especificar la dimensión de la secuencia sobre la que se va a iterar mediante la función `len`.

In [5]:
#Generar un bucle con 'for' para una lista (índice)
for i in range(len(ls)):
    print(ls[i], "multiplicado por 5 es igual a:", ls[i]*5)

5 multiplicado por 5 es igual a: 25
15 multiplicado por 5 es igual a: 75
25 multiplicado por 5 es igual a: 125
35 multiplicado por 5 es igual a: 175
45 multiplicado por 5 es igual a: 225
55 multiplicado por 5 es igual a: 275
65 multiplicado por 5 es igual a: 325
75 multiplicado por 5 es igual a: 375
85 multiplicado por 5 es igual a: 425
95 multiplicado por 5 es igual a: 475


A fin de acceder al elemento de la lista **especificado posicionalmente** en la ejecución del bucle, es necesario aplicar un *subsetting* en la lista original; de modo que sea posible recuperar al elemento deseado: `ls[i]`.

Ya que `i` es equivalente a un número, generado por la función `range`, esta puede ser utilizada como argumento para la ejecución del filtrado.

La búsqueda posicional es especialmente útil para la ejecución de tareas de transformación de los elementos contenidos en los objetos sobre los que se itera:

In [6]:
#Modificar los elementos de una lista de forma iterativa
for i in range(len(ls)):
    #Imprimir elemento original
    print("Valor original:", ls[i])
    #Generar variable de actualización
    fix = ls[i]
    #Actualizar el elemento de la lista 
    ls[i] = fix - 5
    #Imprimir el elemento actualizado
    print("Valor actualizado:", ls[i])

Valor original: 5
Valor actualizado: 0
Valor original: 15
Valor actualizado: 10
Valor original: 25
Valor actualizado: 20
Valor original: 35
Valor actualizado: 30
Valor original: 45
Valor actualizado: 40
Valor original: 55
Valor actualizado: 50
Valor original: 65
Valor actualizado: 60
Valor original: 75
Valor actualizado: 70
Valor original: 85
Valor actualizado: 80
Valor original: 95
Valor actualizado: 90


A través de la ejecución del bucle, es posible **actualizar en decremento** los elementos de la lista. La operación de reasignación se ejecutó de forma ordenada sobre cada uno de los elementos de la secuencia de datos.

Las modificaciones ejecutados sobre el objeto al interior del bucle son de carácter **permanente**, al tiempo que el bucle trabaja con objetos ubicados en el ambiente principal de la sesión de trabajo.

In [7]:
#Imprimir lista de objetos
print(ls)

[0, 10, 20, 30, 40, 50, 60, 70, 80, 90]


También es posible utilizar los *for-loops* para evaluar sentencias condicionales de forma iterativa:

In [None]:
## EJECUTAR EL BLOQUE

#Generar un bucle que imprima el estado y municipio de residencia
for i in range(len(df["ENTIDAD_RESIDENCIAD"])):
    #Establecer una condición
    if(df["ENTIDAD_RESIDENCIAD"][i] == "JALISCO"):
        #Imprimir cadena de estado y municipio
        print("Estado de residencia: Jalisco",
              "\nMunicipio de residencia:", df["MUNICIPIO_RESIDENCIAD"][i])
    else:
        print("No es de Jalisco")

Este bucle evalúa si cada registro individual está asociado a una mujer residente de **Jalisco**. Cuando se cumple esta condición, se imprime en pantalla el estado y municipio de residencia y cuando no se cumple se imprime la leyenda *No es de Jalisco*.

La sentencia condicional se evalúa una cantidad de veces fijada por la longitud de la secuencia dada por la función `range`; ésta abarca la dimensión en filas del dataframe de *Muertes maternas*.

## Reasignación mediante iteración

Uno de los principales usos de los ***for-loops*** es la **modificación iterativa** de objetos secuenciales como listas, diccionarios o dataframes. 

Es posible aplicar operaciones a los elementos que forman parte de una secuencia al interior de un bucle. Sin embargo, es importante ser precavido en la forma cómo se reasigna el objeto original, al tiempo que  las modificaciones hechas al interior de un bucle son de carácter permanente.

También es posible **construir un objeto** al interior de una lista. Este procedimiento asemeja el *llenado de un contenedor* en donde la iteración constituye el medio mediante el que nuevos elementos son incorporados a un objeto que sirve como contenedor.

In [54]:
#Modificar los elementos de una lista mediante un bucle for

#Lista original
ls1 = ["Obs", "Obs", "Obs", "Obs", "Obs"]

#Lista contenedora
ls2 = []

#Definición del bucle
for i in range(len(ls1)):
    #Generar valores a imputar
    seq = list(range(1, len(ls1)+1))
    #Definir valor a incorporar
    val = ls1[i] + "_" + str(seq[i])
    #Incorporar valores en contenedor
    ls2.append(val)
    #Visualizar vector final
    print(ls2)

['Obs_1']
['Obs_1', 'Obs_2']
['Obs_1', 'Obs_2', 'Obs_3']
['Obs_1', 'Obs_2', 'Obs_3', 'Obs_4']
['Obs_1', 'Obs_2', 'Obs_3', 'Obs_4', 'Obs_5']


En el ejemplo previo, la lista `ls2` sirve como contenedor para los elementos modificados de la lista `ls1`. La operación de transformación consiste en incorporar un marcado de posición a cada una de las observaciones. La lista contenedora es ***reasignada*** en cada ejecución del bucle a través de la función `append`. 

El objeto final cuenta con cinco elementos que corresponden a los cinco valores modificados de la lista original.

## Bucles anidados

Es posible incorporar múltiples *for-loops* en una sola ejecución. Al hacerlo, el programa itera sobre dos o más secuencias de objetos. Esto es lo que se conoce como ***bucles anidados***.

Las operaciones a ejecutar se especifican bajo cada uno de los headers `for`. La ejecución se ejecutare *de afuera hacia adentro*, de manera que si una instrucción es colocada entre dos `for`, solamente se aplicará a la secuencia inmediatamente superior.

In [None]:
## EJECUTAR EL BLOQUE

#Generar un loop en el que se evalúe si la localidad de muerte es igual a la localidad de residencia
for i in range(len(df["ENTIDAD_RESIDENCIAD"])):
    #Definir primer valor de comparación
    res = df.iloc[i, 8]
    for j in range(len(df["ENTIDAD_OCURRENCIAD"])):
        #Definir segundo valor de comparación
        ocu = df.iloc[j, 22]
        #Condición de evaluación
        if(res == ocu):
            #Las entidades corresponden
            print("La entidad de residencia y de ocurrencia del fallecimiento son la misma:", res)
            break
        else:
            print("Las entidades difieren:", res, ocu)

 Es importante ser cuidadoso con los bucles anidados, al tiempo que el tiempo de ejecución puede tornarse largo. Esto se debe a que, mientras el bucle exterior se ejecuta **una vez**, el bucle de interior se ejecuta **tantas veces como la indica la secuencia del *for***.
 
 De esta forma, para el ejemplo precedente, el loop se ejecutaría en **22,395 x 22,395** ocasiones. 
 
 A fin de evitar que la ejecución se prolongue por demasiado tiempo, es importante introducir un punto de interrupción mediante el método `break`.

Es posible integrar varios tipos de bucles como parte de la construcción de un bucle:

In [None]:
## EJECUTAR EL BLOQUE

#Definir condiciones iniciales
i = 0 

#Generar bucle anidado para verificar si estados son iguales
while(i < len(df)):
    #Generar primer valor de comparación
    res = df.iloc[i, 8]
    #Actualizar contadores
    i = i + 1
    #Anidar segundo bucle
    for j in range(len(df["ENTIDAD_OCURRENCIAD"])):
        #Definir segundo valor de comparación
        ocu = df.iloc[j, 22]
        #Condición de evaluación
        if(res == ocu):
            #Las entidades corresponden
            print("La entidad de residencia y de ocurrencia del fallecimiento son la misma:", res)
            break
        else:
            print("Las entidades difieren:", res, ocu)

Este bucle ejecuta el mismo tipo de operación que el ejemplo anterior. La diferencia radica en que utiliza un loop `while` a fin de iterar a través de la secuencia de *entidad de residencia*. 

En este contexto, la variable contadora sirve para actualizar el proceso de iteración. Dada la condición impuesta, `i < len(df)`, la ejecución terminará una vez que se hayan abordado todas las filas del dataframe.

Dado que los cambios observados en bucles son de carácter permanente, es importante **no modificar o transformar** un objeto siguiendo este procedimiento, sino utilizar copias de la secuencia de trabajo.

## Reto de programación

Trabaje de manera colaborativa con su pareja asignada y genere una función que ejecute las siguientes tareas:

1. Obtener la edad, estado de ocurrencia, año de defunción y razón de mortalidad materna de las mujeres del dataset de *Muertes maternas*
2. Incorpore una funcionalidad que permita al usuario especificar el rango de edad, estado de ocurrencia y año de defunción que desea visualizar. Filtre el dataset con base en estos criterios.
3. Para las mujeres que permanezcan en el dataset filtrado, genere una ficha de datos que siga la siguiente estructura:

*Registro_**IndiceFilas**: Edad **años**; Estado de ocurrencia: **Estado**; Año de defunción: **año**; Causa de muerte: **Causa***

Ejemplo: *Registro_124: Edad: 24 años; Estado de ocurrencia: OAXACA; Año de defunción: 2006; Causa de muerte: Sangrado*

Utilice un **loop** para la construcción de las fichas de datos de las mujeres registradas.

4. Almacene la fichas generadas iterativamente en una lista contenedora
5. Exporte la lista final como un archivo de extensión .csv, cada una de las fichas debe corresponder a una fila en este archivo.

La función debe encontrarse adecuadamente documentada. La pareja que sea capaz de generar una función que cumpla con los requisitos primero recibirá 3 décimos adicionales sobre la calificación final. También se premiará el uso de herramientas computacionales que posibiliten una ejecución más eficiente y ordenada de la función. 

En caso de **no terminar** el ejercicio durante el horario de clase, su conclusión quedará pendiente como tarea.

In [4]:
#Definir función del reto
def gen_ficha():

    #Importar bibliotecas requeridas
    import pandas as pd

    #Filtrar columnas requeridas
    df_fl = df.iloc[:, [4, 22, 29, 38]]

    #Solicitar al usuario que indique criterios de filtrado
    age_min = int(input("¿Cuál es la edad mínima de las mujeres que desea conocer? "))
    age_max = int(input("¿Cuál es la edad máxima de las mujeres que desea conocer "))
    estado = input("Defina el estado de ocurrencia de las defunciones ").upper()
    año_df = int(input("Defina el año de ocurrencia de las defunciones "))

    #Filtrar datos con base a criterios
    df_fl = df_fl[(df_fl.EDAD > age_min) & 
                  (df_fl.EDAD < age_max) & 
                  (df_fl.ENTIDAD_OCURRENCIAD == estado) & 
                  (df_fl.ANIO_DEFUNCION == año_df)]
    
    #Verificar que haya datos
    if df_fl.shape[0] > 0:

        #Generar la lista contenedora
        ls_co = []

        #Definir bucle para la generación de las fichas
        for i in range(len(df_fl)):

            #Palabras a integrar para la ficha
            wds = ["Registro_", str(df_fl.index.values[i]), ":", 
                   "Edad:", str(df_fl.iloc[i,0]), "/", 
                   "Estado de ocurrencia:", str(df_fl.iloc[i,1]), "/", 
                   "Año de ocurrencia:", str(df_fl.iloc[i,2]), "/", 
                   "Causa de muerte:", str(df_fl.iloc[i,3])] 

            #Pegar todos los valores juntos:
            fic = " ".join(wds)

            #Depositar registros en contenedor
            ls_co.append(fic) 

        #Transformar lista en dataframe
        df_exp = pd.DataFrame(ls_co, columns = ["Fichas"])

        #Exportar dataframe como archivo .csv
        df_exp.to_csv("out_muj_defun.csv", index = False)
        
        #Señalar que el dataframe estará en directorio
        return print("Cantidad de registros encontrados:", df_exp.shape[0],
                     "\nEl archivo de excel con las fichas aparecerá en su directorio en unos segundos")
    
    #Si no se encontraron registros 
    else:
        print("No hay datos para los parámetros especificados")

In [5]:
#Ejecutar función generadora de fichas
gen_ficha()

¿Cuál es la edad mínima de las mujeres que desea conocer? 20
¿Cuál es la edad máxima de las mujeres que desea conocer 39
Defina el estado de ocurrencia de las defunciones oaxaca
Defina el año de ocurrencia de las defunciones 2009
Cantidad de registros encontrados: 50 
El archivo de excel con las fichas aparecerá en su directorio en unos segundos
