## Gestión de *funciones fruitful*

Es posible reconocer al menos dos clases de funciones en Python en dependencia del tipo de `output` que producen: **funciones fruitful** y **funciones void**. 

Las funciones fruitful son aquellas que producen un **valor de salida** que puede ser utilizado para la ejecución de otras tareas del programa. En contraste, las funciones void generan un efecto, como imprimir un valor, pero no **retornan** un valor en la memoria de la sesión. 

Es importante mantener algunas consideraciones especiales al momento de cosntruir una función fruitful.

In [1]:
#Cargar la base de datos de trabajo

#Importar bibliotecas requeridas
import pandas as pd
import numpy as np

#Importar el archivo de texto de extensión .csv
df = pd.read_csv("D:/Documentos/Otros/Aplicaciones/DESI/Muertes_maternas_2002_2021.csv")

A diferencia de las funciones void, las funciones fruitful *retornan* un valor de salida que puede ser utilizado como **input** para la ejecución de otras tareas. Este valor de salida puede ser almacenado en una **variable** o utilizado como parte de una **expresión**.

Por su parte, si se intentara almacenar el output de una función void, únicamente se obtendría un objeto de tipo `None`. 

In [10]:
#Generar la media de la edad de las mujeres
mjs_ed_mu = df["EDAD"].mean()

#Imprimir la media de la edad de las mujeres
print(mjs_ed_mu)

#Imprimir tipo de objeto
type(mjs_ed_mu)

29.72136637642331


numpy.float64

La función `mean()` retorna el promedio de la columna seleccionada de un dataframe. En este caso, se estimó la media de la variable de **edad** del dataset de *Muertes Maternas*. 

La media estimada es almacenada en la variable `mjs_ed_mu` para posteriormente ser utilizada en la expresión print. Al imprimir el tipo de objeto del que se trata, es posible observar que se trata de un número de tipo float.

## Return Values

En Python, el argumento `return` es utilizado para solicitar de forma explícita la devolución de un valor de salida que se genera luego de la ejecución de una función. 

El argumento `return` permite asignar un valor de retorno a las funciones que son diseñadas por el usuario para el cumplimiento de tareas concretas. De este modo, es posible obtener valores de retorno a partir de expresiones que se apoyan en el uso de funciones void, como el acto de imprimir un resultado. 

La ventaja de utilizar el argumento `return` yace en la posibilidad de **simplificar** el diseño de funciones dando orden al flujo de ejecución. 

In [2]:
#Diseñar una función que imprima la media de la edad de un grupo específico de mujeres

#Definir la función
def mean_mujs():
    #Definir el estado del que deben ser originarias las mujeres
    estado = input("Señale el estado de origen de las mujeres:")
    
    #Definir la edad mínima de las mujeres
    agemin = int(input("Señale la edad mínima de las mujeres:"))
    
    #Definir la edad máxima de las mujeres
    agemax = int(input("Señale la edad máxima de las mujeres:"))
    
    #Hacer filtrado de características y calcular la media
    df_fil = df[(df.ENTIDAD_RESIDENCIAD == estado) & (agemax > df.EDAD) & ( df.EDAD > agemin)]
    
    #Generar el valor de salida
    return round(df_fil["EDAD"].mean(),2)

#Ejecutar función
mean_mujs()

Señale el estado de origen de las mujeres:JALISCO
Señale la edad mínima de las mujeres:25
Señale la edad máxima de las mujeres:35


30.09

La función `mean_mjs` calcula la edad promedio de un grupo de mujeres en depedencia de tres criterios: el estado de residencia, la edad mínima y la edad máxima. La función concluye con la provisión de la edad promedio del grupo específicado mediante el argumento `return`.

La ejecución de este argumento **siempre** se verá acompañada por la **finalización del flujo de ejecución**, por lo que su uso debe estar bien definido.

El introducir una expresión `return` evita la necesidad de generar **variables temporales** que almacenen los resultados del flujo de ejecución. 

Su mayor espacio de aprovechamiento yace en las ramas (*branches*) que surjen como parte de la introducción de **sentencias condicionales** en un programa. Es posible colocar un `return` al final de cada rama para así **interrumpir** el flujo de ejecución una vez que un valor de salida es alcanzado por el cumplimiento de una condición y retornado al usuario.

El código que aparece después de que se ejecuta una argumento `return`, y que nunca se ejecuta, es conocido como **código muerto** (*dead code*).

In [8]:
#Ampliar la función para que estime la mediana si las mujeres son originarias de alguno de los estados más poblados del país

#Redefinir la función
def mean_mujs():
    #Definir el estado del que deben ser originarias las mujeres
    estado = input("Señale el estado de origen de las mujeres:")
    
    #Definir la edad mínima de las mujeres
    agemin = int(input("Señale la edad mínima de las mujeres:"))
    
    #Definir la edad máxima de las mujeres
    agemax = int(input("Señale la edad máxima de las mujeres:"))
    
    #Imponer condición de estado más poblado
    if estado == "MÉXICO" or estado == "JALISCO" or estado == "CIUDAD DE MÉXICO" or estado == "NUEVO LEÓN":
        #Definir dataframe de trabajo
        df_fil = df[(df.ENTIDAD_RESIDENCIAD == estado) & (agemax > df.EDAD) & ( df.EDAD > agemin)]
        #Devolver la media y la mediana
        return print("Media de la edad:", round(df_fil["EDAD"].mean(),2),
                     "\nMediana de la edad:", df_fil["EDAD"].median())
    
    #Calcular solo la media para los demás estados
    else:
        #Definir dataframe de trabajo
        df_fil = df[(df.ENTIDAD_RESIDENCIAD == estado) & (agemax > df.EDAD) & ( df.EDAD > agemin)]
        #Generar el valor de salida
        return round(df_fil["EDAD"].mean(),2)
    

#Ejecutar la función
med1 = mean_mujs()

Señale el estado de origen de las mujeres:SONORA
Señale la edad mínima de las mujeres:15
Señale la edad máxima de las mujeres:20


In [9]:
print(med1)
type(med1)

17.89


numpy.float64

Es una **buena práctica** asegurarse que cada una de las ramas de una función **concluya** con la ejecución de un `return`. En el caso de la función `mean_mjs`, destaca que los argumentos return fueron colocados al final de cada una de las ejecuciones alternativas.

## Incremental Development

Conforme la **complejidad** de las funciones diseñadas por el usuario incrementa, es deseable probar el adecuado funcionamiento del código en partes. De modo que sea posible verificar que cada una de las etapas del flujo de ejecución retorna los valores esperados. 

Esta práctica es conocida como *incremental development* y una forma en que puede ser ejecutada es mediante el aprovechamiento del método `return`. 

En este sentido, es posible utilizar el return a fin de *testear* cada una de las etapas de diseño del algoritmo y avanzar conforme se consigan los resultados esperados.

In [14]:
#Diseñar una función que entregue la causa de defunción más común entre las mujeres

#Primera etapa: definir los estados y edades deseados
def causa_def():
    #Definir el estado del que deben ser originarias las mujeres
    estado = input("Señale el estado de origen de las mujeres:")
    
    #Definir la edad mínima de las mujeres
    agemin = int(input("Señale la edad mínima de las mujeres:"))
    
    #Definir la edad máxima de las mujeres
    agemax = int(input("Señale la edad máxima de las mujeres:"))
    
    #Retornar el valor de los filtros
    return estado, agemin, agemax

#Ejecutar función
causa_def()

Señale el estado de origen de las mujeres:CHIAPAS
Señale la edad mínima de las mujeres:24
Señale la edad máxima de las mujeres:25


('CHIAPAS', 24, 25)

Como parte de la primera etapa de diseño, fue posible verificar que la función captura adecuadamente los valores deseados para el filtrado que son introducidos mediante la función `input`. Esto se verificar mediante el uso del argumento `return`. 

A continuación, se verificará si la operación de filtrado que tiene lugar al interior de la función se desarrolla correctamente:

In [16]:
#Diseñar una función que entregue la causa de defunción más común entre las mujeres

#Segunda etapa: definir la operación de filtrado
def causa_def():
    #Definir el estado del que deben ser originarias las mujeres
    estado = input("Señale el estado de origen de las mujeres:")
    
    #Definir la edad mínima de las mujeres
    agemin = int(input("Señale la edad mínima de las mujeres:"))
    
    #Definir la edad máxima de las mujeres
    agemax = int(input("Señale la edad máxima de las mujeres:"))
    
    #Definir dataframe de trabajo
    df_fil = df[(df.ENTIDAD_RESIDENCIAD == estado) & (agemax > df.EDAD) & ( df.EDAD > agemin)]
    
    #Retornar el valor de los filtros
    return df_fil["ENTIDAD_RESIDENCIAD"].unique(), df_fil["EDAD"].unique()

#Ejecutar función
causa_def()

Señale el estado de origen de las mujeres:CHIAPAS
Señale la edad mínima de las mujeres:35
Señale la edad máxima de las mujeres:38


(array(['CHIAPAS'], dtype=object), array([36, 37], dtype=int64))

La verificación de la segunda etapa de diseño permite constatar que el filtrado se ejecutó adecuadamente, en tanto que los valores finales en las columnas de **entidad de residencia** y **edad** son consistentes con los argumentos de filtrado.

Finalmente, es posible evaluar si la función ejecuta de manera correcta la tarea de conteo y ordenación de la causa del fallecimiento:

In [30]:
#Diseñar una función que entregue la causa de defunción más común entre las mujeres

#Tercera etapa: definir la operación de conteo y ordenación de resultados
def causa_def():
    #Definir el estado del que deben ser originarias las mujeres
    estado = input("Señale el estado de origen de las mujeres:")
    
    #Definir la edad mínima de las mujeres
    agemin = int(input("Señale la edad mínima de las mujeres:"))
    
    #Definir la edad máxima de las mujeres
    agemax = int(input("Señale la edad máxima de las mujeres:"))
    
    #Definir dataframe de trabajo
    df_fil = df[(df.ENTIDAD_RESIDENCIAD == estado) & (agemax > df.EDAD) & ( df.EDAD > agemin)]
    
    #Definir conteo por causa de fallecimiento y ordenar
    cs_fl = pd.DataFrame(df_fil.groupby(["CAUSA_CIE_4D"])["CAUSA_CIE_4D"].count())
    
    #Renombrar nombre de columna de conteo
    cs_fl.rename({"CAUSA_CIE_4D":"Conteo"}, axis=1, inplace=True)
    
    #Ordenar conteo de forma descendente
    cs_fl = cs_fl.sort_values("Conteo", ascending = False)
    
    #Retornar el valor de los filtros
    return cs_fl

#Ejecutar función
causa_def()

Señale el estado de origen de las mujeres:CHIAPAS
Señale la edad mínima de las mujeres:18
Señale la edad máxima de las mujeres:29


Unnamed: 0_level_0,Conteo
CAUSA_CIE_4D,Unnamed: 1_level_1
O721 OTRAS HEMORRAGIAS POSTPARTO INMEDIATAS,52
O150 ECLAMPSIA EN EL EMBARAZO,51
O720 HEMORRAGIA DEL TERCER PERÍODO DEL PARTO,50
"O998 OTRAS ENFERMEDADES ESPECIFICADAS Y AFECCIONES QUE COMPLICAN EL EMBARAZO, EL PARTO Y EL PUERPERIO",47
O141 PREECLAMPSIA SEVERA,35
...,...
"O439 TRASTORNO DE LA PLACENTA, NO ESPECIFICADO",1
O438 OTROS TRASTORNOS PLACENTARIOS,1
O860 INFECCIÓN DE HERIDA QUIRÚRGICA OBSTÉTRICA,1
O881 EMBOLIA DE LÍQUIDO AMNIÓTICO,1


La función `pd.DataFrame` de la biblioteca `Pandas` permite generar un objeto de tipo *Dataframe* a partir de un array ya existente en la memoria de trabajo de la sesión. Por su parte, el método `groupby` hace posible agrupar a las observaciones del dataframe con base en los **niveles** de la variable `CAUSA_CIE_4D` que contiene las categorías de fallecimiento por muerte materna. Finalmente, la función `count` hace un conteo de la cantidad de registros en cada uno de los niveles de la variable de agrupación. 

La función `rename` permite renombrar las variables que son provistas al interior del diccionario que sirve como argumento de esta función. Por otro lado, la función `sort_values` ordena los valores de la columna especificada como argumento.

La evaluación del output de la función hace explícito que ésta realiza adecuadamente las tareas de contabilizar la cantidad de eventos de cada una de las causas de muerte materna al interior del grupo específicado, así como de ordenar estos valores de manera descendente.

En el caso de las mujeres del estado de Chiapas, situadas en el rango de edad que va de los 18 a los 29 años, la causa más recurrente de fallecimiento fue la de **OTRAS HEMORRAGIAS POSTPARTO INMEDIATAS**.

Como paso final, resta filtrar el output de la función para recuperar únicamente la causa más común. 

In [8]:
#Diseñar una función que entregue la causa de defunción más común entre las mujeres

#Tercera etapa: definir la operación de conteo y ordenación de resultados
def causa_def():
    #Definir el estado del que deben ser originarias las mujeres
    estado = input("Señale el estado de origen de las mujeres:")
    
    #Definir la edad mínima de las mujeres
    agemin = int(input("Señale la edad mínima de las mujeres:"))
    
    #Definir la edad máxima de las mujeres
    agemax = int(input("Señale la edad máxima de las mujeres:"))
    
    #Definir dataframe de trabajo
    df_fil = df[(df.ENTIDAD_RESIDENCIAD == estado) & (agemax > df.EDAD) & ( df.EDAD > agemin)]
    
    #Definir conteo por causa de fallecimiento y ordenar
    cs_fl = pd.DataFrame(df_fil.groupby(["CAUSA_CIE_4D"])["CAUSA_CIE_4D"].count())
    
    #Renombrar nombre de columna de conteo
    cs_fl.rename({"CAUSA_CIE_4D":"Conteo"}, axis=1, inplace = True)
    
    #Ordenar conteo de forma descendente
    cs_fl = cs_fl.sort_values("Conteo", ascending = False)
    
    #Recuperar únicamente la causa más recurrente
    cs_fl = cs_fl.iloc[0,:]
    
    #Retornar el valor de los filtros
    return cs_fl

#Ejecutar función
causa_def()

Señale el estado de origen de las mujeres:JALISCO
Señale la edad mínima de las mujeres:18
Señale la edad máxima de las mujeres:25


Unnamed: 0_level_0,Conteo
CAUSA_CIE_4D,Unnamed: 1_level_1
C58X TUMOR MALIGNO DE LA PLACENTA,4
O001 EMBARAZO TUBÁRICO,3
O008 OTROS EMBARAZOS ECTÓPICOS,1
"O009 EMBARAZO ECTÓPICO, NO ESPECIFICADO",1
O021 ABORTO RETENIDO,1
...,...
"O993 TRASTORNOS MENTALES Y ENFERMEDADES DEL SISTEMA NERVIOSO QUE COMPLICAN EL EMBARAZO, EL PARTO Y EL PUERPERIO",4
"O994 ENFERMEDADES DEL SISTEMA CIRCULATORIO QUE COMPLICAN EL EMBARAZO, EL PARTO Y EL PURPERIO",14
"O995 ENFERMEDADES DEL SISTEMA RESPIRATORIO QUE COMPLICAN EL EMBARAZO, EL PARTO Y EL PUERPERIO",13
"O996 ENFERMEDADES DEL SISTEMA DIGESTIVO QUE COMPLICAN EL EMBARAZO, EL PARTO Y EL PUERPERIO",5


La operación de filtrado para la recuperación de la causa de fallecimiento más común es ejecutada mediante la función `iloc`. En este caso, la lista `[0, :]` indica que se solicita la obtención de la fila ubicada en la primera posición para todas las columnas del dataframe. 

Ya que la única columna de la estructura corresponde a **Conteo**, el valor de salida de la función es el de un objeto de dimensiones: 1 x 1. 

En tanto que el método `return` recupera la forma final del dataset trabajado como parte del flujo de ejecución de la función, cabe la posibilidad de asignarlo directamente a una **variable**.

Al hacerlo, se reconoce el carácter **fruitful** de la función *causa_def*. Con un objeto de tipo `series` como valor de salida.

In [34]:
#Asignar valor de salida de la función a una variable
resu_ex = causa_def()

Señale el estado de origen de las mujeres:CHIAPAS
Señale la edad mínima de las mujeres:18
Señale la edad máxima de las mujeres:29


In [35]:
#Imprimir valor de salida y su tipo
print(resu_ex)
type(resu_ex)

Conteo    52
Name: O721  OTRAS HEMORRAGIAS POSTPARTO INMEDIATAS, dtype: int64


pandas.core.series.Series

## Funciones booleanas

Algunas funciones pueden retornar **valores booleanos** como output. Este tipo de valor de salida puede ser de utilidad para ejecutar otras tareas del flujo de ejecución.

Es común asignar a estas funciones un **nombre** que indique el cumplimiento de una condición: *esVerdadero*. Este nombre puede ser indicativo de que el valor de salida de la función será un objeto `True` o `False`.

In [11]:
#Generar una función para verificar si una mujer es originaria de Jalisco

#Definir una función
def esDeJalisco(estado):
    if estado == "JALISCO":
        return True
    else:
        return False

#Ejecutar la función 
esDeJalisco("JALISCO")

True

La función `esDeJalisco` verifica si el string provisto como argumento es igual a **Jalisco**. Esta función puede ser utilizada para la puesta en marcha de tareas de verificación y control. 

In [13]:
#Aumentar la función que entrega la causa de defunción para ejecutarse sólo cuando se pregunta por mujeres de Jalisco

#Redefinir función
def causa_def():
    #Definir el estado del que deben ser originarias las mujeres
    estado = input("Señale el estado de origen de las mujeres:")
    
    #Verificar si se pregunta por mujeres de Jalisco
    if esDeJalisco(estado) == True:
    
        #Definir la edad mínima de las mujeres
        agemin = int(input("Señale la edad mínima de las mujeres:"))

        #Definir la edad máxima de las mujeres
        agemax = int(input("Señale la edad máxima de las mujeres:"))

        #Definir dataframe de trabajo
        df_fil = df[(df.ENTIDAD_RESIDENCIAD == estado) & (agemax > df.EDAD) & ( df.EDAD > agemin)]

        #Definir conteo por causa de fallecimiento y ordenar
        cs_fl = pd.DataFrame(df_fil.groupby(["CAUSA_CIE_4D"])["CAUSA_CIE_4D"].count())

        #Renombrar nombre de columna de conteo
        cs_fl.rename({"CAUSA_CIE_4D":"Conteo"}, axis=1, inplace = True)

        #Ordenar conteo de forma descendente
        cs_fl = cs_fl.sort_values("Conteo", ascending = False)

        #Recuperar únicamente la causa más recurrente
        cs_fl = cs_fl.iloc[0,:]

        #Retornar el valor de los filtros
        return cs_fl
    
    #Terminar el flujo de ejecución si no se pregunta por mujeres de Jalisco
    else:
        return "Resultados no disponibles"
        
#Implementar la función
causa_def()

Señale el estado de origen de las mujeres:CHIAPAS


'Resultados no disponibles'

Dado que el valor de salida de las funciones que retornan valores **True/False** es de tipo booleano, es posible incorporalas a los flujos de ejecución de forma más **concisa**. 

In [14]:
#Reescribir la función de manera más concisa

#Redefinir función
def causa_def():
    #Definir el estado del que deben ser originarias las mujeres
    estado = input("Señale el estado de origen de las mujeres:")
    
    #Verificar si se pregunta por mujeres de Jalisco
    if esDeJalisco(estado):
    
        #Definir la edad mínima de las mujeres
        agemin = int(input("Señale la edad mínima de las mujeres:"))

        #Definir la edad máxima de las mujeres
        agemax = int(input("Señale la edad máxima de las mujeres:"))

        #Definir dataframe de trabajo
        df_fil = df[(df.ENTIDAD_RESIDENCIAD == estado) & (agemax > df.EDAD) & ( df.EDAD > agemin)]

        #Definir conteo por causa de fallecimiento y ordenar
        cs_fl = pd.DataFrame(df_fil.groupby(["CAUSA_CIE_4D"])["CAUSA_CIE_4D"].count())

        #Renombrar nombre de columna de conteo
        cs_fl.rename({"CAUSA_CIE_4D":"Conteo"}, axis=1, inplace = True)

        #Ordenar conteo de forma descendente
        cs_fl = cs_fl.sort_values("Conteo", ascending = False)

        #Recuperar únicamente la causa más recurrente
        cs_fl = cs_fl.iloc[0,:]

        #Retornar el valor de los filtros
        return cs_fl
    
    #Terminar el flujo de ejecución si no se pregunta por mujeres de Jalisco
    else:
        return "Resultados no disponibles"
        
#Implementar la función
causa_def()

Señale el estado de origen de las mujeres:JALISCO
Señale la edad mínima de las mujeres:16
Señale la edad máxima de las mujeres:26


Conteo    33
Name: O998  OTRAS ENFERMEDADES ESPECIFICADAS Y AFECCIONES QUE COMPLICAN EL EMBARAZO, EL PARTO Y EL PUERPERIO, dtype: int64

En la primera especificación de la función, la línea: `if esDeJalisco(estado) == True:` evalúa dos condiciones: primero la que se ejecuta como parte de la función `esDeJalisco` y, posteriormente, si el valor de salida de esta función es igual a `True`. 

Dado que el método `if` solo necesita de un valor `True` para ejecutar el cuerpo de la sentencia condicional, el incorporar una segunda verificación es innecesario.