# Material pre clase 4 - Funciones

El objetivo principal de esta clase es estudiar la definición, implementación y organización de funciones en Python. Para ello, se debe tener un claro entendimiento tanto de las bases del lenguaje como del marco conceptual de cajas negras que utilizamos hasta ahora para analizar funciones. Más específicamente, los temas que vamos a ver son:

- Como definir funciones
- Como llamar funciones
- Argumentos de entrada
    - Argumentos obligatorios
    - Argumentos opcionales
    - Argumentos por defecto
- Argumentos de salida
- Documentación
- Diseño de funciones
- Recursividad


## Definiendo funciones

Las funciones comprenden un bloque de código que implementa cierta funcionalidad. Dividir el código en funciones nos permite ordernar el código, hacerlo mas legible, reusarlo, y agilizar algunos procesos.

Para comprender la idea detrás de las funciones suele ser útil recurrir al concepto de **caja negra**. Este hace referencia a un bloque que, dada un cierto numero de entradas, aplica procesamientos y genera un conjunto determinado de salidas. 

<img src="imagenes/funciones_1.png" alt="Drawing"/>

Cuando pensemos en el diagrama de flujo de un programa, podemos utilizar este concepto para modularizar procesamientos dentro del programa, y de esa forma poder organizar el desarrollo del código, haciéndolo robusto frente a cambios inconsistentes y al trabajo conjunto de varias personas, permitiéndonos crear herramientas de código reutilizables y de fácil depuración. 

Para definir una función hacemos uso de la palabra reservada **def**. Luego de la palabra **def** debemos incluir el nombre de la función, seguido de los parámetros de entrada entre paréntesis. Finalmente, esta sentencia inicial se finaliza con el caracter **:** luego del cual debe comenzar el bloque indentado que conforma el cuerpo de la función. El final del indentado me indica el final de la función.

Dentro del bloque identado, lo primero siempre debe ser el *docstring* o documentación de la función. Este consiste en un comentario de párrafo en el cual se debe explicar por completo y a detalle que proceso realiza la función y cómo se debe utilizar. Es probablemente la parte mas importante de la función, pues la gran mayoría de veces que usemos una función nos vamos a guiar por su documentación, mientras que del código solo nos preocupamos una sola vez, cuando creamos la función (o cuando arreglamos algun bug). Hablaremos de docstrings mas adelante en esta misma clase.

Luego de la documentación, siguen las sentencias de código que realizan los procesos de la función.

Por útilmo, la función puede tener variables de salida, las cuales se indican utilizando la palabra reservada **return**. Esta palabra reservada indica el final de la función, y luego de la misma se especifican las salidas de la función. 

<img src="imagenes/funciones_2.png" alt="Drawing"/>

vamos a crear, a modo de ejemplo, la función de la imagen llamada "calculate_average" que reciba como argumentos de entrada dos numeros cualesquiera, compute el promedio entre ambos, y devuelva como salida el promedio calculado:

In [4]:
def calculate_average(var_1, var_2):
    """
    Calculate the average between 2 numeric 
    input variables.
    """
    avg = (var_1 + var_2) / 2
    return avg

## Llamando funciones

El primer requisito para poder llamar una función es que esa función exista dentro del entorno de ejecución, es decir, que se encuentre definida. Al igual que las variables, si quiero utilizar una función que no defini, el intérprete no va a poder ejecutar la sentencia y obtendremos un error de variable no definida

In [2]:
calculate_averagee # doble "e" para forzar un error

NameError: name 'calculate_averagee' is not defined

Una vez que definimos la función, como en la primer celda de código de este Notebook, para llamar a dicha función tenemos que simplemente escribir el nombre de la función, seguido de los paréntesis **()**, ubicando los argumentos de entrada necesario entre ellos. Por ejemplo, llamemos a la función que creamos con los valores 8 y 9 

In [3]:
calculate_average(8,9)

8.5

De esta forma, una vez que definimos la función dentro del intérprete, podemos utilizarla cuanto querramos

In [6]:
calculate_average(9.9999,10)

9.99995

## Argumentos de entrada
### Argumentos posicionales

Los términos "argumentos", "parámetros" o "variables" de entrada se utilizan indistintamente para referirse a las entradas de una función. 

Como vimos, los argumentos se detallan luego del nombre de la función cuando la definimos. Uno puede incluir tantos argumentos de entrada como necesite, separándolos por coma. Por ejemplo, puedo redefinir mi función para que reciba ahora 3 variables

In [30]:
def calculate_average(var_1, var_2, var_3):
    """
    Calculate the average between 2 numeric 
    input variables.
    """
    avg = (var_1 + var_2 + var_3) / 3
    return avg

In [8]:
calculate_average(1,2,3)

2.0

Cuando definimos los argumentos de esta manera, la función debe ser llamada con el número correcto de argumentos. Si la definición de la función tiene 3 argumentos de entrada, cuando hago una llamada la función *va a esperar* ser llamada con 3 argumentos, de lo contrario resulta en un error. 

In [9]:
calculate_average(1,2)

TypeError: calculate_average() missing 1 required positional argument: 'var_3'

Es por esto que estos argumentos reciben el nombre de **argumentos posicionales obligatorios**, ya que para utilizar la función estamos obligados a definirlos, y los mismos se definen en un determinado orden. 

Es decir, con el siguiente llamado ```calculate_average(1,2,3)```, las variables dentro de la función valen: 
```
    var_1 --> 1
    var_2 --> 2
    var_3 --> 3
```
a diferencia, por ejemplo, del llamado ```calculate_average(3,1,2)``` en donde las variables dentro de la función valdrían:

```
    var_1 --> 3
    var_2 --> 1
    var_3 --> 2
```

### Argumentos arbitrarios

Puede ocurrir que yo no sepa exactamente cuantos parámetros de entrada va a requerir mi función. Por ejemplo, yendo a un caso real, supongamos que quiero definir una función que me calcule el promedio de las notas de TP para todos los estudiantes de la cátedra. Este cuatrimestre cuento con 12 estudiantes, por lo cual debería tener 12 variables de entrada, una por cada estudiante. Ahora, si defino esta función con 12 variables de entrada, si o si voy a tener que ingresar 12 notas para usarla. Esto es una característica que limita el alcance de mi función, solo sirve para cursos que tengan 12 estudiantes. Si el cuatrimestre que viene tengo 10 estudiantes, no voy a poder usar esta función de manera directa. Tendría que volver a definir una función que tenga 10 variables de entrada, lo que generaría una nueva función muy limitada y prácticamente no reutilizable. Para estos casos, puedo definir una función que reciba un *número variable de argumentos de entrada*.

Para coseguir esto, agrego un simbolo \* antes del nombre del parámetro de entrada en la definición de la función. De esta forma, la función va a agrupar los parámetros dentro de una tupla, a través de la cual puedo luego acceder a sus valores a partir de índices. 

En las documentaciones, los argumentos arbitrarios suelen indicarse con el término **\*args**

Por ejemplo

In [31]:
def print_variable_inputs(*input_vars):
    i = 0
    for var in input_vars:
        print(f"this is the variable with index {i}, and its value is: {var}")
        i += 1
    return None

In [32]:
print_variable_inputs("Hola!")

this is the variable with index 0, and its value is: Hola!


In [33]:
print_variable_inputs("Hola!", "muchas", "Variables!", 912)

this is the variable with index 0, and its value is: Hola!
this is the variable with index 1, and its value is: muchas
this is the variable with index 2, and its value is: Variables!
this is the variable with index 3, and its value is: 912


Con respecto a esta función, podemos hacer dos cambios importantes. En primer lugar, esta forma de implementar un contador es poco eficiente. Cuando el contador se relaciona directamente con la variable que estamos iterando (en este caso la tupla *input_vars*) podemos usar la función inegrada **enumerate**. Se recomienda primero leer su documentación, pero básicamente lo que hace esta función es permitirnos recorrer el iterable obteniendo tanto la variable como el índice de la misma, ahorrandonos de esta forma el contador. Por último, se puede dejar la sentencia **return** sin ninguna variable de salida, lo que equivale a tener como salida un "None". Entonces, la función quedaría:

In [15]:
def print_variable_inputs(*input_vars):
    for i, var in enumerate(input_vars):
        print(f"this is the variable with index {i}, and its value is: {var}")
    return 

In [16]:
print_variable_inputs("Hola!", "muchas", "Variables!", 912)

this is the variable with index 0, and its value is: Hola!
this is the variable with index 1, and its value is: muchas
this is the variable with index 2, and its value is: Variables!
this is the variable with index 3, and its value is: 912


Ahora, puedo aplicar este concepto de número arbitrario de variables de entrada para el ejemplo de la función que calculaba promedios. Anteriormente, definimos esta función para 2 valores de manera explícita. Ahora, podriamos pensar en una implementación que compute el promedio de valores sin importar con cuantos valores de entrada llame a la función. Intenten dar con esa implementación antes de ver la solución de las proximas celdas, se deja un espacio en blanco intencionalmente:


.

.

.

.

.

.

.

.

.

.

.

In [17]:
def calculate_average(*input_vars):
    """
    Calculate the average between numeric 
    input variables.
    """
    acum = 0
    for var in input_vars:
        acum += var
    
    avg = acum / len(input_vars)
    return avg

In [24]:
calculate_average(10)

10.0

In [25]:
calculate_average(10, 9)

9.5

In [26]:
calculate_average(10, 9, 8, 7, 6, 5)

7.5

Esta implementación busca ser lo mas primitiva posible, utilizando las herramientas nativas de python que vimos con fines educativos. Siempre que encuentren una implementación de algún proceso que quieren realizar dentro de una librería, lo mejor es utilizar esa implementación por sobre la nuestra. Por eso, luego de pensar y diseñar las funciones que necesito, el siguiente paso debería ser siempre investigar que cosas me puedo ahorrar implementar por mi cuenta, y que cosas no. En este caso, Numpy cuenta con una función que calcula el promedio de manera mucho mas eficiente 

In [29]:
import numpy as np

np.mean([10, 9, 8, 7, 6, 5])

7.5

## Argumentos por palabra clave (keyword args)

Los argumentos por palabra clave nos permiten desentendernos del orden en el que ingresamos los argumentos a la hora de llamar una función. Para hacerlo, seguimos la sintaxis ```key = value``` en donde la key pasa a ser el nombre de variable que elegimos en la definición de la función, y value pasa a ser el valor que le queremos dar a esa variable en el llamado de la función. Por ejemplo, si se define la siguiente función

In [43]:
def print_date(day, month, year):
    print(f"Today is {day}/{month}/{year}")

In [49]:
print_date(13, 10, 12) # cual es la correcta?
print_date(23, 13, 10)

Today is 13/10/12
Today is 23/13/10


Uno puede olvidarse rapidamente si primero debe ingresar el dia y luego el mes, o al revés. Para evitar confusiones, podriamos pasar argumentos por palabras clave. De esta forma, sin importar el orden en que pase los argumentos, siempre voy a tener el mismo resultado ya que estoy definiendo cada variable de entrada explícitamente. 

In [51]:
print_date(day=13, month=10, year=12)

Today is 13/10/12


In [53]:
print_date(year=12, day=13, month=10)

Today is 13/10/12


In [54]:
print_date(month=10, year=12, day=13)

Today is 13/10/12


Al igual que antes, puede haber una aplicación para la cual necesito definir un número arbitrario de parámetros que serán pasados por palabra clave. Es decir, un número variable de keyword-arguments. Para ello, podemos agregar el símbolo \** delante del parámetro de entrada, de forma tal que la función reciba un diccionario de argumentos, al cual puede acceder como a cualquier otro diccionario. Usualmente, en la documentación de funciones este tipo de parámetros arbitrarios se definen con el nombre ****kwargs**.

In [55]:
def print_date(year, day, month, **kwargs):
    print(f"Today is {day}/{month}/{year}")
    print(f"And the weather is {kwargs['weather']}")

In [59]:
print_date(13,10,12, weather='rainy', country='arg')

Today is 10/12/13
And the weather is rainy


## Argumentos por defecto

Los argumentos por defecto se definen junto con la función, indicándose el valor que tomaria una variable de entrada en el caso de no ser explícitamente definida en el llamado. Por ejemplo:

In [60]:
def print_fs(fs=16000):
    print(f"The sample frequency is {fs} Hz/s")

In [61]:
print_fs(44100)

The sample frequency is 44100 Hz/s


In [62]:
print_fs()

The sample frequency is 16000 Hz/s


In [63]:
print_fs(48000)

The sample frequency is 48000 Hz/s


## Argumentos de salida

Como vimos, los valores de salida se especifican luego de la palabra reservada **return**, que además delimita el fin de la función. Por esto, debemos prestar atención en que la sentencia que devuelve los valores de salida sea la última sentencia de la función. Si definimos algo luego de esta sentencia que pretendemos que se ejecute cuando llamamos a la función, esto no va a ocurrir ya que luego de la linea de return la función se da por terminada. Usualmente, los valores de salida se reciben o guardan en variables. Por ejemplo

In [64]:
def square(x):
    squared = x*x
    return squared

In [65]:
square(2)

4

In [66]:
val = square(2)
print(val)

4


Puedo definir varias salidas, y utilizar el concepto de desempaquetado para almacenarlas en variables separadas.

In [68]:
def square(x):
    squared = x*x
    squared_squared = squared * squared
    return squared, squared_squared

In [69]:
square(2)

(4, 16)

In [70]:
val_1, val_2 = square(2)

In [71]:
print(val_1)

4


In [72]:
print(val_2)

16


## Funciones vacías

Las definiciones de funciones no pueden estar vacias. Muchas veces queremos definir solo el nombre de la función y sus entradas, cuando estamos construyendo el esquema de nuestro código. Para poder trabajar haciendo esto sin generar un error en la ejecución, podemos usar la sentencia **pass** como un texto provisorio o *placeholder* para lo que luego será la definición final de una función. 

In [76]:
def possible_function(arg1, arg2):
    

IndentationError: expected an indented block (3149068436.py, line 2)

In [77]:
def possible_function(arg1, arg2):
    pass

# Documentación


La documentación, como dijimos, es la parte mas importante de una función. La misma debe contener toda la información necesaria para poder utilizar correctamente la función, despejando todo tipo de ambiguedades. Como regla general, cualquier forma equivocada de utilizar una función debe estar explícitamente informada en su documentación. 

Comúnmente, ciertas bibliotecas comparten determinados formatos para redactar la documentación de sus módulos y funciones. En general, la documentación debe contar con 3 partes principales:

- Descripción general de la función: Es un parrafo inicial en donde se comenta a grandes rasgos cual es el fin de la función, y también puede nombrar características destacables de su implementación o su funcionamiento, o hacer aclaraciones sobre cuestiones pertinentes a versiones o relaciones con otras funciones.
- Argumentos de entrada: comúnmente se coloca un subtitulo debajo del cual se listan los argumentos de entrada. Para cada argumento se especifica su nombre, el tipo de dato que se acepta, y una breve descripción de lo que representa su valor. Se aclará aqui también cualquier funcionamiento particular que pueda adquirir la función en base a la definición o no definición de cada argumento.
- Argumentos de salida: al igual que los argumentos de entrada, se coloca un subtitulo y se listan describiendo las mismas características. 
    
Toda esta información debe estar en inglés, y será corregida con la misma rigurosidad que las sentencias de código. Un ejemplo de una documentación posible para la primera función que definimos podria ser:

<img src="imagenes/funciones_3.png" alt="Drawing"/>



In [None]:
## Diseño de funciones


In [None]:
diseño

- limitaciones 
- generalizacion
- autodocumentacion
- modularización
- reutilizabilidad

## Bonustrack

Podemos crear una función, que dentro de su bloque de código se llame a si misma. Esto es, una función llamando a una función que resulta ser ella misma, y por ende volverá a llamar a una función que sera ella misma de nuevo que a su vez llamara.... Como vemos, a priori esta idea nos devuelve un numero infinito de llamadas a una función.

Debemos ser bastante cuidadosos cuando definimos una función recursiva, ya que facilmente podemos terminar con una función que nunca termina, es decir, que se ejecuta infinitamente. También puede ocurrir que termine, pero que antes de eso necesite ocupar mas memoria o capacidad de cómputo de la que tenemos disponibles, generardo que nuestro sistema colapse. 

Existen problemas de computo que tienen resoluciones muy bellas a partir de funciones recursivas. Sin embargo, el uso y diseño de este tipo de funciones es un apartado que requiere de un largo estudio y análisis matemático y computacional, cuestiones que escapan a este curso. Por ahora, nos basta con saber que este tipo de funciones existen, que muchas veces ofrecen soluciones de baja complejidad computacional y que se puede estudiar y aprender a diseñar este tipo de soluciones.