#  Clase 4: Programación Funcional

**MDS7202: Laboratorio de Programación Científica para Ciencia de Datos**

*Profesor: Pablo Badilla Torrealba*

## Objetivos de la Clase:

- Funciones y su sintaxis en Python
- Scopes
- Testing
- Programación funcional: `lambdas`, `map`, `filter` y `reduce`
- Referencias y Mutabilidad
- Documentación


---

## Parte 1: Funciones


Una función es un segmento de código separado del código principal, la cual puede ser ejecutada (de aquí en adelante, *invocada*) desde cualquier otro punto del programa (incluyendo de si misma).

Las funciones por lo general toman parámetros, que en términos prácticos, son los datos sobre los cuales operarán.

### Sintaxis Básica

En Python, una función se define por medio de la keyword `def` seguido por el nombre y los parámetros que recibirá de entrada la función. 


```python
def función_1(parámetro_1, parámetro_2): 
    acción
    ...

```


#### Return

La keyword ```return``` permite que valores definidos dentro de la función puedan ser retornadas hacia el exterior.  Una función definida sin ```return``` entrega como resultado el tipo de datos ```None```.

```python
def función_2(parámetro_1, parámetro_2): 
    acción
    nuevo_valor = ...
    ...
    
    return nuevo_valor

```

> **Nota 📝**: Parametro es el nombre de la variable dentro de la función. Argumento es el valor que le pasamos a el parámetro al momento de invocar la función. Se pueden usar indistintivamente.



#### Invocación 

Para invocar una función (*ejecutarla*), se utiliza el nombre de la función junto a dos paréntesis que encierran los argumentos.

```python
def función_2(parámetro_1, parámetro_2): 
    acción
    nuevo_valor = ...
    ...
    
    return nuevo_valor


variable_1 = 1
variable_2 = 2

función_2(variable_1, variable_2)
```


Ya hemos estudiado funciones básicas de Python, como lo son `print()`, `type()` o `isinstance()`.


> **Ejemplo 📖**

La función ```sumar(a, b)``` que suma dos número esta definida por:

In [4]:
def sumar(a, b):
    c = a + b
    return c

In [5]:
sumar(10, 200)

210

> **Pregunta ❓:** ¿Qué sucede con la variable `c` definida dentro de la función?

In [7]:
c

0

### Elementos extra de la sintáxis de funciones

#### Parámetros nombrados

Las funciones de python tambíen aceptan parámetros nombrados. Es decir, al invocar la función indicarle especificamente el valor de cada parámetro por su nombre.

In [None]:
def sumar(a, b):
    c = a + b
    return c

In [8]:
sumar(a=10, b=20)

30

In [10]:
sumar(b=40, a=20)

60

> **Pregunta ❓**: ¿Puede tener 0 parámetros una función?¿Y pueden tener n?

#### Cero parámetros

Una función puede ser ejecutada sin necesidad de tener parámetros.
En este caso (idealmente) la función siempre debería hacer la misma acción.

In [11]:
def hola_mundo():
    print('Hola!😊')

hola_mundo()

Hola!😊


#### N parámetros

Una función puede tomar n parámetros no previamente definidos. 
Esto lo logra a través del parámetro `*args`, el cuál actua como una tupla:

In [12]:
def funcion_n_parametros(*args):
    # args= parámetros sin nombre
    print('Los parámetros entregados son:', args)

funcion_n_parametros(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12)

Los parámetros entregados son: (1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12)


¿Cuál es la utilidad de esto?

In [13]:
def suma_n(*args): 
    acum = 0
    for i in args:
        acum += i
    return acum

suma_n(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12)

78

In [16]:


def suma_n(lista_de_numeros):
    acum = 0
    for i in lista_de_numeros:
        acum += i
    return acum

#### N Parámetros nombrados

Las funciones también pueden tomar n parámetros nombrados a través de `**kwargs`, el cúal se comporta como un diccionario.

In [19]:
def funcion_n_parametros_nombrados(*args, **kwargs): 
    print(kwargs)
    
argumentos = {'parametro_nombrado_1': True, 'parametro_nombrado_2': False, 'parametro_nombrado_5': False}
funcion_n_parametros_nombrados(**argumentos)

{'parametro_nombrado_1': True, 'parametro_nombrado_2': False, 'parametro_nombrado_5': False}


#### Valores por defecto

Los parámetros también pueden tener valores por defecto:


> **Nota 📝:** Los parámetros con valores por defecto deben ser declarados a la derecha de todos aquellos parámetros sin valores predefinidos.


In [23]:
def sumar_2(a, b=2, advertencias=False):
    if advertencias == True:
        print('Cuidado')
    c = a + b
    print(f'a : {a} | b : {b} | c : {c} | advertencias : {advertencias}')
    return c

In [24]:
sumar_2(10)

a : 10 | b : 2 | c : 12 | advertencias : False


12

In [25]:
sumar_2(10, b=2000)

a : 10 | b : 2000 | c : 2010 | advertencias : False


2010

In [26]:
sumar_2(10, advertencias=True)

Cuidado
a : 10 | b : 2 | c : 12 | advertencias : True


12

#### Retornar múltiples valores

También se pueden retornar múltiples valores

In [27]:
def operaciones(a, b):
    suma = a+b
    resta = a-b
    mult = a*b
    div = a/b
    
    return suma, resta, mult, div

> **Pregunta ❓**: ¿Qué retorno cuando hay varias variables en el return?

In [28]:
operaciones(5,2)

(7, 3, 10, 2.5)

In [30]:
suma, resta, mult, div = operaciones(5,2)

suma

7

In [31]:
resta

3

In [32]:
mult

10

In [33]:
div

2.5

In [29]:
type(operaciones(5,2))

tuple

----

## Parte 2: Scopes 

En cada función se define un entorno de variables o *namespace*. Esto quiere decir, que para cada función existe un conjunto de variables (o nombres) los cuales no tienen una relación con las variables fuera de la función. 

Esto permite definir el concepto de **scope**. El scope se define como un lugar delimitado en donde se define y son visibles un cierto conjunto de variables. 

Una de las implicancias de esta delimitación es que aquellas variables definidas dentro de un scope en particular no pueden interactuar con las de afuera de dicha área. 



En `Python` se pueden diferenciar 3 tipos de scopes:

1. **Global**: variables (u objetos si se desea) definidas en el cuerpo del código.
2. **Local**: variables definidas dentro de una función.
3. **Built-in**: variables predefinidas por el modulo built-in's (como ```print()``` por ejemplo.)


In [1]:
def suma(a, b):
    c = a + b
    return c

suma(10, 15)

25

Notemos que si intentamos inspeccionar `c`, nos el intérprete nos va a indicar que no está definida: 

In [2]:
c

NameError: name 'c' is not defined

Esto es porque `c` se definió dentro del scope de la función `suma` y no sobre el scope global.

> **Pregunta ❓**: ¿Qué sucederá en la siguiente celda?

In [3]:
n = 5

def suma_n(a):
    n = 10
    c = a + n
    return c

suma_n(10)

20

In [4]:
n

5

En este caso, la instrucción `n = 10` hace que `n` se modifique en el scope local de la función `suma_n`, pero esto no modifica el valor de `n` en el scope global (el de afuera).


#### Locals

Pueden ver que variables hay en el scope local usando la función `locals()`

In [7]:
n = 5

def suma_n(a):
    n = 10
    c = a + n
    print(f'Las variables locales de la función son {locals()}')
    return c


In [8]:
suma_n(10)

Las variables locales de la función son {'a': 10, 'n': 10, 'c': 20}


20

> **Ejercicio 💻**

También existe la posibilidad de que, dentro de una función, se modifique el valor de una variable en el scope global. Para esto, consulte la keyword `global` y programe una función que haga lo descrito anteriormente. 

---

## Parte 3: Unit Testing


El *unit testing* o pruebas unitarias es un método para comprobar el correcto funcionamiento de un segmento de código o función.
La idea es crear casos de prueba en donde establecemos valores correctos que deberían retornar la funcion y luego comprobar que la función efectivamente los retorne. 

Para esto, los test que creemos deben ser determinísticos (no aleatorios) y repetibles. 


Python provee la *keyword* `assert` la cual verifica el valor de una condición: 

- Si es `True` continua la ejecución. 
- Si es `False`, lanza la excepción `AssertionError` y detiene la ejecución.

> **Ejemplo 📖**


In [34]:
def suma(a, b):
    return a + b

In [18]:
assert 5 == suma(2,3)

True

In [37]:
# La idea es hacer varios casos de prueba unitarios.
assert 5 == suma(2,3)
assert suma(2, -3) == -1
assert suma(99999,1) == 100000
assert suma(3,3) != 5
assert isinstance(suma(3,3.0), float)

### Comprobación de errores al modificar el código

Si por ejemplo, ahora modifico erroneamente la función suma y y en vez de sumar, multiplico `a` por `b`, el test los test que había programado de antemano deberían fallar.

In [32]:
def suma(a, b):
    return a * b 

assert suma(2,-3) == -1
assert suma(99999,1) == 100000
assert suma(3,3) != 5


AssertionError: 

In [31]:
# Le podemos indicar que nos entregue un mensaje de error

assert suma(3,2) == 5, 'Error en suma en el test suma(3, 2)'

AssertionError: Error en suma en el test suma(3, 2)

> Nota interesante 📝:

    "Program testing can be used to show the presence of bugs, but never to show their absence!"
    
                                                                         —Edsger Dijkstra, 1970

### Paréntesis: TDD y pruebas unitarias

El test driven development (TDD) o desarrollo guiado por pruebas implica desarrollar las pruebas unitarias a las que se va a someter el software antes de escribirlo.
De esta manera, el desarrollo se realiza atendiendo a los requisitos que se han establecido en la prueba que deberá pasar.

(Fuente: https://www.yeeply.com/blog/que-son-pruebas-unitarias/)

> **Ejercicio 💻**

Programe la función `promedio(lista)` que calcule el promedio de una lista y luego haga una serie de test unitarios que comprueben su funcionamiento. 
¿Qué pasa cuando el promedio es float?


In [None]:
def promedio(lista):
    pass

---

## Parte 4: Programación Funcional con Map, Filter y Reduce

<br>
<br>

<div align='center'>
<img alt="Map, filter y reduce" src="./resources/map_filter_reduce.jpeg" width=600/>
</div>
<br>

<div align='center'>Fuente: <a href='https://towardsdatascience.com/accelerate-your-python-list-handling-with-map-filter-and-reduce-d70941b19e52'>Map, Filter And Reduce In Pure Python</a><div/>


En ciencia de datos, la utilidad de las funciones ```lambda``` generalmente se asocia a las operaciones ```map()```, ```filter()``` y ```reduce()``` usando usando el modulo functools). Estás operaciones se denotan como **funciones de orden superior** pues reciben otra función como argumento. 

### Map

```map()``` permite aplicar la función objetivo sobre un contenedor (como una lista) elemento por elemento, el resultado es un objeto tipo ```map``` que entre sus características es un iterable.


In [None]:
# Ejemplo iterativo usando for

def al_cuadrado(x):
    return x**2

lista = [1, 2, 3, 4, 5, 6]
lista_al_cuadrado = []

for i in lista:
    c = al_cuadrado(i)
    lista_al_cuadrado.append(c)

lista_al_cuadrado

Podemos reescribir esta función usando `map` como:

In [38]:
def al_cuadrado(x):
    return x**2

lista = [1, 2, 3, 4, 5, 6]
map(al_cuadrado, lista)

<map at 0x7f3ad908ec10>

Notemos que `map` retorna un iterable (un objeto que puede ser iterado, pero que aún no ha sido generado). Para evaluarlo, podemos utilizar la función `list`:

In [39]:
 # Retorna un iterable. Para evaluarlo, usar list(map)
    
def al_cuadrado(x):
    return x**2

lista = [1, 2, 3, 4, 5, 6]
lista_al_cuadrado = list(map(al_cuadrado, lista))
lista_al_cuadrado

[1, 4, 9, 16, 25, 36]

### Funciones lambda

Cuando se trabaja con funciones simples, la notación ```def``` puede ser 
lenta e innecesaria. En este contexto, Python posee las funciones **lambda**. Estas se pueden considerar como un análogo de las funciones, como *list comprehension* en relación a los ciclos. 

> **Ejemplo 📖**

La sintaxis es bastante sencilla. Por ejemplo, la función `al_cuadrado`

In [None]:
def al_cuadrado(x):
    
    return x**2

al_cuadrado(10)

Esta se puede reemplazar por


In [None]:
al_cuadrado = lambda x: x ** 2

al_cuadrado(10)

Es decir, se sigue la sintaxis:

```python
lambda param_1, param_2, ..., param_n : accion
```


#### Map y funciones lambdas

Podemos definir `al_cuadrado` en una sola linea usando una función lambda. Esto hace el código aún más compacto y funcional (y de paso, *anonimiza* la función):

In [42]:
lista = [1, 2, 3, 4, 5, 6]
lista_al_cuadrado = list(map(lambda x: x**2, lista))
lista_al_cuadrado

[1, 4, 9, 16, 25, 36]

### Filter

La función ```filter()``` permite mantener elementos de un arreglo según el valor de verdad asociado a cada uno por la función objetivo.


In [43]:
lista = [1, 2, 3, 4, 5, 6]

# Mantener solo numeros pares
list(filter(lambda x: x % 2 == 0, lista))

[2, 4, 6]

In [47]:
# combinando ambas operaciones:
list(filter(lambda x: x % 2 == 0, map(lambda x: x**2, lista)))

[4, 16, 36]

### Reduce

`reduce()` permite acumular valores de izquierda a derecha según una función sobre algún iterable. La idea es reducir la lista a un solo valor según la función estipulada.
El primer argumento de los 2 de la función a pasar es el valor acumulado y el segundo es el valor siguiente de la secuencia.

> **Nota 📖**: Esta función debe ser *importada* desde el módulo `functools`.

Por ejemplo:

```python
fun = lambda x, y: x + y
functools.reduce(fun, [1, 2, ,3, 4, 5])
```

Al ejecutar esta línea, por cada iteración se calcula:

0. `fun(0, 1)`
1. `fun(1, 2)`
2. `fun(fun(1, 2), 3)` 
3. `fun(fun(fun(1, 2), 3), 4)`
4. `fun(fun(fun(fun(1, 2), 3), 4), 5)`

Lo que en resumidas cuentas calcula:
```python
0 + ((((1+2)+3)+4)+5) = 15
```
`reduce` también tiene un tercer (opcional) argumento, `initializer`, si este es entregado se utiliza como primer elemento en el calculo acumulativo, por lo que si en el caso anterior se tuviera

```python
functools.reduce(fun, [1, 2, ,3, 4, 5], 8)
```

el resultado sería,

```python
8 + ((((1+2)+3)+4)+5) = 23
```


In [1]:
# importamos la función usando la siguiente instrucción:
from functools import reduce

lista = [1, 2, 3, 4, 5]

# Sumar todos los elementos
reduce(lambda a, b: a + b, lista)

15

In [2]:
reduce(lambda a, b: a + b, lista, 8)

23

In [7]:
lista = [1, 2, 3, 4, 5]

reduce(lambda a, b: a * b, lista)

120

Otro ejemplo, combinando if else más reduce, podemos encontrar el máximo de una lista:m

In [4]:
# Encontrar el máximo
lista = [1, 2, 30, 4, 5]

reduce(lambda a, b: a if a > b else b, lista, 0)

30

---
> **Ejercicios para practicar programación funcional 💻**

1. En strings el método ```.upper()``` permite transformar el contenido en mayúsculas. Cree la función ```to_upper(texto)``` que toma un caracter (un string de largo 1) y retorna una versión en mayúsculas. Luego, utilice la función `map()` sobre cada caracter del string.


2. El método ```.split()``` permite obtener todas las palabras de un string. Por otra parte, la función ```len()``` permite obtener el largo de un arreglo o cantidad de letras en una palabra. Cree la función `separador()` que separe un texto por espacios (`' '`) y quite todas aquellas palabras de tamaño 3 o menos usando `filter()`. 

3. Cree la función `mayus_r()` la cual transforme a mayúsculas todas las palabras que terminen en 'r'. Considere  además cada palabra como una lista y acceda la última letra con el slice correspondiente. Utilice ```map()``` más las herramientas que crea necesarias para resolver este problema.

4. Cree la función `promedio(lista)` la cual calcule el promedio usando solo las funciones `reduce()` y `len()`

4. Cree test unitarios independientes que prueben estas funciones.

---

In [None]:
# Pueden usar este texto de ejemplo para hacer los ejercicios

texto_ejemplo = """
Budín de zapallos italianos

Una tradicional receta chilena, que siempre me ha gustado mucho.
Acá estamos en plena temporada de zapallos italianos y aunque aún no he cosechado ninguno en casa, 
si lo he estado haciendo en una de las huertas donde trabajo de voluntaria. 
Esta receta ya estaba en el blog, pero la estoy re-publicando con fotos nuevas y mas lindas. 
¿Cuál es tu manera favorita de preparar los zapallos italianos?
Recuerden siempre probar los zapallos crudos y descartarlos si están amargos, 
no hay nada peor que cocinarlos y descubrir al momento de servir que había uno malo.
Fuente: https://www.enmicocinahoy.cl/pastel-zapallos-italianos/"""

In [None]:
# solo nombres de las funciones, falta agregar sus parámetros.

def to_upper():
    pass

def separador():
    pass

def mayus_r():
    pass

def promedio():
    pass

---

---

## Parte 5: Referencias

<br>

Consideremos el siguiente ejemplo:

In [9]:
lista_1 = [1, 2, 3, 4, 5]
lista_2 = lista_1

In [10]:
lista_1.append(10)
lista_1

[1, 2, 3, 4, 5, 10]

In [11]:
lista_2

[1, 2, 3, 4, 5, 10]

In [12]:
lista_2.append(100)

In [13]:
lista_1

[1, 2, 3, 4, 5, 10, 100]

> **Pregunta ❓:** ¿Por qué al modificar `lista_1`, los cambios también se ven reflejados en `lista_2`?

Cuando asignamos una lista a una variable, lo que guardamos en la misma es en realidad una referencia a la lista y no la lista en sí. 

> Referencia según la *RAE* : 9. f. Ling. Relación que se establece entre una expresión lingüística y aquello a lo que alude.

Por lo tanto, al copiar la variable a otra lo que hicimos fue copiar la referencia y no sus valores. Podemos analizar las referencias de cada variable (lugar en la dirección de memoria donde se encuentran los datos) a través de la función `id`:

In [14]:
print(f'Identificador lista_1: {id(lista_1)}\nIdentificador lista_2: {id(lista_2)}')

Identificador lista_1: 139988126971072
Identificador lista_2: 139988126971072


> **Nota**: Si realmente queremos copiar un arreglo (y cuálquier colección y estructura compleja en general) debemos utilizar la función `deepcopy()`

In [17]:
from copy import deepcopy

lista_1 = [1, 2, 3, 4, 5]

lista_3 = deepcopy(lista_1)

lista_1.append(10)

lista_1

[1, 2, 3, 4, 5, 10]

In [18]:
lista_3

[1, 2, 3, 4, 5]

In [20]:
print(f'Identificador lista_1: {id(lista_1)}\nIdentificador lista_3: {id(lista_3)}')

Identificador lista_1: 139988625388800
Identificador lista_3: 139988127045504


En general, Python asignará identificadores distintos cuando creemos listas y diccionarios:

In [None]:
d_1 = {'key_1': 'Hola'}
d_2 = {'key_1': 'Hola'}

print(f'Identificador dict_1: {id(d_1)}\nIdentificador dict_2: {id(d_2)}')

¿Qué pasa ahora con los elementos inmutables como los strings?

In [21]:
s1 = 'Hola'
id(s1)

139988123251888

In [22]:
s2 = 'Hola'
id(s2)

139988123251888

In [None]:
id(d_1['key_1'])

¿Y si le concatenamos otro string (similar al `append` del inicio)?

In [23]:
s3 = s1 + ', qué tal?'
id(s3)

139988123215120

> **Pregunta ❓**: ¿Por qué no se conserva el id?

## Parte 6: Mutabilidad e Inmutabilidad `v2`

**Recuerdo:** Cada entidad (u objeto) en python puede ser catalogada como **mutables** o **inmutables**. 
- Los objetos **mutables** son aquellos que pueden ser modificados luego de ser creados (o asignados), 
- Los objetos **inmutables** son objetos con valores fijos que no pueden ser modificados.


> **Pregunta ❓**: Hasta ahora, ¿qué tipos de datos son mutables y que tipo de datos son inmutables?

Python maneja los objetos mutables e inmutables de manera distinta.

- Se utilizan objetos inmutables si se desea acceder e iterar de manera eficiente en estructuras que no cambian frecuentemente en el código. Sin embargo, **son estáticos**. Esto se evidencia al querer modificar un valor, **proceso que conlleva la creación de una copia del inmutable original.** 

- Los objetos mutables **se utilizan cuando se desea cambiar el tamaño o atributos de un objeto a medida que es procesado por un código**. 

### ¿Inmutables que mutan?


> **Pregunta ❓**: ¿Qué sucede en el siguiente código?

In [25]:
tupla = ('texto', [0,1])
tupla

('texto', [0, 1])

In [26]:
tupla[1] = [0,1,2]

TypeError: 'tuple' object does not support item assignment

In [27]:
tupla[1]

[0, 1]

In [28]:
tupla[1].append(2)
tupla

('texto', [0, 1, 2])

### Argumentos de las Funciones

Las referencias a objetos mutables e inmutables tienen un papel importante en la **evaluación de funciones**. 

Pensemos por ejemplo en la siguiente función:

In [31]:
def cambia_elemento_0(x):
    ''' Cambia el primer indice de una lista. '''
    x[0] = 'cambiado'

Si se define la lista:

In [32]:
lista = ['no_cambiar', 2, 3, 4, 5]

In [33]:
cambia_elemento_0(lista)
lista

['cambiado', 2, 3, 4, 5]

El elemento cambió porque le pasamos una referencia de la lista a la función. NO una copia de esta.