# Funciones y Namespaces


## 1. Funciones

Una función es un bloque de código que sólo corre cuando es llamado.

In [1]:
def par_o_impar(numero):
    if numero %2 == 0:
        print('Es par')
    else:
        print('Es impar')

Notar que si ejecutamos la celda no ocurre nada apreciable. Si llamamos a la función

In [2]:
par_o_impar

<function __main__.par_o_impar>

Python nos dice, de una forma no muy clara, que se trata de una función. Las funciones se llaman con paréntesis:

In [3]:
par_o_impar()

TypeError: ignored

Y en este caso, arroja un error porque falta un argumento, `numero`. Las dos siguientes son equivalentes:

In [None]:
par_o_impar(numero = 9)
par_o_impar(9)

Al tener un solo argumento, en este caso no hay mucho lugar a confusión, pero las funciones pueden tener muchos argumentos:

In [None]:
def division(dividendo, divisor):
    print(dividendo/divisor)

Entonces podemos llamar a la función pasándole los argumentos en orden, o explicitando el valor de cada argumento:

In [None]:
division(4,2)
division(divisor = 4, dividendo = 2)  #notar que asi no nos tenemos que preocupar por el orden

También, pueden tener argumentos *por default*, que si no explicitamos, toman un valor predefinido:

In [None]:
def division(dividendo, divisor = 2):
    print(dividendo/divisor)

In [None]:
division(9)
division(9, 3) 
division(dividendo = 9, divisor = 3) 
division(9, divisor = 3) 

### 1.1 `return`

Las funciones pueden devolver resultados

In [None]:
def division(dividendo, divisor = 2):
    variable_auxiliar = dividendo/divisor
    return variable_auxiliar

In [None]:
resultado_division = division(9,3)

In [None]:
print(resultado_division)

Y, si lo necesitamos, podemos hacer que devuelvan más de un resultado

In [None]:
#def division_y_producto(numero_1,numero_2):
 #   div = numero_1/numero_2
  #  prod = numero_1*numero_2
   # return div, prod

### Son equivalentes
def division_y_producto(numero_1,numero_2):
     return numero_1/numero_2, numero_1*numero_2

In [None]:
resultados = division_y_producto(10,5)
print(resultados)

Notar la diferencia

In [None]:
resultado_1, resultado_2 = division_y_producto(10,5)
print(resultado_1, resultado_2)

### 2. Namespaces and Scope

Encontrar la diferencia entre las siguientes celdas:

In [None]:
def division(dividendo, divisor = 2):
    variable_auxiliar = dividendo/divisor
    return variable_auxiliar
print(division(50))
print(divisor)

In [None]:
divisor = 5
def division(dividendo):
    variable_auxiliar = dividendo/divisor
    return variable_auxiliar
print(division(50))
print(divisor)

In [None]:
divisor = 5
def division(dividendo, divisor = 2):
    variable_auxiliar = dividendo/divisor
    return variable_auxiliar
print(division(50))
print(divisor)

**Investigar:** ¿qué es una variable global?¿Y una variable local?¿Qué es un Namespace?

### 3. Funciones Lambda (Anónimas)

Una función `lambda` es una forma conveniente de crear una función en una sola línea. También se las conoce como funciones anónimas, ya que no suelen tener nombre.

In [None]:
lambda_division = lambda x,y: x/y
lambda_division(80,10)

Algunas características:
1. Pueden tener cualquier cantidad de argumentos, pero solo una expresión
1. No se les suele poner nombre como hicimos, de hecho es raro utilizarlas de esa forma.
1. No necesitan un `return`
1. Muy cómodas para crear funciones rápido.
1. En general, las veras combinadas con funciones como `map()`, `filter()`, `apply()`, `applymap()`, etc.

Existen algunas diferencias sutiles entre una función creada con `def` y una función lambda, pero para nuestros objetivos basta con saber que una función lambda es una forma rápida de crear funciones sencillas.

### 4. Documentando funciones

Cuando creemos funciones es conveniente documentarlas, así si volvemos meses después a nuestro código, o se lo compartimos a alguien, podemos entender qué hace sin tener que leer y entenderlo completamente. Es decir, de la misma forma que hacemos con muchas de las funciones de las librerías que venimos usando. Hay muchos formatos para documentar una función, pero en general incluyen: qué hace la función, cuales son sus argumentos, y cuáles son sus returns. A veces, también algún ejemplo mostrando cómo se usa. El grado de detalle depende del tiempo y de la complejidad de la función. Recomendamos siempre documentar las funciones, aunque sea de forma breve.

Dejamos un formato de documentación a modo de ejemplo. En general, se estila documentar en inglés, pero vamos a hacer una excepción.

In [None]:
def division_y_producto(numero_1,numero_2):
    '''
    Dados dos numeros, devuelve su division
    y su producto.
    
    Arguments:
    numero_1 -- dividendo, primer multiplicando
    numero_2 -- divisor, segundo multiplicando
    
    Returns:
    div -- la division entre los dos numeros
    prod -- el producto entre los dos numeros
    '''
    
    div = numero_1/numero_2
    prod = numero_1*numero_2
    return div, prod

Notar que si ahora ponemos `help()` de nuestra función, devuelve la documentación que creamos.

In [None]:
help(division_y_producto)

También, si usamos `shift`+`tab` como hacemos con las otras funciones de las librerías.

### Challenge

1. Crea una función que tome como entrada dos arreglos de Numpy. Luego, que chequee si tienen el mismo tamaño; si no es así, que imprima un mensaje indicando que no tienen el mismo tamaño. Si tienen el mismo tamaño, que haga las siguientes operaciones:
    1. Crear un nuevo arreglo con el resultado de las resta de los dos arreglos originales.
    1. Elevar al cuadrado ese arreglo.
    1. Sumar todos los elementos y dividir por la cantidad de elementos.
    1. Devuelva la raiz de ese resultado.

In [None]:
import numpy as np

def RMSE(arreglo_1, arreglo_2):
    '''Esta es una función de prueba'''
    #pass
    if len(arreglo_1)==len(arreglo_2):
          arreglo3= (np.mean((arreglo_1-arreglo_2)**2))**(1/2)
          return arreglo3
    else:
          print('Los arreglos no tienen el mismo tamaño')

Testeamos el resultados

In [None]:
np.random.seed(10)  # que hace esta linea?
arreglo_1 = np.random.randint(-10,10, 50)
arreglo_2 = np.random.randint(-10,10, 50)
print(arreglo_1)
print(arreglo_2)

In [None]:
RMSE(arreglo_1, arreglo_2)

Debería dar como resultado 7.48732

In [None]:
np.random.seed(10)  # que hace esta linea?
arreglo_1 = np.random.randint(-10,10, 25)
arreglo_2 = np.random.randint(-10,10, 50)
print(arreglo_1)
print(arreglo_2)

In [None]:
RMSE(arreglo_1, arreglo_2)

Debería dar como resultado un mensaje indicando que no tienen el mismo tamaño.

2. Documentar brevemente la función creada.

### 5. Ejercitación - Generala

¡Vamos a jugar a la generala! Para los que no la conocen: es un juego de dados. En este juego tienes 3 tiradas y 5 dados para formar distintas combinaciones (escalera, full, etc). Después de cada tiro, puedes decidir cuántos y cuáles dados dejar en la mesa y cuáles volver a tirar. De esta forma, tienes tres tiradas para lograr alguna de las combinaciones. La combinación que más puntos te da es la generala, que se obtiene cuando los 5 dados devuelven el mismo número.

El jugador puede tomar decisiones y plantear una estrategia en este juego, pero la última palabra la tiene el azar. Un buen matemático podría calcular las probabilidades de cada combinación, e ir calculando cómo se modifican estas probabilidades a medida que va dejando - o no - dados sobre la mesa.

En nuestro caso, lo que haremos es simular una generala simplificada - el único objetivo es obtener la generala, cinco dados iguales. Para ello, programarás una serie de funciones que te ayudarán a jugar a este juego. Con estas funciones, podrás responder varias preguntas, entre ellas:

1. ¿Cuán probable es obtener una generala en la primera tirada?
1. ¿Cuán probable es obtener una generala con dos tiradas?
1. ¿Cuán probable es obtener una generala luego de las tres tiradas?
1. ¿Qué es más problable: obtener una generala con tres tiradas y cinco dados o cuatros tiradas y seis dados?

y las que se te ocurran. ¡Manos a la obra!

**Importante:** todas las funciones que te pedimos definir acá se resuelven en pocas líneas de código. NumPy y Google forman un gran equipo. Nosotros te dejamos casos de testeo para tus funciones. Resuélvelos con un/a compañero/a, recuerda pensar el problema (escribiéndolo en un papel, hablándolo con alguien) y luego programa. ¡Verás que no son tan difíciles!

**Importante dos:** este desafío fue propuesto por *Ernesto Mislej* en el grupo de Facebook *Data Science Argentina*.¡Recomendamos unirse a éste o a otro grupo sobre Ciencia de Datos!

1. Crea la función `tirar_n_dados`. Debe tomar como argumento por defecto `n = 5`, pero tiene que funcionar correctamente para otros valores de `n`.

In [None]:
def tirar_n_dados(n=5):
    dados = np.random.randint(1,7,size=(n),)
    #dados = np.random.choice([1,2,3,4,5,6],n)
    return dados
    ##pass

In [None]:
tirar_n_dados(5)

2. Crea la función `es_generala`. Esta función toma como entrada los resultados de `tirar_n_dados` y devuelve `True` si es generala y `False` si no lo es.

In [None]:
def es_generala(resultado_n_dados):
    #pass
    #booleano = np.all(resultado_n_dados==resultado_n_dados[0:],1)
    #return booleano
    if min(resultado_n_dados) == max(resultado_n_dados):
        return True
    else:
        return False
    

In [None]:
### TESTEO UNO
array_de_prueba = np.array([5,2,5,5,5])
print(es_generala(array_de_prueba))

In [None]:
### TESTEO DOS
for _ in range(10000):
    tirada_dados = tirar_n_dados(n = 5)
    if es_generala(tirada_dados):
        print(tirada_dados)

3. Crea una función `seleccionar_mayoria` que, dada una tirada de n dados, devuelve cuál es la moda de los resultados y con qué frecuencia. Dos consideraciones: 
    * Si los n resultados son distintos, es indistinto cuál valor devuelve.
    * Si hay más de un valor posible para devolver - por ejemplo, en la tira `[1, 1, 2, 2, 3]` -, es indistinto cuál valor elige.
    
    Tal vez te sirva saber que estas consideraciones se resuelven automáticamente si utilizas algunas herramientas de NumPy, como `np.unique()`, `np.argmax()` y alguna más.

In [None]:
def seleccionar_mayoria(mas_frecuente):
    #pass
    uno, dos= np.unique(mas_frecuente, return_counts=True)
    maximo=uno[np.argmax(dos)]
    frecuencia= dos[np.argmax(dos)]
    return maximo, frecuencia

In [None]:
# TESTEO UNO
array_de_prueba = np.array([1,1,1,5,5])
print(seleccionar_mayoria(array_de_prueba))
### Debería dar como resultado (1,3)

# TESTEO DOS
array_de_prueba = np.array([5,3,2,1,6])
print(seleccionar_mayoria(array_de_prueba))
### Debería dar como resultado (algun numero salvo el 4,1)

Acá la cosa se empieza a poner áspera, pero tampoco tanto. Veamos algunas situaciones:

* Supongamos que en una primera tirada obtienes como resultado `[1, 1, 2, 5, 3]`. En ese caso, te debes quedar con los dados `[1, 1]` y volver a tirar los otros tres dados. Si cuando tiras los tres dados obtienes tres valores iguales **distintos** de los que habías reservado, la mejor estrategia es quedarte con esos tres dados y volver a tirar los otros dos. 
* Supongamos que en una primera tirada obtienes como resultado `[1, 1, 2, 5, 3]`. En ese caso, te debes quedar con los dados `[1, 1]` y volver a tirar los otros tres dados. Si cuando tiras los tres dados obtienes `[1, 1, 5]` debes poder sumar a los dados que apartaste esos dos `1`.

Entonces:


4. Crea una función `jugar` tome como argumentos `n_tiradas` con argumento por defecto `3` y `dados_total` con argumento por defecto `5` y que, utilizando las funciones que definiste antes, juegue a la generala. La función debe devolver un arreglo con las n-tiradas realizadas y un índice indicando en qué tirada logró la generala si corresponde (si no logra la generala, debe devolver un valor que indique que no se logró la generala, ¿cuál se te ocurre?). 
    
    Te vamos a dejar un esqueleto bastante armado para esta función, pero si quieres arrancar desde cero, obviamente puedes hacerlo. Para completarlo, ten en cuenta que luego de cada tirada debes dejar algunos dados en la mesa, `dados_mesa`, y volver a tirar otros, `dados_nuevos`. La cantidad de dados nuevos que debes tirar se decide dinámicamente en cada ciclo del loop. Cuando decides qué dados deben quedar sobre la mesa, debes mirar tanto los dados que ya estaban sobre la mesa como los que acabas de tirar, `todos_dados`.

In [None]:
def jugar(n_tiradas = 3, dados_total= 5):
    # Numero de dados a tirar inicialmente
    n_dados = dados_total 
    
    # Dados en la mesa inicialmente
    dados_mesa = np.array([]) 
    
    # Donde guardamos las tiradas
    tiradas = np.zeros((n_tiradas, dados_total)) 
    
    # Numero de tirada exitosa, en la que se logra la generala
    # Inicializar en un valor que indique que NO se obtuvo generala.
    # Si luego se obtiene una generala, se modificará
    tirada_exitosa = -1
    
    # Contamos cuantas tiradas hicimos hasta ahora
    contador_tiradas = 0
    
    while (contador_tiradas < n_tiradas) and tirada_exitosa == -1:
        # Tiramos los dados
        dados_nuevos = tirar_n_dados(n_dados)
        
        # Combinamos los dados recien tirados con los que ya estan en la mesa
        todos_dados = np.concatenate((dados_mesa,dados_nuevos))
        
        # Guardamos tirada
        tiradas[contador_tiradas,:] = todos_dados
        
        # Nos fijamos si es generala
        if es_generala(todos_dados):
            # Si es, modificamos el valor de tirada exitosa.
            # Esto debe cortar el loop.
            tirada_exitosa= contador_tiradas
        else:
            # Si no es generala, sigue tirando 
            # Se fija qué dados debe dejar en la mesa
            maximo, frecuencia = seleccionar_mayoria(todos_dados)
            dados_mesa = np.repeat(maximo, frecuencia)
            
            # Calcula cuántos dados volver a tirar
            n_dados = dados_total-frecuencia
        
        # Suma al contador de tiradas
        contador_tiradas= contador_tiradas+1
    return tiradas, tirada_exitosa

In [None]:
# TESTEO
for i in range(1000):
    tiradas, tirada_exitosa = jugar(3,5)
    if tirada_exitosa >=0:
        print(tiradas, tirada_exitosa)

¿Estás contento/a con el código?¿Está bien hecho?¿Se te ocurre alguna situación que no haya sido considerada o donde pueda fallar? Siempre es importante ser crítico con el código desarrollado (y con la metodología en general) en busca de puntos débiles. Siempre se puede programar mejor. De hecho, hay un montón de buenas costumbres cuando programamos funciones que hemos dejado de lado, como por ejemplo, chequear que a nuestra funciones les lleguen los argumentos correctos. Por ejemplo, si nuestra función debe recibir como argumento un arreglo de NumPy de cierto shape, no está demás chequearlo.

Ahora sí, es hora de jugar con estas funciones. Elije algunas de las preguntas e intenta responderla, o genera alguna propia y fíjate si lo que hicimos te sirve para responderla. Nosotros elegimos responder qué generala es más probable, si tres tiros y cinco dados o cuatro tiros y seis dados, que te la daremos junto con el resuelto de este notebook.