#  CIENCIA DE DATOS

## Módulo 2 - Funciones

¿Recuerdas el ejercicio de la máquina tragamonedas? 

    Una máquina tragamonedas tiene la siguiente fórmula para determinar si alguien gana premio:
    - La apuesta inicial siempre tiene que ser un número mayor a 0
    - La apuesta inicial se divide entre 15
    - Se toma la parte entera de la división y si es mayor a 0, se multiplica por (3 + el residuo); si es igual a 0, se le agrega 1.5 y se multiplica por el residuo del paso anterior 

    Ejemplo del paso anterior
        - si la apuesta era 2, dividir 2 entre 15 da un cociente entero de 0 y un residuo de 2. Entonces el resultado del paso anterior es 1.5 * 2
        - si la apuesta era 34, dividir 34 entre 15 da un cociente entero de 2 y un residuo de 4. Entonces el resultado del paso anterior es 2 * (3+4)


    - Finalmente, si el resultado es divisible entre 7, el jugador gana.

    Ejemplo, apuesta inicial: 24.
    Apuesta inicial entre 15: 1, residuo 9.
    1 * (3 + 9) = 10
    El residuo de dividir 10 / 7 no es igual a 0.
    El jugador no gana.


Imagínate que trabajas para una compañía que diseña el software de estas máquinas. Claramente no quisieras que todas las máquinas tuvieran el mismo mecanismo para que un juego resulte exitoso, sino que estos mecanismos fuesen ligeramente diferentes en cada juego. De lo contrario, alguien podría identificar una estrategia ganadora y dejarnos en la bancarrota.

¿Cómo podemos crear algo que nos permita replicar esto con diferentes configuraciones y sin la necesidad de repetir código?

### Funciones

Una función es un mapeo que toma ciertos valores `input`, hace algunas operaciones, y produce un `output`. Hay múltiples razones para hacer funciones:
- Permiten reciclar código
- Permiten ejecutar instrucciones muy similares pero con la libertad de cambiar solo algunos parámetros
- Dan legibilidad al código al abstraer ciertos conceptos

Hasta ahora, hemos usado ya varias funciones:
- `print` toma texto o números y los imprime en pantalla 
- `range` toma un número o par de números y devuelve una secuencia de valores ordenados
- `zip` toma un par de listas y devuelve, en orden, pares de valores de cada una de ellas
- `int` toma un texto o float y devuelve un entero
- `str` toma un número y devuelve un string
- `math.log` toma un número y devuelve su logaritmo natural

Pero hay múltiples ocasiones en las que queremos definir nuestras propias funciones. Python hace esto muy fácil y a continuación explicaremos cómo hacer una función.

```
def my_function(argument_one, argument_two):
    '''
    Do something interesting with my function.

    Inputs:
      argument_one: this is a very important value.
      argument_two: this is also an extremely important value

    Returns: something magical and mysterious
    '''
    <do magic here>
    <also write some>
    <statements>
    
    return <return_value>
```


Nota que para definir una función, necesitamos:
- `def`, sintaxis esencial en Python para iniciar una función
- `my_function`, nombre de una función que debe ser descriptiva de lo que hace
- `argument_one/two`, los argumentos de una función, que serán aquellos valores que podrían cambiar cada vez que querramos evaluar nuestra función
- `docstring`, documentación de nuestra función. Es muy importante que para funciones no triviales, describamos qué hace la función, para qué, cuáles son los inputs y cuáles son los outputs. Recuerda que hoy sabemos qué estamos haciendo, pero en una semana lo habremos olvidado y es mejor decirle a nuestro yo del futuro para qué sirve cada cosa.
- `return`, cuando una función ejecuta código, normalmente obtenemos un valor como resultado. Con `return` declaramos la variable o expresión que queremos que la función regrese al ejecutarse.


A continuación un ejemplo de todo esto junto:

In [None]:
def obtener_cociente(dividendo, divisor):
    '''
    Esta función regresa el cociente de una división
    
    Inputs:
        dividendo, número entero a dividir
        divisor, número entero entre el cual el dividendo se dividirá
    
    Output:
        cociente de la división
    '''
    c = dividendo // divisor
    return c

In [None]:
obtener_cociente(1000, 2)

500

In [None]:
obtener_cociente(2, 1)

2

In [None]:
obtener_cociente(10, 2)

5

Hagamos algo más interesante. Con el ejemplo de las máquinas tragamonedas, haz una función que tome como input la apuesta y arroje como resultado un booleano que sea verdadero si la apuesta es ganadora.


    Una máquina tragamonedas tiene la siguiente fórmula para determinar si alguien gana premio:
    - La apuesta inicial siempre tiene que ser un número mayor a 0
    - La apuesta inicial se divide entre 15
    - Se toma la parte entera de la división y si es mayor a 0, se multiplica por (3 + el residuo); si es igual a 0, se le agrega 1.5 y se multiplica por el residuo del paso anterior 

    Ejemplo del paso anterior
        - si la apuesta era 2, dividir 2 entre 15 da un cociente entero de 0 y un residuo de 2. Entonces el resultado del paso anterior es 1.5 * 2
        - si la apuesta era 34, dividir 34 entre 15 da un cociente entero de 2 y un residuo de 4. Entonces el resultado del paso anterior es 2 * (3+4)


    - Finalmente, si el resultado es divisible entre 7, el jugador gana.

    Ejemplo, apuesta inicial: 24.
    Apuesta inicial entre 15: 1, residuo 9.
    1 * (3 + 9) = 10
    El residuo de dividir 10 / 7 no es igual a 0.
    El jugador no gana.

In [None]:
def apuesta_ganadora(apuesta):
    '''
    Tu descripción de la función
    '''
    pass    ## implementa aquí tu función

    return True

In [None]:
DIVISOR_FINAL = 15

def apuesta_ganadora(apuesta = 1000):
    '''
    Esta función calcula si una apuesta es ganadora

    Input: Un número que dice el monto de la apuesta

    Return: Un booleano que indica si la apuesta es ganadora
    '''
    cociente = apuesta // DIVISOR_FINAL
    residuo = apuesta % DIVISOR_FINAL

    if cociente > 0:
        resultado = cociente * (3 + residuo)
    else: 
        resultado = (cociente + 1.5)*residuo

    if resultado % 7 == 0:
        rv = True
    else:
        rv = False
    
    return rv

In [None]:
s = apuesta_ganadora(1)

In [None]:
apuesta_ganadora(18)

False

In [None]:
apuesta_ganadora(19)

True

Algo bien importante que debemos notar es que los nombres de las variables que definamos adentro de una función sólo existen dentro de la misma función. A éstas se les llama variables locales, en contraste con variables globales que existen fuera de una función en particular.

Por ejemplo, si trato de escribir `apuesta`, `cociente` o `rv` en las siguientes líneas, tendré un error diciendo que no existen tales variables.

In [None]:
apuesta

NameError: ignored

In [None]:
cociente

In [None]:
rv

Al escribir funciones, tenemos la flexibilidad de usar cualquier término para argumentos o variables locales. Sin embargo, un error común es querer reciclar esas variables locales fuera de la función. Dichas variables no existen fuera de la función, así que tenemos dos opciones: o las definimos fuera de la misma o las declaramos como un `output` de nuestra función. 

¿Qué pasa si llamamos una función sin argumentos? Python entenderá que hay una función definida, pero no sabrá qué hacer ya que no le estamos dando ningún argumento a la función.

In [None]:
import math
?math.log

In [None]:
apuesta_ganadora

In [None]:
apuesta_ganadora()

Traducción: al definir una función con ciertos argumentos, si queremos evaluar dicha función hay que declarar argumentos.

Ahora, de qué nos sirve el resultado de esta función? Dependerá de la aplicación o del problema. Supongamos que cuando una apuesta es ganadora, se paga el doble. Si es perdedora, no hay pago.

In [None]:
resultado = apuesta_ganadora(19)

In [None]:
resultado

In [None]:
apuesta = 19     # ojo, ahora sí estamos definiendo una variable externa llamada apuesta
resultado = apuesta_ganadora(apuesta)
if resultado:
    pago = apuesta*2   ## qué tal que en el futuro queremos cambiar el pago?
else:
    pago = 0
    
print(pago)

¿Podríamos hacer ahora una función que tome como `input` la apuesta y nos regrese el valor a pagar (si es que hay algo por pagar)?

In [None]:
def pago_apuesta(apuesta, mult):
    if apuesta_ganadora(apuesta):
        pago = apuesta*mult
    else:
        pago = 0
    return pago

pago_apuesta(19, 4)

Wow, ¿qué tal? Estamos haciendo ya funciones más complejas que aprovechan código que hemos escrito. 

#### Ejercicio
Modifica la función anterior para que tome como argumento un factor que multiplique el pago de la apuesta en caso ganador. Por ejemplo, si el factor es 10, la apuesta incial se pagará 10 veces.

In [None]:
def pago_apuesta(apuesta, factor = 2):
    if apuesta_ganadora(apuesta):
        pago = apuesta*factor
    else:
        pago = 0
    return pago

pago_apuesta(19)

In [None]:
def pago_apuesta(apuesta, factor):
    if apuesta_ganadora(apuesta):
        pago = apuesta*factor
    else:
        pago = 0
    return pago

pago_apuesta(19,2)

Woops, ¿qué se nos olvidó ahora? El error es bastante descriptivo, se nos olvidó agregar a la llamada de la función el nuevo argumento `factor`.

In [None]:
pago_apuesta(19, 2)

In [None]:
pago_apuesta(19, 1)

#### Argumentos

¿Siempre son necesarios? No, hay muchas funciones que no necesitan argumentos y harán su trabajo. Dependiendo de la aplicación, habrá veces que querramos escribir funciones con o sin argumentos. Por ejemplo, simplifiquemos el cálculo de arriba y digamos que queremos una función que regrese si alguien ganó de manera aleatoria pero sólo el 1% de las ocasiones.

In [None]:
# Antes del ejemplo, una función que usaremos:
import random
random.uniform(0,1)  # genera un valor aleatorio entre 0 y 1

In [None]:
?random.uniform

In [None]:
import random

def apuesta_ganadora():
    rand_val = random.uniform(0,1)
    win_rate = 0.01
    if rand_val < win_rate:
        return True
    else:
        return False

In [None]:
apuesta_ganadora()

Si generamos 1000 ejemplos con esta función, veremos que en promedio, tenemos una apuesta ganadora por cada 10.

In [None]:
wins = 0
bets = 10000000

for i in range(bets):
    if apuesta_ganadora():
        wins += 1

print(wins)
print(wins/bets)

Inténtalo con 100,000 o 1M!

Como vimos, esta función no necesita argumentos. Sin embargo, ¿qué tal que queremos cambiar la tasa de éxito de las apuestas? Muy fácilmente podríamos añadir un argumento para cambiar esa tasa de éxito.

#### Ejercicio
Modifica la función anterior añadiendo un argumento que sea la tasa de éxito.

In [None]:
def apuesta_ganadora(rate):
    rand_val = random.uniform(0,1)
    ## tu código aquí
    if rand_val < rate:
        return True
    else:
        return False

In [None]:
wins = 0
bets = 1000

for i in range(bets):
    if apuesta_ganadora(.3):
        wins += 1

print(wins)
print(wins/bets)

#### Ejercicio 

Modifica la función `pago_apuesta`, para que dada una apuesta, la función regrese el pago. La función `pago_apuesta` deberá tener dos argumentos:
- apuesta, el valor apostado
- multiplicador, cuántas veces se pagará la apuesta si ésta es exitosa

P.ej. si alguien apuesta 5 y el multiplicador es 7, el valor que función debe regresar es $5*7=35$

El valor a regresar debe ser un string con un signo de pesos `$` delante de la cifra y dos valores decimales. Usando el ejemplo anterior, el valor a regresar debe verse como: `$35.00`

In [None]:
# Hint, usa esta función para strings llamada format()
# https://docs.python.org/3/library/string.html#formatstrings

x = 27.755410
'${:.2f}'.format(x)

In [None]:
def pago_apuesta(apuesta, multiplicador, rate):
    """
    """
    # evaluar si una apuesta es ganadora
    
    # si es ganadora, multiplica por el multiplicador
    # si no, pago es cero
    
    # poner el return_value en el formato deseado
    pass 

    return True

In [None]:
def pago_apuesta(apuesta, multiplicador, rate):
    """
    apuesta, float/int, valor a apostar
    multiplicador, float/int, multiplicador de las apuestas 
    """
    win = apuesta_ganadora(rate)
    if win:
        pmt = apuesta*multiplicador
    else:
        pmt = 0
    rv = '${:.2f}'.format(pmt)

    return rv
pago_apuesta(25, 2, .1)

In [None]:
def pago_apuesta(apuesta, multiplicador, rate):
    """
    apuesta, float/int, valor a apostar
    multiplicador, float/int, multiplicador de las apuestas 
    """
    win = apuesta_ganadora(rate)
    pmt = 0
    if win:
        pmt = apuesta*multiplicador
    rv = '${:.2f}'.format(pmt)

    return rv
pago_apuesta(25, 2, .1)

In [None]:
def pago_apuesta(apuesta, multiplicador, rate):
    """
    apuesta, float/int, valor a apostar
    multiplicador, float/int, multiplicador de las apuestas 
    """
    pmt = 0
    if apuesta_ganadora(rate):
        pmt = apuesta*multiplicador
    rv = '${:.2f}'.format(pmt)

    return rv
pago_apuesta(25, 2, 1)

¿Cómo sabemos que está haciendo lo que queremos si todas las respuestas fueron 0? Por eso corrimos 1M de veces la función apuesta_ganadora, para verificar que hacía lo que queríamos. Si queremos probar esta función, podríamos cambiar la función de apuesta_ganadora para que siempre gane la apuesta y ver el resultado. También podríamos imprimir varias veces el valor de pago_apuesta como está ahora.

In [None]:
import random

def apuesta_ganadora(win_rate):
    rand_val = random.uniform(0,1)
    if rand_val < win_rate:
        return True
    else:
        return False

def pago_apuesta(apuesta, multiplicador, rate):
    """
    """
    if apuesta_ganadora(rate) == True:     # evaluar si una apuesta es ganadora
        x = apuesta*multiplicador    # si es ganadora, multiplica por el multiplicador
    else:
        x = 0                        # si no, pago es cero
    return'${:.2f}'.format(x)        # poner el return_value en el formato deseado


In [None]:
pago_apuesta(5, 1, 1)

In [None]:
def apuesta_ganadora(win_rate):
    rand_val = random.uniform(0,1)
    if rand_val < win_rate:
        return True
    else:
        return False
    
def pago_apuesta(apuesta, multiplicador, win_rate):
    """
    apuesta, float/int, valor a apostar
    multiplicador, float/int, multiplicador de las apuestas 
    """
    pmt = 0
    if apuesta_ganadora(win_rate):
        pmt = apuesta*multiplicador
    rv = '${:.2f}'.format(pmt)

    return rv

print(pago_apuesta(25, 2, 1))
print(pago_apuesta(25, 3, 1))
print(pago_apuesta(25, 5, 1))

In [None]:
for i in range(20):
    print(pago_apuesta(10, 5, 0.85))

#### Ejercicio: `print` y `return` no son lo mismo

Una confusión común al empezar a programar es mezclar los conceptos de `print` y `return`. La función `print` tiene como objetivo imprimir en pantalla/línea de comando el valor de una variable. Este valor, si no fue guardado en algún lugar, se pierde en nuestro código de manera intrascendental. En una función, `return` tiene como objetivo devolver y preservar un valor, que no necesariamente se tiene que imprimir, pero que sí esperamos guardar en algún lugar.

1) Modifica `pago_apuesta` para que imprima `True` sólo si una apuesta fue exitosa. 

2) Modifica `pago_apuesta` para que devuelva un número en vez del string con el pago de la apuesta.

3) Ejecuta pago_apuestas 1 millón de veces con:
    - apuestas aleatorias entre 0 y 100 (usa la función `random.uniform` que vimos para hacer esto) 
    - tasa de éxito del 0.01% (o sea, 1 de cada 10000 apuestas será ganadora)
    - multiplicador de 100 (si alguien apuesta 1 y gana, se le paga 100)
    
4) Guarda cuánto dinero se ha apostado y cuánto dinero se ha pagado en dos variables respectivamente

5) Calcula cuánto estamos ganando (o perdiendo) con esta estructura de apuestas

In [None]:
import random 

def apuesta_ganadora(win_rate):
    rand_val = random.uniform(0,1)
    if rand_val < win_rate:
        print(True)
        return True
    else:
        return False
    
def pago_apuesta(apuesta, multiplicador, win_rate):
    """
    apuesta, float/int, valor a apostar
    multiplicador, float/int, multiplicador de las apuestas 
    """
    pmt = 0
    if apuesta_ganadora(win_rate):
        pmt = apuesta*multiplicador

    return pmt

def simula_apuestas(num_apuestas, multiplicador, win_rate):
    total_apuestas = 0
    total_pagos = 0
    
    for a in range(num_apuestas):
        apuesta = random.uniform(0,1)*100
        pago = pago_apuesta(apuesta, multiplicador, win_rate)
        total_apuestas += apuesta
        total_pagos += pago
    
    ganancias = total_apuestas - total_pagos
    return ganancias

simula_apuestas(1000000, 10, 0.0001)

True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True


49993342.87285701

¿Queremos tener tantos prints? Usualmente no. La función `print` es muy útil al momento de estar escribiendo pruebas y verificar que lo que escribimos funciona. Pero si es una función que será llamada muchas veces, es probable que querramos omitir tantos `prints`.

## Errores

Ya hemos visto varios errores en situaciones anteriores. No es posible ennumerar todos los tipos de errores que hay, pero ya hemos visto que los errores suelen tener buanes descripciones de por qué suceden. Repasemos algunas de estas situaciones.

In [None]:
range(4.3)

TypeError: ignored

In [None]:
simula_apuestas(0.5,0,1)

TypeError: ignored

¿Qué dice el error? Uno de los argumentos debería ser un número entero, pero como proporcionamos un número real, la función `range` no sabe qué hacer. Nos devuelve entonces un error diciendo "no puedo interpretar esto como un entero" y se detiene la ejecución.

¿Cómo solucionamos esto? Lo correcto sería escribir algo para cubrir este tipo de casos. Si sabemos que nuestro programa SIEMPRE recibirá enteros, podemos ignorarlo. ¿Pero si no estamos seguros, cómo garantizamos que siempre se usará un entero?

Podemos primero verificar que el tipo de valor recibido en ese argumento siempre es un entero: 

In [None]:
def simula_apuestas(num_apuestas, multiplicador, win_rate):
    
    assert type(num_apuestas) is int, "num_apuestas no es un entero, por favor ingreso un entero"
    total_apuestas = 0
    total_pagos = 0
    
    for a in range(num_apuestas):
        apuesta = random.uniform(0,1)*100
        pago = pago_apuesta(apuesta, multiplicador, win_rate)
        total_apuestas += apuesta
        total_pagos += pago
    
    ganancias = total_apuestas - total_pagos
    return ganancias

In [None]:
simula_apuestas(2, 1, 0.5)

100.20961411699851

`assert` nos ayuda a verificar condiciones sencillas, como tipos de variables o booleanos. Si `assert` no se cumple, detendrá la ejecución del código en esa línea. 

¿Qué hacemos si quisiéramos que el código siguiera ejecutándose a pesar de que no es un entero, pero sí es un número? Por ejemplo, si quisiéramos que el número se redondeara al entero más cercano:

In [None]:
def simula_apuestas(num_apuestas, multiplicador, win_rate):
    
    assert type(num_apuestas) is int or type(num_apuestas) is float, "num_apuestas no es un número"
    num_apuestas = int(round(num_apuestas, 0))
    print(num_apuestas)
    
    total_apuestas = 0
    total_pagos = 0
    
    for a in range(num_apuestas):
        apuesta = random.uniform(0,1)*100
        pago = pago_apuesta(apuesta, multiplicador, win_rate)
        total_apuestas += apuesta
        total_pagos += pago
    
    ganancias = total_apuestas - total_pagos
    return ganancias

In [None]:
simula_apuestas(0.6, 1, 0.5)

1
True


0.0

¿Qué hicimos? Verificamos que el número siempre sea un número entero o float, y luego, redondeamos y convertimos a un entero para que `range` funcione como esperamos.

Es muy común que nosotros no tengamos control absoluto sobre la información que manejamos. Por ejemplo, si estuvieras creando simulaciones para ver si las apuestas del casino en el que trabajas coinciden con las ganancias teóricas, podrías ejecutar la función anterior con el número de apuestas diarias en los tragamonedas. Sin embargo, imagina que el becario escribe algunos días el número de apuestas como string `'2,575'` y otros días como entero `13450` en incluso a veces como un float `13590.0`. ¿Cómo arreglamos esto?

In [None]:
apuestas_diarias = ['2,575', 13450, 13590.0, '1720.0']

In [None]:
for ap in apuestas_diarias:
    print(ap)

2,575
13450
13590.0
1720.0


In [None]:
int('2,575')

ValueError: ignored

In [None]:
int(13590.0)

13590

In [None]:
int(float('1720.0'))

1720

In [None]:
apuestas_diarias

['2,575', 13450, 13590.0, '1720.0']

In [None]:
for ap in apuestas_diarias:
    try:
        
        int(ap)
        print(ap)
    except ValueError:
        print(ap, "Not a valid number or has invalid number characters")

2,575 Not a valid number or has invalid number characters
13450
13590.0
1720.0 Not a valid number or has invalid number characters


In [None]:
for ap in apuestas_diarias:
    try:
        int(float(ap))
        print(ap)
    except ValueError:
        print(ap, "Not a valid number or has invalid number characters")

2,575 Not a valid number or has invalid number characters
13450
13590.0
1720.0


Esta combinación de `try` y `except` nos ayudaría a correr nuestro código y después volver a esos errores para una revisión manual. En general, este tipo de errores deben corregirse desde el origen de la captura de información, ya que de lo contrario será muy complicado identificar todas las posibles combinaciones de errores.