# Python avanzado y principios del desarrollo de software

### Operadores de comparasión

Todos los lenguajes de programación tienen operadores que sirven para hacer comparaciones entre una cosa y otra, de tal modo que podamos tomar decisiones y clasificar datos. Por ejemplo, si quiero saber si el usuario actual es menor de edad, puedo preguntar eso usando el comparador < o > (menor que, o mayor que):


In [12]:
edad_del_usuario = 17

mayoria_de_edad = 18


edad_del_usuario < mayoria_de_edad

True

Para esto usamos también los operadores mayor o igual qué `>=` y menor o igual que `<=`.

Para comparar si algo es igual a algo más usamos el operador `==`. Por ejemplo:

In [13]:
edad_del_usuario = 18

mayoria_de_edad = 18

edad_del_usuario == mayoria_de_edad

True

Para comparar que algo es diferente de usamos `!=`

In [14]:
edad_del_usuario = 17

mayoria_de_edad = 18


edad_del_usuario != mayoria_de_edad

True

Para más información sobre operadores de comparación [aquí](https://docs.python.org/3/reference/lexical_analysis.html#operators)

### Control de flujo o Control Flow

El control de flujo es la manera que tiene un lenguaje para encaminar la data por uno u otro lado según los requerimientos que tu necesites usando condiciones que pueden ayudarse de comparadores.

Por ejemplo, si el usuario es mayor de edad, imprime: es mayor de edad.



In [19]:
edad_del_usuario = 20
mayoria_de_edad = 18

if edad_del_usuario >= mayoria_de_edad:
    print("es mayor de edad")

es mayor de edad


Podemos un bloque de código que se ejecute en caso de que la condición sea falsa usando un `else` statement:

In [20]:
edad_del_usuario = 7
mayoria_de_edad = 18

if edad_del_usuario >= mayoria_de_edad:
    print("es mayor de edad")
else:
    print("es menor de edad")

es menor de edad


Incluso, podemos agregar una o más condiciones adicionales a la primer condicional usando `elif` statements:

In [38]:
edad_del_usuario = 18
mayoria_de_edad = 18

if edad_del_usuario > mayoria_de_edad:
    print("es mayor de edad")
elif edad_del_usuario == 18:
    print("tiene 18 años")
else:
    print("es menor de edad")

tiene 18 años


Los siguientes elif statements pueden usarse sobre otras características del dataset, por ejemplo, si este fuera un arreglo con otros datos como color de pelo, podría poner en un elif: si el `color de pelo` es igual a `rojo` y pasar otro bloque de código, e inclusive poner más de una condición por cada `if` o `elif`:


In [22]:
usuario = {"edad": 29, "pelo": "rojo", "nombre":"Ron Weasley"}

if usuario["edad"] > 10 and usuario["pelo"] == "rojo":
    print("debes ser un Weasley")

debes ser un Weasley


Del mismo modo, puedes usar not para tus condicionantes:

In [24]:
usuario = {"edad": 29, "pelo": "sin pelo", "nombre":"Voldemort"}

if usuario["edad"] > 10 and not usuario["pelo"] == "rojo":
    print("no eres un Weasley")

no eres un Weasley


### Ahora, un ejercicio:

Usemos lo que hemos aprendido de flujo de control y condicionantes para clasificar la edad, supongamos que tienes encuestas de salud de una población amplia y quieres __clasificar__ a los encuestados según su edad para comenzar a hacer estadística. Para ello recopilaste el dato __Edad__. Los registros que tienes se parecen a estos de abajo, donde recopilas género, edad, cantidad de hijos, colonia, salario mensual, si padecen de diabetes:

In [33]:
encuestados = [['Femenino', 38, 2, "Nuevo Repueblo", "de 0 a 5,000", False], 
               ['Femenino', 19, 0, "Contry La silla", "de 10,000 a 15,000", False], 
               ['Masculino', 22, 1, "Fomerrey 22", "de 0 a 5,000", False], 
               ['Masculino', 70, 3, "Valle Verde", "de 5,000 a 7,000", True], 
               ['Femenino', 57, 4, "Centro", "de 7,000 a 10,000", False], 
               ['Femenino', 44, 0, "Valle Alto", "de 30,000 a 50,000", False], 
               ['Femenino', 20, 2, "Burócratas Municipales", "de 5,000 a 7,000", True], 
               ['Masculino', 19, 0, "Buenos Aires", "de 10,000 a 13,000", True], 
               ['Femenino', 12, 0, "Obrera", "de 5,000 a 7,000", True], 
               ['Masculino', 32, 3, "Contry Sol", "de 10,000 a 15,000", False], 
               ['Femenino', 87, 9, "Del Paseo", "de 15,000 a 20,000", True], 
               ['Femenino', 25, 1, "Roma", "de 20,000 a 25,000", False], 
               ['Masculino', 65, 3, "Estadio", "de 10,000 a 15,000", True], ]

Para clasificar las edades quiero usar una metodología de la universidad autónoma de tangamandapio que va así:

In [34]:
# Dificultad normal:

# edad mayor a 20: no-joven
# edad menor a 20: joven


# dificultad insanity:

rango_de_edades = { "joven": [10, 20], 
                    "millenial": [20, 35], 
                    "super adulto": [30, 300],
                  }


Agrega un último valor a cada registro que represente la clasificación según la edad. Usa un for loop, las comparaciones que consideres necesarias, los elifs que consideres necesarios y las dobles condicionales que consideres necesarias y append.

__Input__: la variable encuestados y la clasificación normal, o la insanity  
__cómputo__: clasificar cada registro según la edad  
__output__: la lista con una columna más que represente esta clasificación

### Funciones

__¿Qué es una función?__


En python, como en muchos otros lenguajes, las funciones se __definen__ para encapsular un comportamiento o reutilizar código. Por ejemplo, en nuestro ejemplo de arriba para verificar la edad, es posible que tengamos que utilizarlo en el futuro. Para no re-escribirlo, definamos una función:

In [37]:
edad_del_usuario = 18


def checar_edad(usuario):
    mayoria_de_edad = 18
    if usuario > mayoria_de_edad:
        print("es mayor de edad")
    elif usuario == 18:
        print("tiene 18 años")
    else:
        print("es menor de edad")
        
checar_edad(edad_del_usuario)

tiene 18 años


## Programación estructurada y modular

Hasta ahora la mayoría de nuestro código lo hemos ejecutado en la consola, sin embargo, en cuanto cerramos la consola nuestro código, nuestras variables y nuestro trabajo desaparecen. Es por eso que cuando ya comenzamos a trabajar como científicas de datos, lo que requerimos hacer es guardar nuestro código en un archivo tipo python, al que le llamamos script. Cualquier archivo que termine en `.py` es un script de python y puede ser ejecutado con el intérprete de `python`. 

La programación que hacemos en un solo archivo, con un solo punto de salida arriba a abajo se llama programación estructurada y es el tipo de programación que hemos hecho hasta ahora. A medida que nuestro trabajo se vuelva más complejo vamos a requerir separar nuestro código en partes más pequeñas y trabajarlo por separado para aminorar las fallas y facilitar su manejo: recuerda, divide y vencerás. En desarrollo de software, dividir grandes problemas en problemas más y más chicos es la mejor manera de programar. Para ello existe la programación modular: donde nosotros agrupamos nuestro código en módulos, e incluso en archivos distintos para mandarlo llamar cuando así lo consideremos. Los programadores suelen además escribir sus propios módulos que usan frecuentemente y algunas veces, cuando es código muy extenso y necesario, el desarrollador lo distribuye como una librería.

Para escribir y mandar a llamar un módulo: 

1. definamos un archivo con el nombre del módulo y sus funciones adentro. Por ejemplo: modulo_de_nombres.py
2. mandemos a llamar ese archivo usando la función `import modulo_de_nombres`
3. dentro de ese nuevo documento podemos usar las funciones escribiendo modulo_de_nombres.nombre_de_función.

Demostración.


### Importando Numpy

__Numpy__ es una librería estadística de python que utilizaremos para realizar algunas funciones. Justamente es un conjunto de módulos que alguien escribió para realizar funciones estadísticas porque se dio cuenta que era una actividad recurrente en su trabajo, y decidió escribir módulos y luego liberar su código para que los programadores del público lo mejoraran. Para importar `numpy` hay que tenerlo instalado y sólo indicar `import numpy` al principio de mi script.

Juguemos con Numpy:

In [44]:
import numpy as np

a = [1, 2, 3]
b = [2, 3, 4]
print(a + b)

c = np.array(a)
d = np.array(b)

print(c + d)
print(c * d)

[1, 2, 3, 2, 3, 4]
[3 5 7]
[ 2  6 12]
