In [None]:
import numpy as np
import pandas as pd
import matplotlib as plt

<h1><center> Introducción a Python </h1>

<h3><center> Johan rosa </h3>
<h4><center> Julio 2019 </h4>

### Objetivo

Solializar algunas notas que he tomado sobre la programación con `python`, de cara al curso de métodos numéricos que se aproxima. 

### Contenido

- Python como un calculadora
- Creación y manipulación de objetos
- Instalar paquetes
- Visualizaciones de datos
- Objetos de dos dimensiones

## Lo básico 
### Python como una calculadora

In [None]:
# Aritmética
print(5 + 5) # suma

In [None]:
print(10 - 5) # resta

In [None]:
print(5 * 5) # multiplicación

In [None]:
print(10 / 2) # división

In [None]:
print(10 ** 2) # potenciación

#### Creando y manipulando objetos
Los objetos son elementos que residen en el ambiente de trabajo y pueden contener valores que sean el resultado de una operación, o  bien un valor arbitrario dado por el usuario.

#### Tipos de objetos (básicos)
 - **Strings** contienen texto
 - **Integer** contienen numeros enteros
 - **Float** contienen números reales
 - **Boolean** contienen `True` o `False`

### Una muestra

In [None]:
# Tipos de objetos
my_name = "Johan"; type(my_name) 

In [None]:
my_age = 26; type(my_age)

In [None]:
my_height = 5.10; type(my_height)

In [None]:
is_male = True; type(is_male)

### Listas 
- Pueden contener varios elementos
- Estos elementos pueden ser de diferentes tipos
- Para definirlos se utilizan  `[]` y se separan por `,`

In [None]:
# Creando listas
johan = ['Johan', 26, 5.10, True]; print(johan)
# johan2 = [my_name, my_age, my_height, is_male]; print(johan2)
jordan = ['Jordan', 25, 6.0, True]; print(jordan)


### Listas
Las lista pueden almacenar cualquier tipo de objetos, incluso otras listas

In [None]:
hermanos = [johan, jordan]
print(hermanos)

### Accediendo a los elementos de una lista

Ya que las listas almacenan varios elementos, eventualmente se necesitará consultar uno o varios elementos en particular. Para esto es importante conocer la indexación.

- En `python` cada elemento dentro de una `lista` tiene un índice de acuerdo a su posición
- Los índices empiezan en 0, no en 1 como en otros lenguajes
- Estructura para hacer la consulta `lista[indice]` 

In [None]:
# Si queremos ver la edad de johan
print(johan[1]) # la edad es el elemento 2, por eso se usa el indice 1
print(johan[-1]) # is_male

Podría parecer buena idea reorganizar la lista de listas `hermanos` usando lo que ya hemos visto

In [None]:
#Reorganizando entonces la lista de listas
hermanos2 = [[johan[0], jordan[0]], # nombres
             [johan[1], jordan[1]], # edades
             [johan[2], jordan[2]], # estaturas
             [johan[3], jordan[3]]] # is_male

print(hermanos2)  
# Qué ventajas les parece que tienen esta opción?

**Ejercicios**

1. Extraer la estatura de la lista `jordan`

2. Extraer los datos de johan de la lista `hermanos`

3. Extraer las edades de la lista `hermanos2`

4. Extraer la edad de jordan, de la lista `hermanos2`

### Paquetes en Python
- Los paquetes son conjuntos de funciones y datos que ponen a nuestra disposición el trabajo de otros
- Los paquetes se instalan el la consola general de la distribución de python que tenemos
    - `pip install package_name`
- Aunque tengamos un paquete instalado, siempre hay que cargarlo en la sección de trabajo para usar las funciones que contine
    - `import package_name as algo`

**numpy**

Este es el primer paquete que vamos a utilizar aquí, y nos será útil para crear `arrays`.

**arrays**
- Al igual que las listas pueden almacenar varios elementos
- Son elementos atómicos (Sólo pueden contener elementos de la misma clase)
- Su principal ventaja es que permite realizar operaciones vectorizadas

In [None]:
# importando el paquete
import numpy as np

**Diferencias prácticas entre las listas y los arrays**

**Las listas**
- La suma de dos listas simplemente combina ambas listas
- La multiplicación repite n veces los elementos de la listas (Solo se amite un int)

In [None]:
# Creando algunas algunas listas
bono1 = [500]; bono2 = [600]
tasa_bono1 = [1.06]; tasa_bono2 = [1.06]

In [None]:
bonos = bono1 + bono2
print(bonos)

In [None]:
tasas = tasa_bono1 + tasa_bono2
print(tasas)

In [None]:
print(bono1 * 2)

**Los array**

Para crear arrays se utiliza la función `np.array()` de numpy, simplemente se necesita una lista con elementos de la misma clase.

In [None]:
# Creando un array
ingreso = np.array([25000, 30000, 18000, 15000, 60000])

# comvirtiendo las listas en array
bonos_array = np.array(bonos)
tasas_array = np.array(tasas)

Ya que tenemos dos arrays podemos hacer operaciones vectorizadas con ellas. Por ejemplo multiplicar cada bono por su tasa

In [None]:
print(bonos_array * tasas_array)

#### Métodos de los objetos

En `python`, como en `c++` y otros lenguajes, los objetos tienen atributos dependiendo el tipo de objeto (Programación orientada a objetos)

Ejemplos.

In [None]:
# Para arrays númericos
print(ingreso.mean()); print(ingreso.max()); print(ingreso.min())
print(ingreso.sum())

In [None]:
# Para strings
print("johan".upper())
print("JOHAN".lower())

### Visualización de datos: una pincelada
Para las visualizaciones usaremos el paquete `matplotlib`

In [None]:
import matplotlib.pyplot as plt
plt.rcParams['figure.figsize'] = [9, 4]

# Creando algunos objetos para hacer gráficos
year = [2000, 2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009]
ingreso = [19000, 21000, 21000, 24000, 25000, 30000, 31000, 35000, 40000, 50000]
gasto_tc = [19000, 16000, 22000, 16000, 20000, 22000, 24000, 30000, 45000, 40000]

### Un gráfico de líneas

In [None]:
# un gráfico de líneas
plt.plot(year, ingreso, label = "Ingreso")
plt.xlabel("Year") # titulo del eje x
plt.ylabel("RD$") # etiqueta del eje y
plt.title("Ingreso percibido") # titulo del gráfico
plt.yticks([20000, 25000, 30000, 35000, 40000, 45000, 50000],
           ['20,000', '25,000', '30,000', '35,000', '40,000', '45,000', '50,000'])
#plt.grid(True) # agregando lineas de orientación al gráfico
 # para modificar el texto del gráfico se añaden dos listas, una con los valores originales y otra con
 # los valores deseados
plt.show()

### Un gráfico de dispersión

In [None]:
# Gráfico de dispersión
plt.scatter(ingreso, gasto_tc)
#plt.grid(True) # agregando lineas de orientación al gráfico
plt.show()

### Objetos con más dimensiones
Este tipo de objetos, a diferencia de las `listas` y `arrays`, tienen otros atributos . Entre los más comunes están los diccionarios y los data frame.

#### Diccionarios

- Guardan información referenciada a una etiqueta
- Las etiquetas son únicas en cada diccionario
- Se declaran usando `{}` (Las listas usaban `[]`)
- Los diccionarios pueden contener elementos de distitos tipo

#### Creando y manipulando diccionarios

- Guardan información referenciada a una etiqueta y se crean con `{}`

In [None]:
edades = {'Johan': 26, 'Jordan': 25, 'Johanna': 30, 'Felix': 52, 'Ydaisa': 52, 'Elhan': 2}
print(edades)

In [None]:
print(edades['Johan']); print(edades['Johanna'])

- Las listas pueden contener información de distitos tipo

In [None]:
# Los diccionario pueden contener elementos de distintos tipos.
Johan = {'name': 'Johan', 'edad': 26, 'estatura': 5.10, 'Es hombre': True}

# Ahora una lista más larga
hermanos3 = {'name': ['Johan', 'Johanna', 'Jordan'], 'edad': [26, 30, 25],
             'estatura': [5.10, 5.04, 5.11], 'Es hombre': [True, False, True]}
print(hermanos3)


- Las etiquetas son únicas

In [None]:
#Imaginemos que la edad cambió
Johan['edad'] = 27
print(Johan)

# De esta misma forma podemos agregar elementos, siempre y cuando la clave no sea igual a una preexistente
Johan['skin'] = 'black'
print(Johan)

# Para eliminar un elemento del diccionario podemos utilizar la función `del()`
del(Johan['skin'])

print(Johan)

### Data Frame
- Estructuras rectangurales de datos
- Para crearlas y manipularlas en python se suele usar el paquete `pandas`
- Se importan desde archivos `.txt`, `.csv`, `.xlsx`, `etc`.
- También pueden ser creadas en el ambiente de trabajo

In [None]:
# Importar el paqute
import pandas as pd

# Creando un `DF` desde un diccionario (Este diccionario se definió anteriormente)
hermanos_df = pd.DataFrame(hermanos3)
print(hermanos_df)

#### Importar data frame



In [None]:
pokemon = pd.read_csv('//bcfs1/PROMIECO/Encuestas macroeconomicas/Personales/Johan Rosa/JR/python/Pokemon1.csv')
pokemon.head()

### Accediendo a los elementos de un DF 
- Mediante corchetes `[]`
- Métodos avanzados
    - .loc
    - .iloc
    
**Primero con corchetes**

Para acceder a columnas completas `df['variable']` o `df[['variable']]`

In [None]:
print(pokemon.columns) # Consultando los nombres de las variables del data frame
print(type(pokemon["Name"])) # para acceder a una columna en particular. Esto es un array
print(type(pokemon[["Name"]])) # para acceder a una columna en particular

In [None]:
# Seleccionar más de una variable
pokemon[['Name', "Attack"]].head(3)

**Acceder a filas concretas**

Para acceder a una o varias filas en particular se utiliza el índice de la fila dentro de los corchetes.

In [None]:
pokemon[1:2]

In [None]:
pokemon[0:4][["Name", "Attack", "Speed", "Legendary", "HP"]]
# Esto no funcionaría
# print(pokemon[1])

**Ahora con los métodos `loc` y `iloc`**

son utilizados para acceder a los elementos de un data frame. Suelen ser más flexibles que solo los corchetes y se basan en etiquetas e índices de posición, respectivamente.

**Primero con `.loc`**

In [None]:
# Primero vamos a hacerle una pequeña modificación a data frame para que tenga como 
# label de filas el nombre del pokemon en cuestión
pokemon.index = pokemon["Name"]

# Hecho esto podemos usar el metodo df.loc para acceder a los datos de pokemones mediales los labels
pokemon.loc[["Ivysaur"]]


In [None]:
# Ahora de dos pokemones, o más. 
pokemon.loc[["Pikachu", "Bulbasaur", "Squirtle"]]
# Qué pokemon falta para completar esta lista?

**Seguimos con `.loc`**

Ahora los datos de estos pokemones pero no de todas las columnas

In [None]:
pokemon.loc[["Pikachu", "Charmander"], ["Attack", "HP"]]

In [None]:
# para ver todas las filas 
pokemon.loc[:, ["Attack"]].head(12)

**Ahora con `.iloc`**

`df.iloc` se utiliza para acceder a las filas y columnas de un data frame mediante el índice de posición de estas.

In [None]:
pokemon.iloc[[0]] # Si uso un solo corchete la extraigo como un pandas' list

In [None]:
pokemon.iloc[0:3]

In [None]:
# Imprimir multiples filas o columnas usando .iloc
pokemon.iloc[[1, 2, 3]]

In [None]:
pokemon.iloc[2:5, [1, 6]]

### Usando condiciones lógicas para filtrar Objetos

Algo que necesariamente tendrémos que hacer es filtrar las observaciones de un `df` en base a cierto criterios o comparaciones lógicas. Para esto se usan los siguientes comparadores:

- `>` : Mayor que
- `>=`: Mayor o igual que
- `<` : Menor que
- `<=`: Menor o igual que
- `==`: Igual a
- `!=`: Diferente de

Las comprobaciones que se realizan usando estos operadores resultan en un `True` o `False`

**Pruebas**

In [None]:
print(3 > 5); print(3 == 3); print("AL" > "B")
# Se puedne comparar strings. La comparación se realiza segíun el orden alfabético.
# En el caso de las listas se compara la cantidad de elementos

In [None]:
# Ingreso es un lista
print(ingreso)

Crear arrays con las listas que usamos para hacer gráficas, para poner en práctica los filtros

In [None]:
# Podemos crear arrays con esto objetos para poner en práctica los filtros
ingreso_array = np.array(ingreso)
gasto_tc_array = np.array(ingreso)
balance_array = ingreso_array - gasto_tc_array

Comprobación lógica de un array

In [None]:
mas_25k = ingreso_array > 25000 

El resultado de una comprobación lógica de un array es una colección de `True` o `False`

In [None]:
print(mas_25k)

In [None]:
# Se puede utilizar para filtar el objetos original 
print(ingreso_array[mas_25k])

In [None]:
# También se puede poner la comporbación dentro de los corchetes y evitar la creación de un objeto intermedio
print(ingreso_array[ingreso_array > 25000])

**Preguntas**

1. Cuántos ingresos hay mayores a 30,000?
2. Cuántas veces el individuo pudo ahorrar y cuánto cada vez?
3. De los ingresos mayores a 30,000, cuál es el menor?

**Operadores lógicos** `and`, `or` **y** `not`.

Estos se utilizan para saber si un objeto o los elementos cumplen una o más condiciones, o alguna entre ciertas condiciones.

<div class="columns-2">

- **and:**
    - True **and** True = True
    - True **and** False = False
    - False **and** True = False
    - False **and** False = False 
- **or:**
    - True **or** True = True
    - True **or** False = True
    - False **and** True = True
    - False **and** False = False
- **not:**
    - **not** True = False
    - **not** False = True
</div>

No es lo mismo comparar elemento individuales y arrays

In [None]:
print(3 == 3 and 4 == 4) # Esto se puede hacer
print(3 > 4 or 5 > 3) # Esto también
print([1, 1, 1] < [1, 3])

 Pero si queremos ver en el objeto `ingreso_array` los valores que son menores que 30,000 y mayores que 20,000, no podemos hacer lo siguiente `print(ingreso_array > 20000 or ingreso_array < 30000)`.
 
 Para el uso de los operadores `and`, `or` y `not` en arrays hay funciones particulares.

In [None]:
print(np.logical_and(ingreso_array > 25000, ingreso_array < 30000)) # Queremos los ingresos del centro 
print(np.logical_or(ingreso_array < 23000, ingreso_array > 35000)) # los extremos
#como esta también existe np.logical_or

**Conditional Statements**

`if`, `elif` y `else`

**If statement**

In [None]:
# If statement
x = 8   
if x % 2 == 0 :
    print("x es par")

Se pueden declarar varias sentencias luego de comparador lógico

In [None]:
if x % 2 == 0 :
    print("x = " + str(x))
    print("x es par")

In [None]:
# En esta caso la comparación es falsa y no se ejecuta la sentencia.
if x % 2 != 0 :
    print("x es impar")

**else statement**

In [None]:
x = 7

if x % 2 == 0 :
    print("x es par")
else :
    print("x es impar")

**elif statement** 

In [None]:
peso_lb = 175

if peso_lb <= 150 :
    print("Estas flaco, come más")
elif peso_lb > 150 and peso_lb <= 170 :
    print("Estás dentro de tu peso ideal")
elif peso_lb > 170 and peso_lb < 185 :
    print("Cuidado, te estás pasando de peso")
else :
    print("Deberías rebajar")


### Fintrando un padas DataFrame

In [None]:
# Recuerdan el DF pokemon
pokemon.head()

**Ojetivo**

- Filtrar los pokemones de la generación 2

**Pasos**

1. Seleccionar la columna `Generation`
2. Hacer la comparación de lugar
3. Usar la comparación para filtrar el `df`


**En cámara lenta**

In [None]:
# Extraer la la variable `legendary`. Hay varias alternativas para esto
generation = pokemon["Generation"] #pokemon.loc[:, "Generation"]; #pokemon.iloc[:, 11]
generation_2 = generation == 2
pokemon[generation_2].head()

**De forma directa**

In [None]:
pokemon[pokemon["Generation"] == 2].head()

**Ahora filtremos los elementos que cumplem dos condiciones o más**

> recuerden las funciones `logical_and`, `logical_or` del paquete `numpy`, para la comparación de arrays

**Pokemones legendarios de la primera generación**

In [None]:
pokemon[np.logical_and(pokemon["Legendary"], pokemon["Generation"] == 1)]

### Loops

Los bucles ganan terreno en la realización de operaciones repetitivas sobre una colección de elementos u objetos.

**Tipos de loops**

- while
- for

**While loop**

Ejecutan una operación repetitivamente hasta que se cumple una condición

In [None]:
presupuesto = 1500; precio_cerveza = 200

# voy a beber mientras me quede para comparar cerveza
while presupuesto > precio_cerveza :
    print("Tengo " + str(presupuesto) + ", Dame otra!")
    presupuesto = presupuesto - precio_cerveza
    

**For loop**

Repiten una acción a lo largo de una secuencia de valores, la cual debe ser definida a priori.

Estructura del comando

```
for var in seq :
    expresion
```

In [None]:
participantes = ["Johan", "Jesus", "Merlym"]

print(participantes[0])
print(participantes[1])
print(participantes[2])

In [None]:
for nombre in participantes :
    print(nombre)

In [None]:
for index, nombre in enumerate(participantes) :
    print(nombre + " es el número ", str(index + 1))

### Ejercicio 
> Fuente: Intermediate Python for data science, Data camp

Imaginemos que estamos en el piso 1 de BlueMall y hacemos la apuesta de que podemos llegar al piso 25 de la torre, lanzando un dado 40 veces. La forma de avanzar y las restricciones del juego son las siguientes:

- Si dale `1` o `2` bajas un piso
- Si sale `3`, `4` o `5`, subes 1 piso
- Si sale `6`, vuelves a tirar el dato y subes la cantidad de pisos que resulte 
- No puedes bajar del primer nivel, lo que significa que si en primer tiro sale `1` o `2`, te quedas donde estás

**Insumos:**

- `numpy.random`, un subpaquete de numpy para generar número aleatorios
- las estructuras de control, `if`, `elif` y `else` para decidir si subir o bajar
- los loops para hacer el ejercicio varias veces

#### Generando números aleatorios 

In [69]:
# Generar un número aleatorio entre 0 y 1
np.random.rand()

0.580219786087074

Un elemento importante a la hora de hacer ejercicios con números aleatorios es utilizar un `seed()`, porque permite reproducibilidad

In [72]:
np.random.seed(1)
print(np.random.rand())
print(np.random.rand())

0.417022004702574
0.7203244934421581


In [None]:
np.random.seed(1)
print(np.random.rand())
print(np.random.rand())

In [79]:
# Generar números acotados en un intervalo arbitrario
np.random.randint(1, 11) # Un número entre 1 y 10

5

Bien, con esto y lo que ya sabemos podemos hacer el ejercicio!

Creemos un dado y una estructura de control que nos diga si subir o bajar dependiendo lo que resulte de lanzar el dado

In [115]:
# Crear el dado
dado = # completar

#Piso en el que te encuentras
piso_actual = 10

# Estructura de control
if dado <=  2:
   ## completar
elif dado <= 5 :
   ## completar
else :
    ## Completar 
    
print(piso_actual)
print(dado) 

11
4


Ahora queremos hacer iteraciones del ejercicio anterior e ir guardando los resultados.

Llegaremos al piso 25 de BlueMall?

In [148]:
# Creando una lista para tener un log de los pasos dados
random_walk = [0]

for i in range(25) :
    # lanzamiento del dando
    dado = np.random.randint(1, 7)
    
    # Piso en el que estamos
    piso = random_walk[-1]
    
    # Qué hago
    if dado <= 2 :
        piso = piso - 1
    elif dado <= 5 :
        piso = piso + 1
    else :
        piso = piso + dado
        
    random_walk.append(piso)

print(random_walk)

[0, 1, 2, 3, 2, 1, 2, 3, 4, 5, 11, 10, 9, 10, 16, 15, 16, 17, 18, 17, 16, 17, 16, 15, 14, 20]


> Vamos bien, pero tenemos que lograr nunca bajar del primer piso (piso 0)