# **Introducción al análisis de datos en Python** 
### Profesor: Juan Pablo Salas

# Clase 1: Introducción Python
> **Objetivo**: El objetivo de este taller es que se familiaricen con los elementos básicos de Python.

¿Qué es y Por qué Python? 

Python es un [lenguaje de programación](https://es.wikipedia.org/wiki/Lenguaje_de_programaci%C3%B3n)
- Es el tercer lenguaje de programación más popular del mundo.
- Es el primero cuando se trata de temas de análisis de datos.
- Es un lenguaje de propósito general, es decir que se utiliza para muchas cosas como Machine Learning, Internet of things, creación de aplicaciones web, de escritorio y de móviles.
- Open-source
- Comunidad grande y colaborativa

> **Recuerde**: Estamos usando Python 3.9. Usamos como *Managers* PIP y Conda. Todo esto lo logramos de manera sencilla instalando [Miniconda](https://docs.conda.io/en/latest/miniconda.html).

1. **Sintaxis en Python:** Indentación y estructura básica.
2. **Tipos de datos:** entero, float, lógico, character. Missings: NaN, NA. 
5. **Estructuras de datos:** Listas, cadenas, tuplas y diccionarios. 
6. **Numpy y Pandas.** Operaciones básicas e indexación. 

### Jupyter Notebook
Los archivos de extensión *.ipynb* presentan una interfaz muy cómoda para el aprendizaje, y la colaboración. Contiene:
- Celdas de código
- Celdas de [markdown](https://github.com/adam-p/markdown-here/wiki/Markdown-Cheatsheet) (como esta)
- Celdas de texto crudo
- Kernel

<div class="alert alert-info">
La documentación oficial de Jupyter está  
<a href="https://jupyter-notebook.readthedocs.io/en/stable/" class="alert-link">aquí</a>
y puede encontrar algunos Notebooks didácticos 
<a href="https://github.com/jupyter/notebook/tree/master/docs/source/examples/Notebook" class="alert-link">aquí</a>

Entre las ventajas de utilizar Jupyter Notebooks es que se pueden incluir formulas matemáticas utilizando comandos de Latex al igual que imágenes o hipervínculos.
$$\text{Teorema de Pitágoras: }c = \sqrt{a^2 + b^2}$$

<center>
<img src="https://www.neurochispas.com/wp-content/uploads/2021/05/como-aplicar-el-teorema-de-pitagoras.png" alt="Teorema de Pitágoras" style="height:150px;">
</center>


### Kernel
El "kernel" es lo que permite que se corran cosas en python, Jupyter es una interfaz para que los bloques de código corran dentro de una consola de python, el kernel es el que conecta esta interfaz con la parte del computador que corre el código.

El kernel también guarda **espacio de trabajo**, es decir todas las variables que se han declarado. 

Se puede reiniciar el kernel de manera rápida en la pestaña de "kernel" en el tope.

## Variables en Python
En Python una variables es creada cuando se le asigna algun valor y se nombra.

In [1]:
x = 5 
y = 'Hola Mundo!'

Para saber cuál es el valor de una variable siempre utilizaremos la función nativa de Python, `print()`. Por ejemplo:

In [None]:
s = "Esta es mi variable"
print(s)

In [None]:
print(x)

In [None]:
print(y)

### Tipos de variables básicas
Existen 4 tipos de variable básicas

1. **Integers**. O sea los números enteros: `1, 7, 10000, -70`
2. **Float**. Número de punto flotante, es decir que es un número que tiene algún decimal. `3.0, 3.1416, -4.3, 1.0000, 0.00`
3. **Strings**. Variables que se codifican como texto. Siempre van entre comillas. `'3', "a", "hola", "adasd", "20BC"`
4. **Boolean**. Solo pueden tomar dos valores: Verdadero o Falso, que en Python serían ```True``` o `False`

In [5]:
# Integer
a = 1

In [6]:
# Float
b = -1.2

In [7]:
# String
c = "1"

In [8]:
# Bool
d = True

In [None]:
# Con la función type se puede chequear la clase o tipo de cada objeto
type(0.0)

In [None]:
type(a)

In [None]:
# También podemos tener números complejos, pero no nos preocuparemos por eso en esta clase
type(1j)

### *Casting* de variables
Hay casos en los que queremos especificar el tipo de nuestra variable. Esto se puede hacer con el casting de variables:
>* `int()` - Construye un entero utilizando el argumento, puede construir un entero de un numero real haciendo utilizando la funcion *piso*.
>* `float()` - Construye un decimal utilizando el argumento.
>* `str()` - Construye una cadena de caracteres utilizando el argumento.

In [None]:
x = int(2.8)
x

In [None]:
y = float(2.8)
y

In [None]:
z = str(2.8)
z

In [None]:
int('2')

In [None]:
float("2.764")

In [None]:
int("a")

### Operacion de variables numéricas
El uso más básico de Python es convertirlo en una calculadora. Los símbolos para calcular las operaciones básicas son los siguientes:

| Operación | Resultado       |
| --------- | --------------- |
|    +      | Suma            |
|    -      | Resta           |
|    *      | Multiplicación  |
|    /      | División        |
|    %      | Modulo          |
|    //     | División entera |
|    \*\*   | Potencia        |


In [22]:
# Otra forma de asignar variables
a, b, c = 5, 2, 87
# Esa línea es homologa a:
a = 5
b = 2
c = 87

In [None]:
a / b

In [None]:
a // b

In [None]:
a * b

In [None]:
c ** 3

In [None]:
c / 5

In [None]:
c % b #¿Cuál es el residuo de dividir 87 entre 2?

In [None]:
a

In [None]:
# Podemos modificar nuestras variables. Por ejemplo, sumemosle 2 a la variable a (que es 5)
a = a + 2 
a

### Operadores de asignación
Existen unos operadores que me permiten realizar operaciones y sobreescribir mi variable en una sola línea.

In [None]:
x = 5
print('Valor original:', x)

In [None]:
x = 5
x = x + 2
print('Le sumo 2 a x:', x)

In [None]:
x = 5
x += 2
print('Le sumo 2 a x:', x)

In [None]:
x -= 2
print('Le resto 2:', x)

In [None]:
x *= 2
print('Lo multiplico por 2:', x)

In [None]:
x /= 5
print('Lo divido por 5:', x)

In [None]:
x **= 2
print('Lo elevo a la 2:', x)

### Operaciones Booleanos (comparar valores)
Adicionalmente podemos comparar objetos para saber si son iguales, diferentes, mayores o menores.

| Operación | Resultado       |
| --------- | --------------- |
|    ==      | Igual            |
|    !=     | No igual           |
|    >      | Mayor que  |
|    <      | Menor que        |
|    >=      | Mayor o igual que          |
|    <=     | Menor o igual que |


In [None]:
print('a:',a,', b:',b)

In [None]:
print(a > b)

In [None]:
print(a == 6)

In [None]:
print(a != 6)

Estas operaciones también las podemos realizar con strings

In [None]:
mi_nombre = 'Juan Pablo'
print(mi_nombre == 'Jorge')

In [None]:
"Juan" != "Sebastian"

In [None]:
# Para saber si una palabra es más grande que otra, se utiliza el orden alfabético. Las primeras letras del abecedario
# son más pequeñas. En este caso Sebastian es más grande que Juan porque S está después de J en el abecedario
"Juan" > "Sebastian"

In [None]:
# En este caso Camilo es más grande porque la C está después de la A
"Andres" > "Camilo"

In [None]:
# Como ambas palabras comienzan por la A, se entra a evaluar el segundo carácter
"Andres" > "Alejandra"

In [None]:
# Las letras minúsculas preceden a las mayúsculas
"Andres" > "amarillo"

In [None]:
"a" > "A"

Se pueden usar los operadores de `y` e `o` para construir comparaciones más complejas. Recuerde las tablas de verdad

| a | b | A and B | A or B |
|:-:|:-:|:-------:|:------:|
| T | T |    T    |    T   |
| T | F |    F    |    T   |
| F | T |    F    |    T   |
| F | F |    F    |    F   |

In [None]:
True and True

In [None]:
True and False

In [None]:
print(a > 5 and a <= 10)

In [None]:
print(a > 5 or a % 3 == 0)

### Operaciones con strings

Con las cadenas de caracteres, o **strings** también podemos realizar algunas operaciones básicas tales como:

| Operación       | Símbolo |
| --------------- | --------- |
| Concatenación            |    +      |
| Repetición           |    * |
| Longitud  |    `len`      |
| Pertenencia        |    a `in` b     |
| Capitalización          |    `.lower()`, `.upper()`, `.title()`      |
| Slicing |   `a[inc:exc]`     |
| Unión y separación|   `.join, .split`     |
| Reemplazar|   `.replace`     |
| Eliminación de espacios|   `.strip`     |

In [None]:
nombre = 'Juan Pablo'
apellido = 'Salas'
nombre+' '+apellido

In [None]:
nombre*3

In [None]:
len(nombre)

In [None]:
'a' in nombre

In [None]:
# Verificar si una secuencia de caracteres está dentro de otra
'Juan' in nombre

In [None]:
'juan' in nombre

In [None]:
# Transformar el string a minúsculas
nombre.lower()

In [None]:
# Extraiga el segundo y tercer caracter de "apellido"
apellido[1:3]

In [None]:
apellido[1:4] #Retorna los caracteres en posiciones 1,2,3

In [None]:
apellido[0:3]

In [None]:
# Unión de caracteres con otro string de por medio
'*-'.join('3312059664')

In [None]:
# Separación de strings en elementos de una lista por espacio (por defecto)
'Al fin y al cabo, no son más que palabras.'.split(' ')

In [None]:
'Al fin y al cabo, no son más que palabras.'.split(',')

In [None]:
# Reemplazar una cadena de caracteres
carros = 'El precio de los automóviles está aumentando considerablemente. Hoy en día, los automóviles más demandados son los electricos.'
carros.replace('automóviles','carros')

In [24]:
a = ' A veces nuestros archivos tienen espacios de texto indeseados         '

In [None]:
a.strip()

#### Strings con formato (f-string)

Es común que cuando imprimimos a la consola utilicemos una combinación de variables ya definidas y strings. Esto se puede simplificar con los strings con formato. Consideremos el siguiente ejemplo:

In [78]:
# Datos de una persona
edad = 43
profesion = 'Administradora'
nombre = 'María'
apellido = 'Gutierrez'

In [None]:
print('Hola, mi nombre es '+nombre+' '+apellido+'. Tengo '+str(edad)+' años y soy '+profesion+'.')

In [None]:
print(f'Hola, mi nombre es {nombre} {apellido}. Tengo {edad} años y soy {profesion}.')

#### Entrada de datos por teclado

En Python, la función `input()` permite al usuario introducir datos desde el teclado durante la ejecución de un programa. Se muestra una caja de texto cuya entrada luego se devuelve como cadena de texto o se guarda en una variable.

In [None]:
input("¿Cuál es su profesión?")

In [83]:
edad = input("¿Cuántos años tiene?")

In [None]:
print(f'Esta persona tiene {edad} años.')

In [None]:
type(edad)

### Ejercicios

1. Una caja de tamaño normal puede guardar hasta 6 huevos. Escriba un bloque de código que calcule cuántas cajas requiere un granjero para almacenar 28 huevos. Determine tambien cuántos huevos serán guardados en la última caja incompleta y cuántos huevos adicionales harían falta para llenarla. ¿Qué ocurre si el número total de huevos `n_huevos` es 45 y el número de huevos por caja `n_huevos_caja` es 8?

In [None]:
# ----- Desarrolle su código a continuación -----
n_huevos = # 
n_huevos_caja = # 
respuesta = ''
print(respuesta)

2. Según la American Heart Association (AHA), la fórmula para calcular su frecuencia cardíaca máxima en pulsaciones por minuto es 220 menos su edad en años. Su frecuencia cardíaca objetivo debería estar entre el 50-85% de su frecuencia cárdiaca máxima. Escriba un código que recibe la edad del usuario y calcula la frecuencia cardíaca máxima y el rango de su frecuencia óptima. 

In [None]:
# ----- Desarrolle su código a continuación -----

3. Escriba un código que reciba como entrada del usuario las calificaciones de tres materias del usuario. Después de esto, el código debería mostrar el promedio de las tres materias así como el nombre de la materia con calificación más alta y más baja.

In [None]:
# ----- Desarrolle su código a continuación -----