# **Introducción al análisis de datos en Python** 
### Profesora: Catalina María Bernal Murcia

Comparación de Simplicidad: "Hola, Mundo"
Para que te hagas una idea de lo simple que es Python, aquí tienes cómo se escribe el clásico "Hola, Mundo" en Java y en Python.


### Código en Java (5 líneas):

```java
public class HelloWorld {
    public static void main(String[] args) {
        System.out.println("¡Hola, Mundo!");
    }
}
```

### En Python (1 línea):
```python
print("¡Hola, Mundo!")
```


1. **Sintaxis en Python:** Indentación y estructura básica.
2. **Tipos de datos:** entero, float, lógico, character. Missings: NaN, NA. 
5. **Estructuras de datos:** Listas, cadenas, tuplas y diccionarios. 
6. **Numpy y Pandas.** Operaciones básicas e indexación. 

### Jupyter Notebook
Los archivos de extensión *.ipynb* presentan una interfaz muy cómoda para el aprendizaje, y la colaboración. Contiene:
- Celdas de código
- Celdas de [markdown](https://github.com/adam-p/markdown-here/wiki/Markdown-Cheatsheet) (como esta)
- Celdas de texto crudo
- Kernel

<div class="alert alert-info">
La documentación oficial de Jupyter está  
<a href="https://jupyter-notebook.readthedocs.io/en/stable/" class="alert-link">aquí</a>
y puede encontrar algunos Notebooks didácticos 
<a href="https://github.com/jupyter/notebook/tree/master/docs/source/examples/Notebook" class="alert-link">aquí</a>

Entre las ventajas de utilizar Jupyter Notebooks es que se pueden incluir formulas matemáticas utilizando comandos de Latex al igual que imágenes o hipervínculos.
$$\text{Teorema de Pitágoras: }c = \sqrt{a^2 + b^2}$$

<center>
<img src="https://www.neurochispas.com/wp-content/uploads/2021/05/como-aplicar-el-teorema-de-pitagoras.png" alt="Teorema de Pitágoras" style="height:150px;">
</center>


### Kernel
El "kernel" es lo que permite que se corran cosas en python, Jupyter es una interfaz para que los bloques de código corran dentro de una consola de python, el kernel es el que conecta esta interfaz con la parte del computador que corre el código.

El kernel también guarda **espacio de trabajo**, es decir todas las variables que se han declarado. 

Se puede reiniciar el kernel de manera rápida en la pestaña de "kernel" en el tope.

## Variables en Python
En Python una variables es creada cuando se le asigna algun valor y se nombra.

In [None]:
x = 5 
y = 'Hola Mundo!'

Para saber cuál es el valor de una variable siempre utilizaremos la función nativa de Python, `print()`. Por ejemplo:

In [5]:
s = "Esta es mi variable"
print(s)
print(x)

Esta es mi variable
5


In [4]:
print(y)

Hola Mundo!


### Tipos de variables básicas
Existen 4 tipos de variable básicas

1. **Integers**. O sea los números enteros: `1, 7, 10000, -70`
2. **Float**. Número de punto flotante, es decir que es un número que tiene algún decimal. `3.0, 3.1416, -4.3, 1.0000, 0.00`
3. **Strings**. Variables que se codifican como texto. Siempre van entre comillas. `'3', "a", "hola", "adasd", "20BC"`
4. **Boolean**. Solo pueden tomar dos valores: Verdadero o Falso, que en Python serían ```True``` o `False`

In [6]:
# Integer
a = 1

In [7]:
# Float
b = -1.2

In [8]:
# String
c = "1"

In [9]:
# Bool
d = True

In [10]:
# Con la función type se puede chequear la clase o tipo de cada objeto
type(0.0)

float

In [11]:
type(a)

int

In [12]:
# También podemos tener números complejos, pero no nos preocuparemos por eso en esta clase
type(1j)

complex

### *Casting* de variables
Hay casos en los que queremos especificar el tipo de nuestra variable. Esto se puede hacer con el casting de variables:
>* `int()` - Construye un entero utilizando el argumento, puede construir un entero de un numero real haciendo utilizando la funcion *piso*.
>* `float()` - Construye un decimal utilizando el argumento.
>* `str()` - Construye una cadena de caracteres utilizando el argumento.

In [13]:
x = int(2.8)
x

2

In [16]:
y = float(2)
y

2.0

In [18]:
print(type(2))

<class 'int'>


In [19]:
z = str(2.8)
z

'2.8'

In [22]:
int('2')

2

In [23]:
float("2.764")

2.764

In [24]:
int("a")

ValueError: invalid literal for int() with base 10: 'a'

### Operacion de variables numéricas
El uso más básico de Python es convertirlo en una calculadora. Los símbolos para calcular las operaciones básicas son los siguientes:

| Operación | Resultado       |
| --------- | --------------- |
|    +      | Suma            |
|    -      | Resta           |
|    *      | Multiplicación  |
|    /      | División        |
|    %      | Modulo          |
|    //     | División entera |
|    \*\*   | Potencia        |


In [36]:
# Otra forma de asignar variables
a, b, c = 5, 2, 87
# Esa línea es homologa a:
a = 5
b = 2
c = 87

In [28]:
print(a / b)

2.5


In [29]:
a // b

2

In [30]:
a * b

10

In [31]:
c ** 3

658503

In [32]:
c / 5

17.4

In [33]:
c % b #¿Cuál es el residuo de dividir 87 entre 2?

1

In [34]:
a

5

In [35]:
# Podemos modificar nuestras variables. Por ejemplo, sumemosle 2 a la variable a (que es 5)
a = a + 2 
a

7

### Operadores de asignación
Existen unos operadores que me permiten realizar operaciones y sobreescribir mi variable en una sola línea.

In [37]:
x = 5
print('Valor original:', x)

Valor original: 5


In [38]:
x = 5
x = x + 2
print('Le sumo 2 a x:', x)

Le sumo 2 a x: 7


In [39]:
x = 5
x += 2
print('Le sumo 2 a x:', x)

Le sumo 2 a x: 7


In [40]:
x -= 2
print('Le resto 2:', x)

Le resto 2: 5


In [41]:
x *= 2
print('Lo multiplico por 2:', x)

Lo multiplico por 2: 10


In [42]:
x /= 5
print('Lo divido por 5:', x)

Lo divido por 5: 2.0


In [43]:
x **= 2
print('Lo elevo a la 2:', x)

Lo elevo a la 2: 4.0


### Operaciones Booleanos (comparar valores)
Adicionalmente podemos comparar objetos para saber si son iguales, diferentes, mayores o menores.

| Operación | Resultado       |
| --------- | --------------- |
|    ==      | Igual            |
|    !=     | No igual           |
|    >      | Mayor que  |
|    <      | Menor que        |
|    >=      | Mayor o igual que          |
|    <=     | Menor o igual que |


In [45]:
print('a:', a,', b:', b)

a: 5 , b: 2


In [46]:
print(a > b)

True


In [47]:
print(a == 6)

False


In [48]:
print(a != 6)

True


Estas operaciones también las podemos realizar con strings

In [49]:
mi_nombre = 'Catalina'
print(mi_nombre == 'Jorge')

False


In [50]:
"Juan" != "Sebastian"

True

In [51]:
# Para saber si una palabra es más grande que otra, se utiliza el orden alfabético. Las primeras letras del abecedario
# son más pequeñas. En este caso Sebastian es más grande que Juan porque S está después de J en el abecedario
"Juan" > "Sebastian"

False

In [52]:
# En este caso Camilo es más grande porque la C está después de la A
"Andres" > "Camilo"

False

In [53]:
# Como ambas palabras comienzan por la A, se entra a evaluar el segundo carácter
"Andres" > "Alejandra"

True

In [54]:
# Las letras minúsculas preceden a las mayúsculas
"Andres" > "amarillo"

False

In [55]:
"a" > "A"

True

Se pueden usar los operadores de `y` e `o` para construir comparaciones más complejas. Recuerde las tablas de verdad

| a | b | A and B | A or B |
|:-:|:-:|:-------:|:------:|
| T | T |    T    |    T   |
| T | F |    F    |    T   |
| F | T |    F    |    T   |
| F | F |    F    |    F   |

In [56]:
True and True

True

In [57]:
True and False

False

In [62]:
a

5

In [None]:
print(a >= 5 and a <= 10) # & es equivalente a and

True


In [None]:
print(a > 5 | a % 3 == 0) # | es equivalente a or 


False


### Operaciones con strings

Con las cadenas de caracteres, o **strings** también podemos realizar algunas operaciones básicas tales como:

| Operación       | Símbolo |
| --------------- | --------- |
| Concatenación            |    +      |
| Repetición           |    * |
| Longitud  |    `len`      |
| Pertenencia        |    a `in` b     |
| Capitalización          |    `.lower()`, `.upper()`, `.title()`      |
| Slicing |   `a[inc:exc]`     |
| Unión y separación|   `.join, .split`     |
| Reemplazar|   `.replace`     |
| Eliminación de espacios|   `.strip`     |

In [72]:
nombre = 'Catalina María'
apellido = 'Bernal'
nombre + ' ' + apellido

'Catalina María Bernal'

In [68]:
nombre*3

'Catalina MaríaCatalina MaríaCatalina María'

In [73]:
len(nombre)

14

In [74]:
'a' in nombre

True

In [78]:
# Verifica si una secuencia de caracteres está dentro de otra
'Cata' in nombre

True

In [79]:
'cata' in nombre

False

In [82]:
'perro'.upper()

'PERRO'

In [80]:
# Transforma el string a minúsculas
nombre.lower()

'catalina maría'

In [83]:
nombre.count('a')

5

In [89]:
# Extrae el segundo y tercer caracter de "apellido"
apellido = 'Bernal'
apellido[1:4]

'ern'

In [90]:
apellido[1:4] #Retorna los caracteres en posiciones 1,2,3

'ern'

In [93]:
apellido[3:]

'nal'

In [95]:
nombre

'Catalina María'

In [None]:
nombre[::3] # a, b, c

'CanMí'

In [102]:
# Unión de caracteres con otro string de por medio
'*-'.join('3312059664')

'3*-3*-1*-2*-0*-5*-9*-6*-6*-4'

In [109]:
frase = f'Mi nombre es : {nombre} {234}'
print(frase)

Mi nombre es : Catalina María 234


In [None]:
# Separación de strings en elementos de una lista por espacio (por defecto)
'Al fin y al cabo, no son más que palabras.'.split(' ')

['Al', 'fin', 'y', 'al', 'cabo,', 'no', 'son', 'más', 'que', 'palabras.']

In [113]:
'Al fin y al cabo, no son más que palabras.'.split('a')

['Al fin y ', 'l c', 'bo, no son más que p', 'l', 'br', 's.']

In [116]:
# Reemplazar una cadena de caracteres
carros = 'El precio de los automóviles está aumentando considerablemente. Hoy en día, los automóviles más demandados son los electricos.'

carros = carros.replace('automóviles','carros')


In [117]:
carros

'El precio de los carros está aumentando considerablemente. Hoy en día, los carros más demandados son los electricos.'

In [118]:
a = ' A veces nuestros archivos tienen espacios de texto indeseados         '

In [121]:
a.strip()

'A veces nuestros archivos tienen espacios de texto indeseados'

#### Strings con formato (f-string)

Es común que cuando imprimimos a la consola utilicemos una combinación de variables ya definidas y strings. Esto se puede simplificar con los strings con formato. Consideremos el siguiente ejemplo:

In [123]:
# Datos de una persona
edad = 43
profesion = 'Administradora'
nombre = 'María'
apellido = 'Gutierrez'

In [124]:
'Hola, mi nombre es '+nombre+' '+apellido+'. Tengo '+str(edad)+' años y soy '+profesion+'.'

'Hola, mi nombre es María Gutierrez. Tengo 43 años y soy Administradora.'

In [125]:
print(f'Hola, mi nombre es {nombre} {apellido}. Tengo {edad} años y soy {profesion}.')

Hola, mi nombre es María Gutierrez. Tengo 43 años y soy Administradora.


#### Entrada de datos por teclado

En Python, la función `input()` permite al usuario introducir datos desde el teclado durante la ejecución de un programa. Se muestra una caja de texto cuya entrada luego se devuelve como cadena de texto o se guarda en una variable.

In [126]:
input("¿Cuál es su profesión?")

'Economía'

In [136]:
edad = int(input("¿Cuántos años tiene?"))

In [128]:
print(f'Esta persona tiene {edad} años.')

Esta persona tiene 27 años.


In [137]:
type(edad)

int

### El Zen de Python: Un Huevo de Pascua Oculto
Finalmente, Python tiene un conjunto oculto de principios rectores llamado "El Zen de Python". Puedes revelarlo en cualquier momento ejecutando este comando:

```python
import this
```

Imprimirá un breve poema de 19 aforismos para escribir código hermoso, simple y efectivo. Algunos de nuestros favoritos son:

- Bello es mejor que feo.

- Simple es mejor que complejo.

- La legibilidad cuenta.

Es un recordatorio de que el objetivo no es solo escribir código que funcione, sino escribir código que sea elegante y comprensible.



In [138]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


### Ejercicios

1. Una caja de tamaño normal puede guardar hasta 6 huevos. Escriba un bloque de código que calcule cuántas cajas requiere un granjero para almacenar 28 huevos. Determine tambien cuántos huevos serán guardados en la última caja incompleta y cuántos huevos adicionales harían falta para llenarla. ¿Qué ocurre si el número total de huevos `n_huevos` es 45 y el número de huevos por caja `n_huevos_caja` es 8?

In [None]:
# ----- Desarrolla tu código a continuación -----
n_huevos = # 
n_huevos_caja = # 
respuesta = ''
print(respuesta)

2. Según la American Heart Association (AHA), la fórmula para calcular su frecuencia cardíaca máxima en pulsaciones por minuto es 220 menos su edad en años. Su frecuencia cardíaca objetivo debería estar entre el 50-85% de su frecuencia cárdiaca máxima. Escriba un código que recibe la edad del usuario y calcula la frecuencia cardíaca máxima y el rango de su frecuencia óptima. 

In [None]:
# ----- Desarrolla tu código a continuación -----

3. Escriba un código que reciba como entrada del usuario las calificaciones de tres materias del usuario. Después de esto, el código debería mostrar el promedio de las tres materias así como el nombre de la materia con calificación más alta y más baja.

In [None]:
# ----- Desarrolla tu código a continuación -----