# Clase 3: Introducción a la Programación con `Python`

**MDS7202: Laboratorio de Programación Científica para Ciencia de Datos**


## Objetivos de la Clase 🎯

- Introducirlos a `Python` y el porqué lo usamos.
- Variables.
- Tipos de datos básicos y tipado dinámico.
- Operaciones y operadores, transformaciones entre tipos de datos.
- Control de flujo.
- Colecciones: Listas, tuplas, conjuntos y diccionarios.
- Iteraciones
- Funciones
- Unit Testing
- Documentación
- Programación Modular

## Introducción a Python


<div align='center'>
<img src="https://raw.githubusercontent.com/MDS7202/MDS7202/main/recursos/2023-01/03-Intro_a_la_programacion_en_python/python_logo.png" width=400 alt="logo"/>
</div>

`Python` es un lenguaje de programación multipropósito, enfocado en preservar legibilidad y simpleza sintáctica (_o sea, que sea facil de leer y escribir_).
Sus características y principios lo convierten en un lenguaje poderoso y fácil de aprender.

Por esta razón, es ampliamente utilizado en ámbitos tales como:

- Desarrollo Web,
- Data Science,
- Scripting,
- Software de escritorio,
- etc...

### Ecosistema 🌳

Muy probablemente la segunda razón de la popularidad de python es su extenso ecosistema: la gran cantidad de paquetes de código abierto que son compatibles con el lenguaje.

> **Nota 🗒️**: Un paquete o librería es un software desarrollado por terceros que permite ampliar las funcionalidades disponibles en python, las cuáles están enfocadas en ser usadas bajo demanda.


<div align="center"/>
<img src="https://raw.githubusercontent.com/MDS7202/MDS7202/main/recursos/2023-01/03-Intro_a_la_programacion_en_python/python_powered.png" width="600">
</div>

<br>

<div align="center"/>
Fuente: <a href="https://en.wikipedia.org/wiki/Python_(programming_language)#Uses">Python en Wikipedia</a>.
</div>


La principal forma de acceder a las librerías es el repositorio de paquetes de python [PyPi](https://pypi.org/)).

### Entonces, ¿Por qué usamos `Python` en Data Science? 🤔

Se podría decir que la suma de lo anterior:
<div align="center">
    <strong>
 La simpleza del lenguaje más la gran y activa comunidad open-source que desarrolla el ecosistema de paquetes enfocados en ciencia de datos.
    </strong>
</div>

<br>
<br>
    
<div align="center"/>
<img src="https://raw.githubusercontent.com/MDS7202/MDS7202/main/recursos/2023-01/03-Intro_a_la_programacion_en_python/python_ds_stack.png" width="600">
</div>

<br>

<div align="center"/>
Fuente: <a href="https://jupytearth.org/jupyter-resources/introduction/ecosystem.html">Jupyter Meets the Earth</a>.
</div>


### Pero pero pero python es lento... 😪

Si bien el rendimiento de los lenguajes interpretados (como python) es bajo para operaciones intensivas computacionalmente, la mayoría de las librerías están implementadas usando código escrito en lenguajes mucho más eficientes (Rust, C, Fortran), lo que permite que las operaciones sean muy eficientes.

<div align="center"/>
<img src="https://storage.googleapis.com/cdn.thenewstack.io/media/2018/05/3730357d-results-energy-time-and-memory-usage-screenshot-from-research-paper.png" width="600">
</div>



## Manos a la obra 🛠️


A continuación haremos un repaso a grandes rasgos de las sintaxis y funcionalidades básicas de python.

---

## 1. Variables 🪪

Las variables son un bloque fundamental en la programación: Son el medio que nos permite vincular un identificador/variable con valores/datos.
En Python se definen por medio de una **sentencia de asignación** usando el operador ` = `.

> **Nota 🗒️**: Una sentencia es una instrucción que el intérprete de Python puede ejecutar


In [None]:
variable = 9

Pueden imprimir el valor que tiene una variable utilizando la función `print(nombre_de_la_variable)`

> **Nota 🗒️**: Veremos más adelante funciones; mientras tanto, solo utilícenla.

In [None]:
print(variable)

O cuando estén ejecutando un Jupyter Notebook, pueden imprimir el valor de la variable poniendo el nombre de esta al final de una celda.

> **Nota 🗒️:** Pueden escribir comentarios (lineas que no se ejecutarán) usando `#`:


In [None]:
# declarar la variable
variable = 9

# ver su valor
variable

### Convenciones para Nombrar Variables

Estas son las convenciones que se usualmente se usan en `python` para escribir código (declaradas en un [Python Enhancement Proposal (PEP) 8 – Style Guide for Python Code](https://peps.python.org/pep-0008) y que **utilizaremos en el curso**.
La idea es siempre mantener siempre la consistencia y legibilidad del código.

- Largo máximo de linea: 79 carácteres

- Nombres de variables y funciones: `lower_case_with_underscores`.

```python
entero = 10
entero_mas_grande = 100
una_funcion_cualquiera
```

- Constantes (identificadores que no deberían cambiar a futuro): `UPPER_CASE_WITH_UNDERSCORES`
```python
PI = 3.14
GRAVEDAD_EN_MARTE = 3.711
```


> **Pregunta ❓**: ¿Pueden cambiar los valores de las constantes?


- Clases (veremos qué son más adelante): `CapitalizedWords `


```python
class ClaseConEstilo1:
    ...
```

- Otras reglas:
    - Nombres de variables con sentido y que describan que contiene la variable o que hace la función.
    - Nunca usar nombres con uno o dos carácteres: usualmente rompen con el punto anterior.

> **Nota 🗒️**: Recuerden que en un ámbito profesional, su código probablemente será visto y usados por otros!
    

---

## 2. Tipos de Datos 📇

A continuación veremos los tipos de datos básicos o literales: **datos en bruto** que se asignan a variables.


### Tipos de Datos Básicos


#### Integers

Números enteros creados sin parte compleja ni posiciones decimales. En este tipo de de dato es posible realizar las operaciones de división entera.

In [None]:
entero = 9
entero

#### Floats

Valores numéricos de punto flotante, pueden ser creados agregando posiciones decimales ej: ```0.87```

In [None]:
numero_flotante = 9.2344
numero_flotante

#### Complex

Números complejos, se pueden crear utilizando la notación ```a + bj``` donde ```a``` es la parte real y ```b``` es la parte compleja.

In [None]:
numero_complejo = 10 + 1j
numero_complejo

#### Booleans/Bools

Valores de verdad `True` o `False`.

In [None]:
booleano = False
booleano

In [None]:
booleano = True
booleano

#### Strings

"Cadenas" de carácteres que contienen un texto. Estos pueden ser definidos usando comillas simples ``` ' '``` o dobles ```" "```.

In [None]:
oracion = "Juan esta tomando té 🍵"
oracion

#### `None`

Tipo especial (pronunciado *nan*) que representa que la variable tiene un valor inespecífico.

In [None]:
variable_sin_ningún_valor = None
variable_sin_ningún_valor

In [None]:
print(variable_sin_ningún_valor)

In [None]:
variable_sin_ningún_valor

> **Pregunta ❓**: En ciencia de datos, qué utilidad pueden tener estos tipos de datos?

### Función `type`

Podemos usar la función `type(identificador)` para saber cuál es el tipo de dato que contiene una variable

In [None]:
oracion

In [None]:
type(oracion)

In [None]:
entero

In [None]:
type(entero)

### Verificar tipo de dato con `isinstance`

La función `isinstance` permite "preguntar" si una variable contiene un tipo de dato específico.

In [None]:
oracion

In [None]:
isinstance(oracion, int)

In [None]:
isinstance(oracion, float)

In [None]:
isinstance(oracion, str)

> **Pregunta ❓**: En Ciencia de los Datos, ¿cuál sería la utilidad de la función `isinstance`?

### Transformar Datos a Otros Tipos

Podemos usar las funciones

- `int()`
- `float()`
- `str()`
- etc...

para transformar un dato de un tipo determinado en otro.

### Entero a flotante

In [None]:
float(3)

In [None]:
type(3)

In [None]:
type(float(3))

In [None]:
3 + 1.1

In [None]:
type(3 + 1.1)

### Flotante a entero

Ojo que pierde la parte decimal.

In [None]:
int(3.14)

---

## 3. Operaciones entre datos ➕

Los operadores en python son **símbolos y keywords** especiales que permiten llevar a cabo operaciones aritméticas o lógicas entre datos.

Aritméticas:

- `+`
- `-`
- `*`
- `/`
- `//` (división entera)
- `%` (módulo)

Comparación e igualdad:

- `>` y `>=`
- `<` y `<=`
- `==`

Lógicas:

- `and`
- `or`
- `not`
- `is`
- `in`
- `not in`

### Expresión

Una expresión es una **combinación de valores, variables y operadores** que **pueden ser <u>evaluadas</u>** por el interprete.

> **Nota 🗒️**: Python es interpretado. Esto quiere decir que existe un *interprete* que convierte el código a `bytecode` (código que el procesador es capaz de entender y ejecutar) en el momento en que el código se ejecuta.

### Operadores Aritméticos y de Comparación e Igualdad

#### Suma

In [None]:
5 + 2

#### Resta

In [None]:
5 - 2

#### Multiplicación

In [None]:
5 * 2

#### División

In [None]:
5 / 2

#### División Entera

Conserva solo la parte entera de la división.

In [None]:
5 // 2

> **Pregunta ❓**: ¿Qué sucede con `//` con al operarlos con datos de tipo `float`?

In [None]:
2.5 / 2.0

In [None]:
2.5 // 2.0

#### Módulo (resto) de una división


In [None]:
5 % 2

#### Potenciación

2 elevado a 3:

In [None]:
2 ** 3

In [None]:
2 ** -3

In [None]:
2 ** -3.2334

### Operadores de Comparación e Igualdad:

#### Igualdad

In [None]:
# es 2 igual a 2?
2 == 2

In [None]:
type(2 == 2)

In [None]:
2 == 4

> **Pregunta ❓**: ¿Qué sucede con `==` cuando comparamos tipos distintos (`int` con `float` y `string`)?

In [None]:
2 == 2.0

In [None]:
2 == "2"

In [None]:
2 == int("2")

In [None]:
2 == 2 + 0j

#### Mayor y mayor igual

In [None]:
2 > 2

In [None]:
2 > 1

In [None]:
2 > 3

In [None]:
2 >= 2

> **Pregunta ❓**: ¿Qué sucede con `>`/`>=` cuando comparamos tipos distintos (`int` con `string`)?

In [None]:
3 >= "3"

#### Menor y menor igual

Mismo caso que el anterior

In [None]:
2 < 3

In [None]:
2 < 1

#### Concatenación

In [None]:
pregunta = '¿quieres un '

respuesta_a = 'tecito?'
respuesta_b = 'cafecito?'

In [None]:
pregunta + respuesta_a

#### Formateo de strings 🌟

In [None]:
pregunta_completa = f"¿deseas un {respuesta_b}"
pregunta_completa

#### Repetir strings

In [None]:
respuesta_a * 10

> **Pregunta** : ¿ `a / 10` ? ¿ `a // 10` ?

In [None]:
respuesta_a / 10

#### Operador `in`

In [None]:
respuesta_b

In [None]:
'te' in respuesta_b

In [None]:
'cafe' in respuesta_b

#### Operador `not`

In [None]:
'te' not in respuesta_b

In [None]:
pregunta_completa

### Funciones asociadas a los `strings`

#### Cambiar a mayúscula, minúscula, etc...

In [None]:
pregunta_completa

In [None]:
print('Lower:', pregunta_completa.lower())
print('Upper:', pregunta_completa.upper())
print('Title:', pregunta_completa.title())
print('Capitalize:', pregunta_completa.capitalize())

#### Reemplazar

In [None]:
pregunta_completa

In [None]:
pregunta_completa.replace('cafecito', 'tecito')

#### Eliminar espacios del inicio y final

In [None]:
hola = '    hola      '
hola

In [None]:
hola.strip()

Más información y métodos útiles (en inglés):
    
https://www.programiz.com/python-programming/string

### Operadores con booleanos

Las siguientes tablas muestran como funcionan las operaciones lógicas `and`, `or` y `not`.

#### Operador `and`

Implementa la operación lógica "y"

In [None]:
print('| Bool1  -  Bool2 |  Resultado')
print('------------------------------')
print('| True  and True  | ', True and True)
print('| False and True  | ', False and True)
print('| True  and False | ', True and False)
print('| False and False | ', False and False)

#### Operador `or`

Implementa la operación lógica "o"

In [None]:
print('| Bool1  -  Bool2 |  Resultado')
print('------------------------------')
print('| True  or True  | ', True or True)
print('| False or True  | ', False or True)
print('| True  or False | ', True or False)
print('| False or False | ', False or False)

#### Operador `not`


Implementa la operación lógica "negación"

In [None]:
print('| Bool1      |  Resultado')
print('-------------------------')
print('| not True   | ', not True)
print('| not False  | ', not False)

#### Comparaciones e igualdades

In [None]:
variable_1 = True
variable_2 = False

#### Igualdad

In [None]:
variable_1 == True

In [None]:
variable_2 == True

> **Pregunta ❓:** ¿En otros lenguajes existen los operadores `&&` y `||`?¿Existen estos en python?

---


## 4. Control de Flujo 🔀

Una estructura de **Control de flujo** se refiere a un tipo de estructura de código que nos permite decidir si ejecutar o no un determinado segmento de código según una expresión o variable booleana.

### Ejemplo: _La cafetería de la serpiente 🐍_

En el ejemplo desarrollaremos una cafetería usando expresiones de control de flujo en python.

In [None]:
pedido = 'té'

**Caso 1:** si respuesta es `'té'`, entonces servir el té:

In [None]:
if 'té' == pedido:
    print('Enseguida le traigo su té 🍵.')

> **Pregunta ❓**: ¿Qué pasa si ahora pruebo con café?

In [None]:
pedido = 'café'

In [None]:
if 'té' == pedido:
    print('Enseguida le traigo su té 🍵.')

**Caso 2:** si respuesta es `'café'`, entonces servir el café, pero conservando la opción de servir té:

In [None]:
pedido = 'café'

if 'té' == pedido:
    print('Enseguida le traigo su té 🍵.')

elif pedido == 'café':
    print('Enseguida le traigo su café ☕.')

In [None]:
pedido = 'café'

if 'té' == pedido:
    print('Enseguida le traigo su té 🍵.')

if 'té' == pedido:
    print('Enseguida le traigo su café ☕.')

> **Nota 🗒️**: La keyword ```elif``` permite agregar un nuevo caso al control de flujo y su uso es opcional.


**Caso 3:** Para cualquier pedido que no sea ni té ni café, indicar que no hay:

In [None]:
pedido = 'bebida'

if 'té' == pedido:
    print('Enseguida le traigo su 🍵.')

elif pedido == 'café':
    print('Enseguida le traigo su ☕.')

else:
    print("No tenemos lo que nos está pidiendo")


> **Nota 🗒️**: La keyword ```else``` finaliza el el flujo y es opcional. Es decir, se puede hacer
un control de flujo sin utilizar ```elif``` no ```else```.


> **Pregunta ❓:** Qué pasa si pruebo el código anterior con `te` (sin acento)?

In [None]:
pedido = 'te'

if 'té' == pedido:
    print('Enseguida le traigo su 🍵.')

elif pedido == 'café':
    print('Enseguida le traigo su ☕.')

else:
    print("No tenemos lo que nos está pidiendo")

> **Pregunta ❓:** ¿Cómo agrego la opción de `bebida`?

In [None]:
if 'té' == pedido:
    print('Enseguida le traigo su 🍵.')

elif pedido == 'café':
    print('Enseguida le traigo su ☕.')

else:
    print("No tenemos lo que nos está pidiendo")

> **Nota 🗒️**: Puede usarse ```elif``` tantas veces como sea necesario.


---

## 5. Colecciones 🗃️

Hasta el momento solo hemos visto como manejar datos únicos, sin embargo, en ciencia de datos necesitaremos herramientas para manejar grandes colecciones de datos.

> **Pregunta ❓:** Cómo han manejado colecciones de datos en python?.



Una **colección** es una estructura de datos que permite almacenar datos y operarlos. Algunas de las posibles operaciones son:

- Ordenar
- Mapear (aplicar una función a cada elemento)
- Filtrar
- Agregar de todos los elementos (según alguna función como la suma o el promedio).

### Mutabilidad

En python, las colecciones pueden ser:

1. **Mutables** (listas, conjuntos), que en palabras simples, permiten adición, eliminación y modificación de sus elementos.

2. **Inmutables** (tuplas). No se pueden modificar sus elementos,



### Iterar

Iterar se define como "realizar cierta acción varias veces".

Finalmente, es posible **iterar** sobre estas estructuras y calcular operaciones de reducción sobre estas (promedios, medianas, sumas, etc ...). Por tal motivo, las colecciones están íntimamente relacionados con la programación en Python para el análisis de datos.

### Listas

Creamos las listas usando los brackets ([]).

In [None]:
# Lista sin elementos pero inicializada.
lista_vacia = []
lista_vacia

In [None]:
# Lista con literales
lista_1 = [1, 2, 3]
lista_1

También podemos crear una lista con distintos tipos de datos (incluyendo otras colecciones)

In [None]:
lista_2 = [1, 2, 10.0, 'hola', True, [0, 1, 2]]
lista_2

> **Pregunta ❓**: ¿Sería correcto declarar una lista como esta: `presion = [1 ,2 ,3, 3.3, 3 +1j, '4']`?

Y podemos acceder a la **cantidad** de elementos de la lista usando la función `len(variable_lista)`

In [None]:
# Largo de la lista = Cantidad de elementos dentro de la lista.
len(lista_2)

In [None]:
len([])

#### Operaciones con listas

##### Indexado: Cómo acceder a ciertos elementos de la lista


Cada elemento de una lista va asociado a un indice, el cual identifica la posición del elemnto dentro de la lista.
```python
lista   =  ['Uvas 🍇', 'Melón 🍈', 'Sandía 🍉', 'Damasco 🍊', 'Limón 🍋']
indices -> [  0            1             2             3            4  ]
# Ojo que parten desde el 0!!
```

Podemos acceder a cierto elemento de la lista  usando la sintaxis

```python
lista[indice]
```



In [None]:
lista = [
    'Uvas 🍇',
    'Melón 🍈',
    'Sandía 🍉',
    'Damasco 🍊',
    'Limón 🍋',
]

# len(lista) nos permite ver el número de elementos que contiene la lista

len(lista)

In [None]:
lista[0]

In [None]:
lista[1]

El indexado negativo nos permite partir desde el último elemento hasta el primero


In [None]:
lista[-1]

Indices parten de cero. El largo de la lista parte contando desde 1, ya que existe por lo menos un elemento en la lista. Entonces, para sacar el elemento i, tenemos que restale 1.

In [None]:
# El código anterior es equivalente a algo similar a esto:
lista[len(lista) - 1]

In [None]:
lista[-1]

Podemos mutar un valor de una lista usando

```python
lista[indice] = nuevo_valor
```

In [None]:
lista

In [None]:
lista[0] = 'Manzana🍏' # modificamos el elemento en el índice 0 por '🍏 '
lista

Nota: Podemos simular las matrices a través de listas de listas

In [None]:
matriz = [
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
]

matriz[2]  # i = Tercera fila

In [None]:
matriz[2][1]

In [None]:
# Para acceder a un elemento de la matriz, podemos usar un doble indexado.

matriz[2][0]  # i = Tercera fila, j = primera columna

##### Slice: Seleccionar una sublista a partir ciertos indices

Notar que esta operación retorna una nueva lista con referencias a los datos de la lista original (no los copia).

In [None]:
lista_3 = [
    'Uvas 🍇',
    'Melón 🍈',
    'Sandía 🍉',
    'Damasco 🍊',
    'Limón 🍋',
]

lista_3[1:4]

##### `.append`: Agrega un elemento al final de la lista.

Esta operación muta la lista original

In [None]:
lista = [
    'Uvas 🍇',
    'Melón 🍈',
    'Sandía 🍉',
    'Damasco 🍊',
    'Limón 🍋',
]

lista.append('Manzana 🍎')
lista

> **Pregunta ❓**: ¿Qué pasa si ejecutamos la misma expresión nuevamente?

In [None]:
lista.append('Manzana 🍎')
lista

In [None]:
lista

#####  Concatenar

También se pueden concatenar listas. Estas rentornan una **nueva lista** en vez de mutar la de origen.

In [None]:
# Limpiamos a lista anterior a la original que teníamos.
lista = ['Uvas 🍇', 'Melón 🍈', 'Sandía 🍉', 'Damasco 🍊', 'Limón 🍋', 'Manzana 🍎']
lista_2 = ['Manzana 🍎', 'Plátano 🍌', 'Piña 🍍']

# Concatenamos
nueva_lista = lista + lista_2
nueva_lista

In [None]:
lista

##### `.pop`: Quita de la lista el elemento indicado por cierto índice

Observación: Si no encuentra un elemento en el índice indicado, levanta una excepción y corta la ejecución del programa.

In [None]:
lista

In [None]:
lista.pop(1)

In [None]:
lista

In [None]:
lista.pop(100)

In [None]:
lista.pop(-1)

##### `.sort`: Ordena

> **Nota 🗒️**: Ordena según como se defina `>=` para el tipo de dato.

In [None]:
# Orden numérico.
lista_desordenada = [10, 3, 2, -8, 1, 0, 0, -3]
lista_desordenada.sort()
lista_desordenada

In [None]:
lista_desordenada

Para ordenar strings también se hace uso del orden lexicográfico

In [None]:
# Usando listas con strings se hace con orden lexicográfico.
lista_desordenada_2 = [
    'vienesa 🍖',
    'pan 🥖',
    'tomate 🍅',
    'palta 🥑',
    'mayo 🍶',
    'ketchup 🍶'
]
lista_desordenada_2.sort()
lista_desordenada_2

##### `.index`: Busca el elemento entregado en la lista y retorna su índice

In [None]:
# Recordamos que había en lista
lista = ['Uvas 🍇', 'Melón 🍈', 'Sandía 🍉', 'Damasco 🍊', 'Limón 🍋']
lista

In [None]:
lista.index('Sandía 🍉')

> **Pregunta ❓**: Qué pasa si no existe el elemento?

In [None]:
lista.index('Arándanos 🫐')

Pueden encontrar una completa guía aquí de todos los métodos (funciones) que pueden ejecutar con una lista:
    
https://www.programiz.com/python-programming/list

### Paréntesis: Strings.

Los strings son un tipo especial de lista que no es mutable, pero que se puede indexar.

In [None]:
nombre = 'Juan'
nombre[2:4]

También se pueden convertir a string

In [None]:
list(nombre)

In [None]:
str(['J', 'u', 'a', 'n'])

In [None]:
''.join(['J', 'u', 'a', 'n'])

Y podemos separarlos/juntarlos según algun carácter

In [None]:
'Juan come verduras'.split(' ')

In [None]:
# El string que pongan antes del join será el que unirá los strings del arreglo. En este caso, se uniran con '-'
'-'.join(['Juan', 'come', 'verduras'])

Como también concatenar

In [None]:
texto1 = "Juan come verduras"
texto2 = " y frutas."

texto1 + texto2

### Tuplas

Las tuplas siguen el mismo principio de las listas en cuanto a almacenar datos, no obstante, a diferencia de las listas, las tuplas son **inmutables**. Una ventaja sobre las listas, es que **son más eficientes computacionalmente y son más ligeras**.

In [None]:
# Se utilizan 'parentesis' para crearlas

tupla = (1, 2, 3)
tupla

Al igual que las listas, sus elementos pueden ser accedidos a través del indexado (que parte desde 0!).

In [None]:
tupla[0]

In [None]:
tupla[-1]

In [None]:
tupla[0:2]

> **Pregunta ❓**: ¿Qué sucede si intentamos cambiar un valor de una tupla?

In [None]:
tupla[0] = 1

> **Pregunta ❓**: ¿Cómo podría agregar nuevos elementos a una tupla?

In [None]:
nueva_tupla = (1, 2, 3, 4)
nueva_tupla

#### Unpacking

Tuplas y listas comparten el acceso a sus elementos por medio de la sintaxis ```[*]```. Tanto tuplas como las listas se pueden "desempacar", el termino *pythonico* es **unpacking**. Ejemplo:

In [None]:
# Unpacking de tuplas
a, b, c, d = ('🚗', '🚌', '🚒', '🚕')

In [None]:
a

In [None]:
b

In [None]:
c

In [None]:
d

### Conjuntos

Los conjuntos o **sets** son contenedores mutables, no ordenadas de objetos. Los sets se caracterizan por componerse de **elementos únicos sin repetición**. Están diseñados para comportarse como sus contrapartes matemáticas. Un `frozenset` posee las mismas propiedades, solo que es inmutable.

In [None]:
comida_chatarra = {
    'Pizza 🍕',
    'Hamburguesa🍔',
    'Papas fritas🍟',
    'Completo 🌭',
    'Huevo Frito 🍳',
    'Sandwich 🥪'
}

comida_chatarra

In [None]:
lista_desayuno = [
    'Sandwich 🥪',
    'Pan 🥖',
    'Manzana 🍎',
    'Huevo Frito 🍳',
    'Sandwich 🥪',
    'Media luna 🥐',
    'Sandwich 🥪',
] # Noten que repetimos varias veces 'Sandwich 🥪'

In [None]:
# usando set podemos convertir una lista a conjunto
desayuno = set(lista_desayuno)
desayuno

### Diccionarios

Un diccionario corresponde a la implementación pythonica de una aplicación del tipo "llave - valor".
Permite crear estructuras que nos permitan representar de una forma más natural los datos.

**Ejemplo**:

In [None]:
persona = {
    'nombre': 'Juan',
    'edad': 29,
    'peso': 70.3,
    'hobby': 'ilusionismo',
}
persona

Los datos presentes en un diccionario pueden ser accedidos mediante la sintaxis ```diccionario[llave]```.

In [None]:
persona['nombre']

> **Pregunta ❓**: ¿Qué sucede si intentamos acceder a una llave que no existe en el diccionario?

In [None]:
persona['apellido']

Podemos verificar si una llave existe en el diccionario usando el operador `in`

In [None]:
'apellido' in persona

In [None]:
if 'apellido' in persona:
    print(persona['apellido'])
else:
    print('apellido no existe en el diccionario')

#### Agregar llave al diccionario

In [None]:
persona

In [None]:
persona['apellido'] = 'Pérez'

In [None]:
persona

#### Mutar Diccionario

Podemos modifcar un valores presente en el diccionario similar a como lo hacíamos con listas, pero cambiando el índice por la llave:

In [None]:
persona['peso'] = 68.01
persona

Se pueden eliminar elementos del diccionario usando el operador `del`

In [None]:
del persona['peso']

persona

#### Acceder a *colecciones* con los elementos de los diccionarios

Para obtener las llaves de un diccionario se puede hacer uso del método ```.keys()```.


In [None]:
# Redefinimos el diccionario al original para el siguiente ejemplo
persona = {
    'nombre': 'Juan',
    'edad': 29,
    'peso': 70.3
}

In [None]:
persona.keys()  # Ojo que no es una lista!

Para obtener los elementos podemos usar el método `.values()`

In [None]:
persona.values()

Y se pueden obtener tuplas indicando todas las `(llaves, valor)` del diccionario

In [None]:
persona.items()

---


## 6. Iteraciones 🔁

Las iteraciones permiten recorrer y ejecutar alguna acción sobre cada elemento de una colección. Existen varias formas de lograr esto:


### Ciclo While - Propuesto estudio Personal


**While:** un ciclo ```while``` permite realizar una ```acción``` en función del valor de verdad de una ```condicion```, su estructura es:

```
while condicion: # Condición booleana
    acción # Bloque indentado
```

In [None]:
contador = 0
lista = [10, 20, 30, 40, 50, 60, 70, 80, 90, 100]

while contador < len(lista):
    print("Contador: ", contador, " | ", "Valor: ", lista[contador])
    contador += 1

> **Nota 🗒️**: Notar que si no se rompe el ciclo while con alguna condición este puede iterar infinitamente

In [None]:
# no ejecutar esto
# while True:
#    ...

### Ciclo For

Un ciclo ```for``` permite repetir realizar una```acción``` en función de los elementos de una *colección*. Su estructura corresponde a:

```python
for elemento in coleccion:
    acción_sobre_el_elemento

```

en este caso ```elemento``` corresponde a una variable que toma, secuencialmente, los valores del iterator.

###

#### Iteración sobre lista

In [None]:
lista = [0, 1, 2, 3, 4, 5]

In [None]:
for elemento in lista:
    #print(elemento)
    print(elemento ** 2)
    #print(elemento, '^ 2 =', elemento ** 2)

### Iteración sobre llaves del diccionario

In [None]:
persona = {
    'nombre': 'Juan',
    'edad': 29,
    'peso': 70.3,
    'hobby': 'ilusionismo',
}
persona

In [None]:
for key in persona:
    value = persona[key]
    print(key.upper(), value)

In [None]:
persona

#### Iteración sobre ítems del diccionario

Recordemos que `d.items()` nos entregaba una estructura similar a una lista [(llave_1, valor_1), ...]
Como cada elemento es una tupla, podemos desempacarla en llave, valor en el mismo ciclo.

In [None]:
persona.items()

In [None]:
for tupla in persona.items():
    llave, valor = tupla
    print(llave, valor)
    #print(f'{llave.upper()} : {valor}')

In [None]:
for key, value in persona.items():
  print(key, value)

### Utilitarios para la iteración

#### Enumerador

Permite asignar el **índice** del elemento al cual estamos accediendo. Para esto, usar la función `enumerate(lista)`

In [None]:
lista = [10, 11, 12, 13, 14, 15]

list(enumerate(lista))

In [None]:
for indice, elemento in enumerate(lista):
    print(f'Indice: {indice} | Elemento: {elemento}')
    if indice % 3 == 0:
        print(f'Encontré un indínce que es múltiplo de 3: {indice}')

#### Range

Genera una secuencia de números. No es una lista como tal, si no que un generador.Sintaxis:

```python
range(inicio, fin, opcional(salto) )
```

In [None]:
for elemento in range(0, 5):
    print(elemento)

In [None]:
# Podemos darle además un salto, es decir, cuanto saltaremos entre un elemento y otro.
for elemento in range(0, 10, 3):
    print(elemento)

#### Zip

Permite **iterar entre dos o mas secuencias <u>al mismo tiempo</u>**. Para esto, genera tuplas con ambos valores.

In [None]:
preguntas = ['nombre', 'edad', 'peso']
respuestas = ['Juan', '27', '70']

list(zip(preguntas, respuestas))


In [None]:
for pregunta, respuesta in zip(preguntas, respuestas):
    print(f'Cuál es tu {pregunta}?  Es {respuesta}.')

#### Reverse

Invierte el orden de la colección:

In [None]:
persona

In [None]:
for i in reversed(persona):
    print(i)

### List Comprehensions 🌟

Es una forma *elegante* de crear colecciones.

Supongamos que queremos crear una lista con todas las letras de la palabra `cuaderno`.

In [None]:
letras = []
palabra = 'Cuaderno 📗'

for letra in palabra:
    letras.append(letra.upper())
    print(f'Agregué a la lista: {letra.upper()}')

letras

Podemos reemplazar este ciclo `for` por una sintaxis mas compacta:

In [None]:
letras = [letra.upper() for letra in palabra]
letras

Esto se le conoce como **List Comprehension**

Supongamos ahora que generamos una lista con los 10 primeros números enteros y de estos queremos solo los pares.
Un código usando `for` se vería como:

In [None]:
list(range(10))

In [None]:
numeros_pares = []
for numero in range(10):
    if numero % 2 == 0:
        numeros_pares.append(numero)

numeros_pares

Usando **List Comprehension**:

In [None]:
numeros_pares = [numero for numero in range(10) if numero % 2 == 0]
numeros_pares

In [None]:
numeros_pares = ['Par' if numero % 2 == 0 else 'Impar' for numero in range(10)]
numeros_pares

> **Pregunta ❓:** ¿Se puede crear usando esta notación conjuntos o diccionarios?

In [None]:
{numero: 'Par' if numero % 2 == 0 else 'Impar' for numero in range(10) }

---

## 7. Funciones


Una función es un segmento de código separado del código principal, la cual puede ser ejecutada (de aquí en adelante, *invocada*) desde cualquier otro punto del programa (incluyendo de si misma).

Las funciones por lo general toman parámetros, que en términos prácticos, son los datos sobre los cuales operarán.

### Sintaxis Básica

En Python, una función se define por medio de la keyword `def` seguido por el nombre y los parámetros que recibirá de entrada la función.

> **Nota 📝**: Parametro es el nombre de la variable dentro de la función. Argumento es el valor que le pasamos a el parámetro al momento de invocar la función. Se pueden usar indistintivamente.

In [None]:
def sumar(a, b):
    ...

#### Return

La keyword ```return``` permite que valores definidos dentro de la función puedan ser retornadas hacia el exterior.  Una función definida sin ```return``` entrega como resultado `None`.

In [None]:
def sumar(a, b):
    c = a + b
    return c

In [None]:
sumar(1, 2)

#### Invocación

Para invocar una función (*ejecutarla*), se utiliza el nombre de la función junto a dos paréntesis que encierran los argumentos.

In [None]:
sumar(10, 200)

> **Pregunta ❓:** ¿Qué sucede con la variable `c` definida dentro de la función?

In [None]:
def sumar(a, b):
    c = a + b
    return c

sumar(10, 200)

### Elementos extra de la sintáxis de funciones

#### Parámetros nombrados

In [None]:
def sumar(a, b):
    c = a + b
    return c

In [None]:
sumar(a=10, b=20)

In [None]:
sumar(b=10, a=20)

#### Cero parámetros

Una función puede ser ejecutada sin necesidad de tener parámetros.
En este caso (idealmente) la función siempre debería hacer la misma acción.

In [None]:
def hola_mundo():
    print('Hola!😊')

hola_mundo()

#### N parámetros 🌟

Una función puede tomar n parámetros no previamente definidos.
Esto lo logra a través del parámetro `*args`, el cuál actua como una tupla (tupla = lista inmutable):

In [None]:
def funcion_n_parametros(*args):
    print(
        'Los parámetros entregados son:',
        args
    )

funcion_n_parametros(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12)

¿Cuál es la utilidad de esto?

In [None]:
def suma_n(*args):
    acum = 0
    for i in args:
        acum += i
    return acum

suma_n(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12)

In [None]:
numeros = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]

suma_n(*numeros)

#### N Parámetros nombrados 🌟

Las funciones también pueden tomar n parámetros nombrados a través de `**kwargs`, el cúal se comporta como un diccionario.

In [None]:
def funcion_n_parametros_nombrados(*args, **kwargs):
    print(kwargs)

funcion_n_parametros_nombrados(param_1 = 1, param_2 = 2)

In [None]:
argumentos = {
    'param_1': True,
    'param_2': False,
    'param_5': False,
}

funcion_n_parametros_nombrados(**argumentos)

#### Valores por defecto

Los parámetros también pueden tener valores por defecto:


> **Nota 📝:** Los parámetros con valores por defecto deben ser declarados a la derecha de todos aquellos parámetros sin valores predefinidos.

In [None]:
def sumar(a, b, advertencias=False):
    if advertencias == True:
        print('Cuidado 👀')
    c = a + b
    return c

In [None]:
sumar(10, 2)

In [None]:
sumar(10, b=2, advertencias=True)

#### Retornar múltiples valores

También se pueden retornar múltiples valores

In [None]:
def operaciones(a, b):
    suma = a+b
    resta = a-b
    mult = a*b
    div = a/b

    return suma, resta, mult, div

In [None]:
operaciones(5,2)

In [None]:
type(operaciones(5,2))

In [None]:
suma, resta, mult, div = operaciones(5,2)

suma

---

## 8. Unit Testing


El *unit testing* o pruebas unitarias es un método para comprobar el correcto funcionamiento de un segmento de código o función.
La idea es crear casos de prueba en donde establecemos valores correctos que deberían retornar la funcion y luego comprobar que la función efectivamente los retorne.

Para esto, los test que creemos deben ser determinísticos (no aleatorios) y repetibles.


Python provee la *keyword* `assert` la cual verifica el valor de una condición:

- Si es `True` continua la ejecución.
- Si es `False`, lanza la excepción `AssertionError` y detiene la ejecución.

In [None]:
def suma(a, b):
    return a + b

In [None]:
assert 5 == suma(2, 3)

In [None]:
# La idea es hacer varios casos de prueba unitarios.
assert 5 == suma(2,3)
assert suma(2, -3) == -1
assert suma(99999,1) == 100000
assert suma(3,3) != 5
assert isinstance(suma(3,3.0), float)

### Comprobación de errores al modificar el código

Si por ejemplo, ahora modifico erroneamente la función suma y y en vez de sumar, multiplico `a` por `b`, el test los test que había programado de antemano deberían fallar.

In [None]:
def suma(a, b):
    return a * b

assert suma(2,-3) == -1
assert suma(99999,1) == 100000
assert suma(3,3) != 5

In [None]:
# Le podemos indicar que nos entregue un mensaje de error

assert suma(3,2) == 5, 'Error en suma en el test suma(3, 2)'

## 9. Documentación

Es muy probable que otros programadores (o uno mismo) quiera saber que hace alguna función sin tener que leer directamente el código para descifrarlo.

La forma estándar de lograr esto es a través de _docstrings_, documentación escrita a mano que describe qué hace la función y opcionalmente que es lo que recibe como parámetros y que es lo que retorna.

En python, el docstring de cada función es simplemente un string multi-linea y puede ser accedido a través de la función `help(nombre_función)`. Usualmente, los IDE (cómo jupyter o colab) también permiten acceder rápidamente a la documentación a través de popups u otros elementos.

In [None]:
help(print)

In [None]:
help(list)

### Implementando docstrings

Para Docstrings de una linea:


* Se usan strings multilineas ```""" """```, inclusive si se puede escribir todo en una linea.
* Las comillas que inicial la documentación están en la misma linea que aquellas que la cierran.
* El docstring es una frase que termina en punto, describe el objeto al cual se hace referencia y su efecto en la forma (accion,resultado).
* La documentación no debe tener la "firma" (signature) del objeto subyacente:

```python
# Firma, mala practica:
def funcion_suma(a,b):
    """ funcion(a,b) -> int """
    return a+b
    
# Buena practica:
def funcion_suma(a,b):
    """Suma a y b y retorna su resultado """
    return a+b
```

In [None]:
def funcion_suma(a,b):
    """Suma a y b y retorna su resultado """
    return a+b

help(funcion_suma)

Docstrings multilinea:

* La documentación debe estar indentada completamente.
* La primera linea debe ser siempre un resumen corto y conciso de el propósito del objeto que se documenta.
* Debe haber una linea en blanco luego del resumen corto. Se puede agregar una explicación más profunda posterior al espacio.

El estándar a seguir en este curso será el de Numpy, el cual pueden encontrar en el siguiente [enlace](https://sphinxcontrib-napoleon.readthedocs.io/en/latest/example_numpy.html).

---

## 10. Programación Modular y Librerías

La programación modular es una técnica de de diseño de software en la que se dividen los componentes del software en distintos módulos. Este principio es agnóstico al paradigma de programación usado y está presente en la gran mayoría de proyectos de software.

La idea es reducir la interdependencia entre componentes del sistema, generando piezas (o módulos) lo más independiente posibles.

Python posee un manejo de módulos nativo (que ya hemos visto antes) el cuál sigue la siguiente sintaxis:

```python
import module_name
```



Un modulo en Python es simplemente un archivo con extensión ```.py``` que contiene código Python (correcto).
Un módulo puede contener una cantidad arbitraria de objetos, como por ejemplo, clases, archivos funciones, etc.

### Paquetes y Librerías

Los paquetes que pueden ser descargados desde **PyPi** se agregan al entorno de ejecución por lo que pueden ser directamente importados y tratados como módulos. Por ejemplo:

In [None]:
import plotly.express as px


df = px.data.iris()
fig = px.scatter(df, x="sepal_width", y="sepal_length", color="species", marginal_y="violin",
           marginal_x="box", template="simple_white")
fig.show()

### Proyectos de Python

Usualmente los proyectos de python contienen una estructura relativamente similar en donde en ciertas carpetas ubicadas en la raiz del proyecto se guarda el código (`src` o una carpeta con el nombre del proyecto por ejemplo) mientras que en otras se guarda la documentación (`docs`) entre otros.

Luego, para importar se utilizan rutas relativas a la raiz del proyecto. Por ejemplo, para la siguiente estructura:

    ├── proyecto1
    │   ├── modulo1
    │   │   ├── submodulo1
    │   ├── modulo2
    ├── docs
    │   notebooks
    ├── README
    ├── LICENSE

Podemos importar `funcion_1`, `funcion_2` de la siguiente manera:

```python
from proyecto1.modulo1.submodulo1 import funcion_1, funcion_2

```

Noten que se recorre toda la ruta desde la raiz del proyecto.


> **Nota 🗒️**: Si bien para el proceso exploratorio de datos y prototipos de sistemas predictivos se puede almacenar todo en notebooks, el paso a producción de un sistema analítico o predictivo requiere si o si una estructura modular, en donde se separen y ordenen los componentes según su funcionalidad.

#### Ejemplo: Recorriendo la libreria de scikit-learn

Cuando estamos importando alguna funcionalidad específica de una libreria, intrínsicamente lo que estamos haciendo es indicar el *path* donde esa funcionalidad está almacenada. Veamos como se vería esto con un ejemplo:

Supongamos que queremos importar la clase `Pipeline` de `scikit-learn` para entrenar nuestros modelos de machine learning (materia que veremos en algunas clases más adelante):

In [None]:
from sklearn.pipeline import Pipeline

Si aplicamos lo aprendido, podemos deducir que la clase `Pipeline` se encuentra en un script de python llamado `pipeline`. A la vez, este script está almacenado en una carpeta ccon nombre `sklearn`. De este modo, tendríamos un proyecto con la siguiente estructura:

    ├── sklearn
    │   ├── pipeline

> **Ejercicio: 📕**: Navegue al [repositorio oficial](https://github.com/scikit-learn/scikit-learn/tree/main) de `sklearn` y encuentre el script `pipeline.py` con la clase `Pipeline`.