# Clase 4: Introducción a la Programación con `Python` II

**MDS7202: Laboratorio de Programación Científica para Ciencia de Datos**


## Objetivos de la Clase 🎯

- Introducción a Colecciones de datos.
- Listas, Tuplas, Conjuntos y sus métodos básicos.
- Diccionarios y sus métodos básicos.
- Iteraciones o ciclos.
- Como integrar iteraciones junto a las colecciones.

## Parte 1: Colecciones 🗃️

Hasta el momento solo hemos visto como manejar datos únicos, sin embargo, en ciencia de datos necesitaremos herramientas para manejar grandes colecciones de datos.

> **Pregunta ❓:** Cómo han manejado colecciones de datos en python?.



<div align="center"/>
<img src="https://miro.medium.com/v2/resize:fit:1100/format:webp/1*2JFd94q0vzsEcr-LB-220g.png" width="600">
</div>

<br>

<div align="center"/>
Fuente: <a href="https://towardsdatascience.com/which-python-data-structure-should-you-use-fa1edd82946c">Artículo de Yasmine Hejazi en Towards Data Science</a>.
</div>

Una **colección** es una estructura de datos que permite almacenar datos y operarlos. Algunas de las posibles operaciones son:

- Ordenar
- Mapear (aplicar una función a cada elemento)
- Filtrar
- Agregar de todos los elementos (según alguna función como la suma o el promedio).

### Mutabilidad

En python, las colecciones pueden ser: 

1. **Mutables** (listas, conjuntos), que en palabras simples, permiten adición, eliminación y modificación de sus elementos. 

2. **Inmutables** (tuplas). No se pueden modificar sus elementos,



### Iterar

Iterar se define como "realizar cierta acción varias veces".

Finalmente, es posible **iterar** sobre estas estructuras y calcular operaciones de reducción sobre estas (promedios, medianas, sumas, etc ...). Por tal motivo, las colecciones están íntimamente relacionados con la programación en Python para el análisis de datos.

### Listas

Creamos las listas usando los brackets ([]). 

In [None]:
# Lista sin elementos pero inicializada.
lista_vacia = []
lista_vacia

In [None]:
# Lista con literales
lista_1 = [1, 2, 3]
lista_1

También podemos crear una lista con distintos tipos de datos (incluyendo otras colecciones)

In [None]:
lista_2 = [1, 2, 10.0, 'hola', True, [0, 1, 2]]
lista_2

> **Pregunta ❓**: ¿Sería correcto declarar una lista como esta: `presion = [1 ,2 ,3, 3.3, 3 +1j, '4']`?

Y podemos acceder a la cantidad de elementos de la lista usando la función `len(variable_lista)`

In [None]:
# Largo de la lista = Cantidad de elementos dentro de la lista.
len(lista_2)

In [None]:
len([])

#### Operaciones con listas

##### Indexado: Cómo acceder a ciertos elementos de la lista


Cada elemento de una lista va asociado a un indice, el cual identifica la posición del elemnto dentro de la lista.
```python
lista   =  ['Uvas 🍇', 'Melón 🍈', 'Sandía 🍉', 'Damasco 🍊', 'Limón 🍋']
indices -> [  0            1             2             3            4  ] 
# Ojo que parten desde el 0!!
```

Podemos acceder a cierto elemento de la lista  usando la sintaxis 

```python
lista[indice]
```



In [None]:
lista = [
    'Uvas 🍇', 
    'Melón 🍈', 
    'Sandía 🍉', 
    'Damasco 🍊', 
    'Limón 🍋',
]

# len(lista) nos permite ver el número de elementos que contiene la lista

len(lista)

In [None]:
lista[0]

In [None]:
lista[1]

El indexado negativo nos permite partir desde el último elemento hasta el primero


In [None]:
lista[-1]

Indices parten de cero. El largo de la lista parte contando desde 1, ya que existe por lo menos un elemento en la lista. Entonces, para sacar el elemento i, tenemos que restale 1.

In [None]:
# El código anterior es equivalente a algo similar a esto:
lista[len(lista) - 1]

In [None]:
lista[-1]

Podemos mutar un valor de una lista usando 

```python
lista[indice] = nuevo_valor
```

In [None]:
lista

In [None]:
lista[0] = 'Manzana🍏' # modificamos el elemento en el índice 0 por '🍏 '
lista

Nota: Podemos simular las matrices a través de listas de listas

In [None]:
matriz = [
    [1, 2, 3], 
    [4, 5, 6], 
    [7, 8, 9]
]

matriz[2]  # i = Tercera fila

In [None]:
matriz[2][1]

In [None]:
# Para acceder a un elemento de la matriz, podemos usar un doble indexado.

matriz[2][0]  # i = Tercera fila, j = primera columna

##### Slice: Seleccionar una sublista a partir ciertos indices

Notar que esta operación retorna una nueva lista con referencias a los datos de la lista original (no los copia).

In [None]:
lista_3 = [
    'Uvas 🍇', 
    'Melón 🍈', 
    'Sandía 🍉', 
    'Damasco 🍊', 
    'Limón 🍋',
]

lista_3[1:4]

##### `.append`: Agrega un elemento al final de la lista.

Esta operación muta la lista original

In [None]:
lista = [
    'Uvas 🍇', 
    'Melón 🍈', 
    'Sandía 🍉', 
    'Damasco 🍊', 
    'Limón 🍋',
]

lista.append('Manzana 🍎')
lista

> **Pregunta ❓**: ¿Qué pasa si ejecutamos la misma expresión nuevamente?

In [None]:
lista.append('Manzana 🍎')
lista

In [None]:
lista

#####  Concatenar

También se pueden concatenar listas. Estas rentornan una **nueva lista** en vez de mutar la de origen.

In [None]:
# Limpiamos a lista anterior a la original que teníamos.
lista = ['Uvas 🍇', 'Melón 🍈', 'Sandía 🍉', 'Damasco 🍊', 'Limón 🍋', 'Manzana 🍎']
lista_2 = ['Manzana 🍎', 'Plátano 🍌', 'Piña 🍍']

# Concatenamos
nueva_lista = lista + lista_2
nueva_lista

In [None]:
lista

##### `.pop`: Quita de la lista el elemento indicado por cierto índice

Observación: Si no encuentra un elemento en el índice indicado, levanta una excepción y corta la ejecución del programa.

In [None]:
lista

In [None]:
lista.pop(1)

In [None]:
lista

In [None]:
lista.pop(100)

In [None]:
lista.pop(-1)

##### `.sort`: Ordena 

> **Nota 🗒️**: Ordena según como se defina `>=` para el tipo de dato.

In [None]:
# Orden numérico.
lista_desordenada = [10, 3, 2, -8, 1, 0, 0, -3]
lista_desordenada.sort()
lista_desordenada

In [None]:
lista_desordenada

Para ordenar strings también se hace uso del orden lexicográfico

In [None]:
# Usando listas con strings se hace con orden lexicográfico.
lista_desordenada_2 = [
    'vienesa 🍖', 
    'pan 🥖', 
    'tomate 🍅', 
    'palta 🥑', 
    'mayo 🍶', 
    'ketchup 🍶'
]
lista_desordenada_2.sort()
lista_desordenada_2

##### `.index`: Busca el elemento entregado en la lista y retorna su índice

In [None]:
# Recordamos que había en lista
lista = ['Uvas 🍇', 'Melón 🍈', 'Sandía 🍉', 'Damasco 🍊', 'Limón 🍋']
lista

In [None]:
lista.index('Sandía 🍉')

> **Pregunta ❓**: Qué pasa si no existe el elemento?

In [None]:
lista.index('Arándanos 🫐')

Pueden encontrar una completa guía aquí de todos los métodos (funciones) que pueden ejecutar con una lista:
    
https://www.programiz.com/python-programming/list

### Paréntesis: Strings.

Los strings son un tipo especial de lista que no es mutable, pero que se puede indexar.

In [None]:
['j', 'u', 'a', 'n']

In [None]:
nombre = 'Juan'
nombre[2:4]

También se pueden convertir a string

In [None]:
list(nombre)

In [None]:
str(['J', 'u', 'a', 'n'])

In [None]:
''.join(['J', 'u', 'a', 'n'])

Y podemos separarlos/juntarlos según algun carácter

In [None]:
'Juan come verduras'.split(' ')

In [None]:
# El string que pongan antes del join será el que unirá los strings del arreglo. En este caso, se uniran con '-'
'-'.join(['Juan', 'come', 'verduras'])

Como también concatenar

In [None]:
texto1 = "Juan come verduras"
texto2 = " y frutas."

texto1 + texto2

### Tuplas

Las tuplas siguen el mismo principio de las listas en cuanto a almacenar datos, no obstante, a diferencia de las listas, las tuplas son **inmutables**. Una ventaja sobre las listas, es que **son más eficientes computacionalmente y son más ligeras**. 

In [None]:
# Se utilizan 'parentesis' para crearlas

tupla = (1, 2, 3)
tupla

Al igual que las listas, sus elementos pueden ser accedidos a través del indexado (que parte desde 0!).

In [None]:
tupla[0]

In [None]:
tupla[-1]

In [None]:
tupla[0:2]

> **Pregunta ❓**: ¿Qué sucede si intentamos cambiar un valor de una tupla?

In [None]:
tupla[0] = 1

> **Pregunta ❓**: ¿Cómo podría agregar nuevos elementos a una tupla?

In [None]:
nueva_tupla = (1, 2, 3, 4)
nueva_tupla

#### Unpacking

Tuplas y listas comparten el acceso a sus elementos por medio de la sintaxis ```[*]```. Tanto tuplas como las listas se pueden "desempacar", el termino *pythonico* es **unpacking**. Ejemplo:

In [None]:
# Unpacking de tuplas
a, b, c, d = ('🚗', '🚌', '🚒', '🚕')

In [None]:
a

In [None]:
b

In [None]:
c

In [None]:
d

### Conjuntos

Los conjuntos o **sets** son contenedores mutables, no ordenadas de objetos. Están diseñados para comportarse como sus contrapartes matemáticas. Un `frozenset` posee las mismas propiedades, solo que es inmutable.

In [None]:
comida_chatarra = {
    'Pizza 🍕',
    'Hamburguesa🍔', 
    'Papas fritas🍟', 
    'Completo 🌭', 
    'Huevo Frito 🍳', 
    'Sandwich 🥪'
}

comida_chatarra

In [None]:
lista_desayuno = [
    'Sandwich 🥪', 
    'Pan 🥖', 
    'Manzana 🍎', 
    'Huevo Frito 🍳', 
    'Sandwich 🥪', 
    'Media luna 🥐',
    'Sandwich 🥪',
] # Noten que repetimos varias veces 'Sandwich 🥪'

In [None]:
# usando set podemos convertir una lista a conjunto
desayuno = set(lista_desayuno) 
desayuno

#### Operaciones de conjuntos


##### Unión

Dados dos conjuntos $A$ y $B$, su unión $A \cup B$ se puede ver representada por:

<center>
<img src="https://raw.githubusercontent.com/MDS7202/MDS7202/main/recursos/2023-01/03-Intro_a_la_programacion_en_python/union.png" alt="Unión de conjuntos A y B" width=300/>
</center>

<center>
    Fuente: <a href="https://en.wikipedia.org/wiki/Union_(set_theory)">Union (teoría de conjuntos) en Wikipedia</a>
</center>

In [None]:
union_ = comida_chatarra.union(desayuno)
union_

##### Intersección


Dados dos conjuntos $A$ y $B$, su intersección $A \cap B$ se puede ver representada por:

<center>
<img src="https://raw.githubusercontent.com/MDS7202/MDS7202/main/recursos/2023-01/03-Intro_a_la_programacion_en_python/intersection.jpg" alt="Intersección de conjuntos A y B" width=300/>
</center>

<center>
Fuente: <a href="https://en.wikipedia.org/wiki/Intersection_(set_theory)">Interseccion en Wikipedia</a>
</center>




In [None]:
comida_chatarra.intersection(desayuno)

##### Diferencia


Dados dos conjuntos $A$ y $B$, la diferencia entre $A - B$ se puede ver representada por:

<center>
<img src="https://raw.githubusercontent.com/MDS7202/MDS7202/main/recursos/2023-01/03-Intro_a_la_programacion_en_python/SetDifferenceA.svg.png" alt="Diferencia A y B" width=300/>
</center>

Y la diferencia entre $B - A$ se puede ver representada por:

<center>
<img src="https://raw.githubusercontent.com/MDS7202/MDS7202/main/recursos/2023-01/03-Intro_a_la_programacion_en_python/SetDifferenceB.svg.png" alt="Diferencia B y A" width=300/>
</center>


Recuerden que esta operación no es simétrica!

In [None]:
comida_chatarra.difference(desayuno)

In [None]:
desayuno.difference(comida_chatarra)

### Diccionarios

Un diccionario corresponde a la implementación pythonica de una aplicación del tipo "llave - valor".
Permite crear estructuras que nos permitan representar de una forma más natural los datos.

**Ejemplo**:

In [None]:
persona = {
    'nombre': 'Juan', 
    'edad': 29, 
    'peso': 70.3,
    'hobby': 'ilusionismo',
}
persona

Los datos presentes en un diccionario pueden ser accedidos mediante la sintaxis ```diccionario[llave]```.

In [None]:
persona['nombre']

> **Pregunta ❓**: ¿Qué sucede si intentamos acceder a una llave que no existe en el diccionario?

In [None]:
persona['apellido']

Podemos verificar si una llave existe en el diccionario usando el operador `in`

In [None]:
'apellido' in persona

In [None]:
if 'apellido' in persona:
    print(persona['apellido'])
else:
    print('apellido no existe en el diccionario')

#### Agregar llave al diccionario

In [None]:
persona

In [None]:
persona['apellido'] = 'Pérez'

In [None]:
persona

#### Mutar Diccionario

Podemos modifcar un valores presente en el diccionario similar a como lo hacíamos con listas, pero cambiando el índice por la llave:

In [None]:
persona['peso'] = 68.01
persona

Se pueden eliminar elementos del diccionario usando el operador `del`

In [None]:
del persona['peso']

persona

#### Acceder a *colecciones* con los elementos de los diccionarios

Para obtener las llaves de un diccionario se puede hacer uso del método ```.keys()```. 


In [None]:
# Redefinimos el diccionario al original para el siguiente ejemplo
persona = {
    'nombre': 'Juan', 
    'edad': 29, 
    'peso': 70.3
}

In [None]:
persona.keys()  # Ojo que no es una lista!

Para obtener los elementos podemos usar el método `.values()`

In [None]:
persona.values()

Y se pueden obtener tuplas indicando todas las `(llaves, valor)` del diccionario

In [None]:
persona.items()

---


## Parte 2: Iteraciones 🔁

Las iteraciones permiten recorrer y ejecutar alguna acción sobre cada elemento de una colección. Existen varias formas de lograr esto:


### Ciclo While - Propuesto estudio Personal


**While:** un ciclo ```while``` permite realizar una ```acción``` en función del valor de verdad de una ```condicion```, su estructura es:

```
while condicion: # Condición booleana
    acción # Bloque indentado
```

In [None]:
contador = 0
lista = [10, 20, 30, 40, 50, 60, 70, 80, 90, 100]

while contador < len(lista):
    print("Contador: ", contador, " | ", "Valor: ", lista[contador])
    contador += 1

> **Nota 🗒️**: Notar que si no se rompe el ciclo while con alguna condición este puede iterar infinitamente

In [None]:
# no ejecutar esto
# while True:
#    ...

### Ciclo For

Un ciclo ```for``` permite repetir realizar una```acción``` en función de los elementos de una *colección*. Su estructura corresponde a:

```python
for elemento in coleccion: 
    acción_sobre_el_elemento

```

en este caso ```elemento``` corresponde a una variable que toma, secuencialmente, los valores del iterator. 

###

#### Iteración sobre lista

In [None]:
lista = [0, 1, 2, 3, 4, 5]

In [None]:
for elemento in lista:
    #print(elemento)
    print(elemento ** 2)
    #print(elemento, '^ 2 =', elemento ** 2)

### Iteración sobre llaves del diccionario

In [None]:
persona = {
    'nombre': 'Juan', 
    'edad': 29, 
    'peso': 70.3,
    'hobby': 'ilusionismo',
}
persona

In [None]:
for key in persona:
    value = persona[key]
    print(key.upper(), value)

In [None]:
persona

#### Iteración sobre ítems del diccionario

Recordemos que `d.items()` nos entregaba una estructura similar a una lista [(llave_1, valor_1), ...]
Como cada elemento es una tupla, podemos desempacarla en llave, valor en el mismo ciclo.

In [None]:
persona.items()

In [None]:
for tupla in persona.items():
    llave, valor = tupla
    print(llave, valor)
    #print(f'{llave.upper()} : {valor}')

### Utilitarios para la iteración

#### Enumerador

Permite tener el índice del elemento al cual estamos accediendo. Para esto, usar la función `enumerate(lista)`

In [None]:
lista = [10, 11, 12, 13, 14, 15]

list(enumerate(lista))

In [None]:
for indice, elemento in enumerate(lista):
    print(f'Indice: {indice} | Elemento: {elemento}')
    if indice % 3 == 0:
        print(f'Encontré un indínce que es múltiplo de 3: {indice}')

#### Range

Genera una secuencia de números. No es una lista como tal, si no que un generador.Sintaxis: 
 
```python
range(inicio, fin, opcional(salto) )
```

In [None]:
for elemento in range(0, 5):
    print(elemento)

In [None]:
# Podemos darle además un salto, es decir, cuanto saltaremos entre un elemento y otro.
for elemento in range(0, 10, 3):
    print(elemento)

#### Zip

Permite iterar entre dos o mas secuencias al mismo tiempo. Para esto, genera tuplas con ambos valores.

In [None]:
preguntas = ['nombre', 'edad', 'peso']
respuestas = ['Juan', '27', '70']

list(zip(preguntas, respuestas))


In [None]:
for pregunta, respuesta in zip(preguntas, respuestas):
    print(f'Cuál es tu {pregunta}?  Es {respuesta}.')

#### Reverse

Invierte el orden de la colección:

In [None]:
persona

In [None]:
for i in reversed(persona):
    print(i)

### List Comprehensions

Es una forma *elegante* de crear colecciones.

Supongamos que queremos crear una lista con todas las letras de la palabra `cuaderno`.

In [None]:
letras = []
palabra = 'Cuaderno 📗'

for letra in palabra:
    letras.append(letra.upper())
    print(f'Agregué a la lista: {letra.upper()}')

letras

Podemos reemplazar este ciclo `for` por una sintaxis mas compacta:

In [None]:
letras = [letra.upper() for letra in palabra]
letras

Esto se le conoce como **List Comprehension**

Supongamos ahora que generamos una lista con los 10 primeros números enteros y de estos queremos solo los pares.
Un código usando `for` se vería como:

In [None]:
list(range(10))

In [None]:
numeros_pares = []
for numero in range(10):
    if numero % 2 == 0:
        numeros_pares.append(numero)

numeros_pares

Usando **List Comprehension**:

In [None]:
numeros_pares = [numero for numero in range(10) if numero % 2 == 0]
numeros_pares

In [None]:
numeros_pares = ['Par' if numero % 2 == 0 else 'Impar' for numero in range(10)]
numeros_pares

> **Pregunta ❓:** ¿Se puede crear usando esta notación conjuntos o diccionarios?

In [None]:
{numero: 'Par' if numero % 2 == 0 else 'Impar' for numero in range(10) }

---

### Ejercicios

### 1) Potencias de dos

Escriba un programa que genere todas las potencias de 2, desde la 0-ésima hasta la ingresada por el usuario:

### 2) Mayores que

Escriba un programa que reciba como entrada los siguientes valores:

- Un número x.
- Un número n, que indique la cantidad de números a guardar en una lista ```mayoresque```.
- Los n números.

El programa debe imprimir una nueva lista con los números contenidos dentro de la lista ```mayoresque```, que sea mayores a x.

### 3) Contar palabras.

Escriba un programa que cuente la cantidad de veces que aparecen las palabras de las oraciones contenidas, en una lista de oraciones utilizando un dicionario.

```python
oraciones = [
    "El curso de Data Science es mejor",
    "El Data Science es lo mismo que el Machine Learning",
    "Creo que estadiare Data Science en el futuro",
]
```

## Otras referencias

Un excelente tutorial de Python:
    
https://www.programiz.com/python-programming

Y el tutorial oficial: 

https://docs.python.org/es/3/tutorial/
