# Estructuras de datos

Hay 4 elementos en Python que nos permiten almacenar colecciones de datos.
- Listas
- Tuplas
- Sets
- Diccionarios

### Listas

Las listas pueden contener diferentes tipos de datos.

In [11]:
lista = ['manzana', 'banana', 'cereza']
lista

['manzana', 'banana', 'cereza']

#### Métodos de lista
`append` Agrega un elemento al final de la lista.

In [12]:
lista.append('naranja')
lista

['manzana', 'banana', 'cereza', 'naranja']

`extend` Extiende la lista añadiéndole todos los elementos del iterable

In [13]:
lista.extend(['kiwi', 'mango'])
lista

['manzana', 'banana', 'cereza', 'naranja', 'kiwi', 'mango']

`insert` Inserta un elemento en una posición dada. El primer argumento es el índice del elemento que se insertará antes, por lo que a.insert(0, x) inserta al principio de la lista y a.insert(len(a), x) es equivalente a a.append(x).

In [14]:
lista.insert(1, 'fresa')
lista

['manzana', 'fresa', 'banana', 'cereza', 'naranja', 'kiwi', 'mango']

In [15]:
lista2 = ['pera', 'uva']
lista.insert(2, lista2)
lista

['manzana',
 'fresa',
 ['pera', 'uva'],
 'banana',
 'cereza',
 'naranja',
 'kiwi',
 'mango']

`remove` Elimina el primer elemento de la lista cuyo valor sea x. Lanza un ValueError si no existe dicho elemento.

In [16]:
lista.remove(lista2)
lista

['manzana', 'fresa', 'banana', 'cereza', 'naranja', 'kiwi', 'mango']

In [17]:
lista.extend(lista2)
lista

['manzana',
 'fresa',
 'banana',
 'cereza',
 'naranja',
 'kiwi',
 'mango',
 'pera',
 'uva']

`pop` extrae el elemento de la lista en la posición indicada y lo devuelve. Si no se especifica ningún índice, a.pop() extrae y devuelve el último elemento de la lista.

In [18]:
lista.pop(0)
lista

['fresa', 'banana', 'cereza', 'naranja', 'kiwi', 'mango', 'pera', 'uva']

`clear` Elimina todos los elementos de la lista

In [20]:
lista2.clear()
lista2

[]

`count` Devuelve el número de veces que x aparece en la lista.

In [21]:
lista.count('banana')

1

`list.sort()` Véase también [sorted()](https://docs.python.org/3/howto/sorting.html).

In [27]:
#Ordenar lista alfabéticamente inverso
lista.sort(reverse=True)
lista

['uva', 'pera', 'naranja', 'mango', 'kiwi', 'fresa', 'cereza', 'banana']

`list.reverse()`
Invierte los elementos de la lista en su lugar.

In [28]:
lista.reverse()
lista

['banana', 'cereza', 'fresa', 'kiwi', 'mango', 'naranja', 'pera', 'uva']

`slicing` no es un método como tal, pero podemos jugar con los elementos de las listas y sus posiciones

In [1]:
lst_ = [1, 2, 3, 4, 5]
lst_ = ["Alberto-0", "Blanca-1", "Carlos-2", "Daniela-3", "Edgar-4"]

In [2]:
lst_[4]

'Edgar-4'

In [3]:
len(lst_)

5

In [4]:
lst_[-1]

'Edgar-4'

In [5]:
# [].reverse() -> invertir la lista tal y como está
lst_[::-1]

['Edgar-4', 'Daniela-3', 'Carlos-2', 'Blanca-1', 'Alberto-0']

`start, step, stop`

In [6]:
lst_[:] # índice: de principio a fin  

['Alberto-0', 'Blanca-1', 'Carlos-2', 'Daniela-3', 'Edgar-4']

In [7]:
lst_[:2]
# start: defecto (principio)
# stop: el 2 -> que es en realidad el 0 y el 1

['Alberto-0', 'Blanca-1']

In [8]:
lst_

['Alberto-0', 'Blanca-1', 'Carlos-2', 'Daniela-3', 'Edgar-4']

In [9]:
lst_[2:4]

['Carlos-2', 'Daniela-3']

In [10]:
lst_[:4]

['Alberto-0', 'Blanca-1', 'Carlos-2', 'Daniela-3']

In [11]:
lst_[1:]

['Blanca-1', 'Carlos-2', 'Daniela-3', 'Edgar-4']

In [12]:
lst_[::]

['Alberto-0', 'Blanca-1', 'Carlos-2', 'Daniela-3', 'Edgar-4']

In [13]:
lst_[::-1] # invierte

['Edgar-4', 'Daniela-3', 'Carlos-2', 'Blanca-1', 'Alberto-0']

In [14]:
lst_[::2] # step -> cada dos elementos

['Alberto-0', 'Carlos-2', 'Edgar-4']

In [15]:
lst_[::3] # step -> cada tres elementos

['Alberto-0', 'Daniela-3']

In [16]:
lst_[::4] # step -> cada cuatro elementos

['Alberto-0', 'Edgar-4']

In [17]:
lst_[::5] # step -> cada cinco elementos

['Alberto-0']

In [18]:
lst_[1:2]

['Blanca-1']

### Tuplas

In [None]:
# Data structures

# listas: []
# tuplas: ()
# sets: {}
# diccionarios: {:}

In [None]:
("a", "b")

# Iterable
# Está ordenado (los elementos se pueden identificar por posición/índice)
# Puede contener cualquier tipo de dato/estructura
# Pueden tener cosas repetidas (igual que las listas o las strs)

('a', 'b')

Las tuplas en Python son un tipo de datos o estructura que permite almacenar datos de forma muy similar a las listas, excepto que son inmutables. Por lo tanto, no podremos:
- cambiar los elementos
- agregar nuevos valores

- Listas: []
- Tuplas: (), contienen diferentes tipos de datos. Tienen menos métodos porque están pensadas para ser un poco más inmutables. Python las utiliza mucho a nivel interno. 

Ventajas de las tuplas
* Más rápidas
* Los datos no se pueden modificar

También es posible que utilicemos tuplas cuando queramos devolver múltiples valores en el `return` de una función

In [None]:
# Métodos de las listas sin los "mágicos"
[i for i in dir([]) if "_" not in i]

['append',
 'clear',
 'copy',
 'count',
 'extend',
 'index',
 'insert',
 'pop',
 'remove',
 'reverse',
 'sort']

In [None]:
# lista: para ser trabajada/transformda
# tupla: información que no se planea que cambie tanto
    # tupla: es más difícil de transformar

In [None]:
# python de forma interna utiliza / empaqueta las cosas en tuplas
    # performance, python prefiere tuplas

In [None]:
("Laura", "Carlos", "Carlos")

('Laura', 'Carlos', 'Carlos')

In [None]:
type(("Laura", "Carlos", "Carlos"))

tuple

In [None]:
for i in ("Laura", "Carlos", "Carlos"):
    print(i)

Laura
Carlos
Carlos


In [None]:
for i in ["Laura", "Carlos", "Carlos"]:
    print(i)

Laura
Carlos
Carlos


In [None]:
("Laura", "Carlos", "Carlos")[0:1]

('Laura',)

In [None]:
["Laura", "Carlos", "Carlos"][0:1]

['Laura']

In [None]:
tup_ = (1, 2, 3, "4", ["el cinco"])
tup_
# Si yo hago asi la tupla, todo bien porque admite cualquier tipo de dato

(1, 2, 3, '4', ['el cinco'])

In [None]:
tup_.append(["el cinco"])
tup_
#Así no se puede porque las tuplas son inmutables

AttributeError: 'tuple' object has no attribute 'append'

In [27]:
tup_ = (1, 2, 3, "4")
list_ = list(tup_)
list_.append(["el cinco"])
list_
# Tengo que convertir la tupla en lista para poder modificarla

[1, 2, 3, '4', ['el cinco']]

-----------------------------

##### Challenge 1: Tuplas

¿Sabías que puedes crear tuplas con un solo elemento?

**En la celda a continuación, define una variable `tup` con un solo elemento `"p"`.**<br>

In [28]:
tup = ('p')

#### Ahora intenta agregar los siguientes elementos a `tup`. 

¿Puedes hacerlo? Explícalo.

```
"y", "t", "h", "o", "n"
```

In [31]:
tup.insert(1, 'q')
tup
# No se puede porque las tuplas no tienen el método insert, append ni extend

AttributeError: 'str' object has no attribute 'insert'

#### Divida `tup` en `tup1` y `tup2` con 3 elementos en cada uno. 

`tup1` debería ser `("p", "y", "t)` y `tup2` debería ser `("h", "o", "n")`.

*Sugerencia: use números de índice positivos para la asignación de `tup1` y use números de índice negativos para la asignación de `tup2`. Los números de índice positivos cuentan desde el principio, mientras que los números de índice negativos cuentan desde el final de la secuencia.*

También imprima `tup1` y `tup2`.

In [32]:
tup = ("p","y", "t", "h", "o", "n")
tup

('p', 'y', 't', 'h', 'o', 'n')

In [37]:
tup1 = tup[:3]
tup2 = tup[3:]
print(tup1)
print(tup2)

('p', 'y', 't')
('h', 'o', 'n')


#### Agregue `tup1` y `tup2` en `tup3` usando el operador `+`.

Luego imprima `tup3` y verifique si `tup3` es igual a `tup`.

In [39]:
tup3 = tup1+ tup2
tup3

('p', 'y', 't', 'h', 'o', 'n')

In [41]:
#Verificar que tup3 es igual a tup
tup3 == tup

True

#### ¿Cuál es el número de índice de `"h"` en `tup3`?

In [42]:
#Localizar elemento en tupla
tup.index('h')

3

#### Ahora, usa un bucle FOR para verificar si cada letra de la siguiente lista está presente en `tup3`:

```
letters = ["a", "b", "c", "d", "e"]
```

Para cada letra que verifiques, imprime `True` si está presente en `tup3`, de lo contrario imprime `False`.

*Sugerencia: solo necesitas hacer un bucle en `letters`. No necesitas hacer un bucle en `tup3` porque hay un operador de Python `in` que puedes usar. Consulta la [referencia](https://stackoverflow.com/questions/17920147/how-to-check-if-a-tuple-contains-an-element-in-python).*

In [58]:
letters = ["a", "b", "c", "d", "e"]
# Verificar si cada letra de letters está en la tupla tup3
print('letters:',letters)
print('tup3:',tup3)
for letter in letters:
    if letter in tup3:
        print(f"{letter}: Si")
    else:
        print(f"{letter}: NO")


letters: ['a', 'b', 'c', 'd', 'e']
tup3: ('p', 'y', 't', 'h', 'o', 'n')
a: NO
b: NO
c: NO
d: NO
e: NO


#### ¿Cuántas veces aparece cada letra de `letters` en `tup3`?

Imprime la cantidad de veces que aparece cada letra.

In [60]:
counter=0
for letter in tup3:
    if letter in letters:
        counter += 1
print(counter)

0


In [70]:
tup4 = ('p','b', 't', 'd', 'o', 'n')
print('letters:',letters)
counter=0
for letter in letters:
    if letter in tup4:
        print(f"{letter}: Si") 
        print('Contador actual:', counter)
    else:
        print(f"{letter}: NO")
        print('Contador actual:', counter)
        counter += 1

letters: ['a', 'b', 'c', 'd', 'e']
a: NO
Contador actual: 0
b: Si
Contador actual: 1
c: NO
Contador actual: 1
d: Si
Contador actual: 2
e: NO
Contador actual: 2


-----------------------------

### Sets (conjuntos)
Los sets (conjuntos) se utilizan para almacenar varios elementos en una única variable. A diferencia de las listas, contienen elementos individuales y no tienen un orden.

![image.png](attachment:image.png)

In [None]:
# []
# ()
# {} :sets
# {:}

In [None]:
ej = set()
ej

set()

In [None]:
set([1, 2, 3])

{1, 2, 3}

In [None]:
set([1, 2, 2, 2, 3])

{1, 2, 3}

In [None]:
# un set no tiene valores repetidos
# para ver los valores únicos de estructuras de datos
# tabla: queramos ver valores únicos de fechas

`add` Agrega un elemento al conjunto

In [None]:
set_a = {1, 2, 3, 4, 5}

In [None]:
set_b = {6, 7, 8, 9, 10}

In [None]:
set_a.add(6)

In [None]:
set_a

{1, 2, 3, 4, 5, 6}

`clear` Borra todos los elementos del conjunto

`copy` Devuelve una copia del conjunto

`difference()` Devuelve un conjunto que contiene la diferencia entre dos o más conjuntos. Lo que realmente devuelve son los elementos que están SÓLO en el primer conjunto.

In [None]:
set_a

{1, 2, 3, 4, 5, 6}

In [None]:
set_b

{6, 7, 8, 9, 10}

In [None]:
set_a.difference(set_b)

{1, 2, 3, 4, 5}

`discard` y `remove`: el método incorporado discard() en Python elimina el elemento del conjunto solo si el elemento está presente en el conjunto. Si el elemento no está presente en el conjunto, no se genera ningún error ni excepción y se imprime el conjunto original.

`discard` Elimina el elemento especificado

`remove` Elimina el elemento especificado

`intersection()` Devuelve un conjunto que es la intersección de dos o más conjuntos

In [None]:
set_a.intersection(set_b)

{6}

`issubset` Devuelve si otro conjunto contiene o no este conjunto

In [None]:
set_c = {1, 2, 3, 4, 5}
set_d =  {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11}

set_c.issubset(set_d) # boolean (is...)

True

In [None]:
set_c = {1, 2, 3, 4, 5, 11}
set_d =  {1, 2, 3, 4, 6, 7, 8, 9, 11}

set_c.issubset(set_d) # boolean (is...)

False

In [None]:
# grupos / id_cliente / transacciones

# entender relaciones
# evaluar pertenencia
# valores únicpos

# SATISFACCIÓN: muy satisfecho, regular, regular, regular, no muy bien, muy satisfecho, estupendo, maravilloso....

`issuperset` Devuelve si este conjunto contiene otro conjunto o no

In [None]:
set_c = {1, 2, 3, 4, 5}
set_d =  {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11}

set_c.issuperset(set_d) # boolean (is...)

False

## Código

`pop` Elimina un elemento del conjunto. Elimina el primer elemento de un conjunto y, además, nos lo devuelve. Se diferencia de las listas que no tienen parámetros a los que pasar un índice.

`union` Devuelve un conjunto que contiene la unión de conjuntos

In [None]:
set_a

{1, 2, 3, 4, 5, 6}

In [None]:
set_b

{6, 7, 8, 9, 10}

In [None]:
set_a.union(set_b)

{1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

`update` Actualiza el conjunto con otro conjunto o cualquier otro iterable. No devuelve uno nuevo, solo actualiza el anterior.

### 💪 Hands-on 

In [71]:
import random

⚠️ ¿Te salió el mensaje: módulo no encontrado? Prueba en una celda: <br>
`!pip install random`<br>
`import random`

#### En la celda siguiente, crea una lista llamada `sample_list_1` con 80 valores aleatorios. 

Requisitos:

* Cada valor es un número entero comprendido entre 0 y 100.
* Cada valor de la lista es único.

Imprime `sample_list_1` para revisar sus valores

*Sugerencia: usa `random.sample` ([referencia](https://docs.python.org/3/library/random.html#random.sample)).*

In [75]:
sample_list_1 = random.sample(range(0, 100), k=80)
sample_list_1

[80,
 14,
 92,
 44,
 85,
 65,
 27,
 52,
 54,
 35,
 22,
 20,
 1,
 94,
 63,
 75,
 16,
 11,
 49,
 69,
 87,
 90,
 56,
 96,
 4,
 10,
 76,
 57,
 60,
 18,
 13,
 26,
 72,
 86,
 81,
 95,
 29,
 7,
 68,
 5,
 42,
 23,
 3,
 6,
 36,
 98,
 45,
 74,
 53,
 78,
 39,
 91,
 73,
 93,
 32,
 12,
 34,
 2,
 61,
 58,
 48,
 0,
 83,
 47,
 77,
 37,
 38,
 79,
 67,
 88,
 46,
 30,
 55,
 8,
 64,
 71,
 89,
 50,
 9,
 84]

#### Convierte `sample_list_1` en un conjunto llamado `set1`. Imprime la longitud del conjunto. ¿Su longitud sigue siendo 80?

In [96]:
# Convertir sample_list_1 a conjunto
set1 = set(sample_list_1)
set1

{0,
 1,
 2,
 3,
 4,
 5,
 6,
 7,
 8,
 9,
 10,
 11,
 12,
 13,
 14,
 16,
 18,
 20,
 22,
 23,
 26,
 27,
 29,
 30,
 32,
 34,
 35,
 36,
 37,
 38,
 39,
 42,
 44,
 45,
 46,
 47,
 48,
 49,
 50,
 52,
 53,
 54,
 55,
 56,
 57,
 58,
 60,
 61,
 63,
 64,
 65,
 67,
 68,
 69,
 71,
 72,
 73,
 74,
 75,
 76,
 77,
 78,
 79,
 80,
 81,
 83,
 84,
 85,
 86,
 87,
 88,
 89,
 90,
 91,
 92,
 93,
 94,
 95,
 96,
 98}

#### Crea otra lista llamada `sample_list_2` con 80 valores aleatorios.

Requisitos:

* Cada valor es un número entero comprendido entre 0 y 100.
* Los valores de la lista no tienen que ser únicos.

*Sugerencia: usa un bucle FOR.*

In [97]:
sample_list_2 = random.sample(range(0, 100), k=80)


In [98]:
#Crear sample_list_2 con un for
sample_list_2 = []
for _ in range(80):
    sample_list_2.append(random.randint(0, 100))
sample_list_2

[82,
 77,
 18,
 40,
 85,
 45,
 100,
 96,
 43,
 46,
 19,
 14,
 98,
 52,
 13,
 76,
 8,
 64,
 63,
 78,
 6,
 29,
 51,
 53,
 14,
 43,
 51,
 39,
 62,
 57,
 38,
 88,
 10,
 29,
 39,
 54,
 32,
 8,
 99,
 56,
 90,
 80,
 41,
 34,
 10,
 16,
 31,
 65,
 86,
 46,
 21,
 10,
 51,
 30,
 75,
 39,
 69,
 45,
 82,
 7,
 48,
 85,
 53,
 53,
 6,
 24,
 47,
 80,
 6,
 67,
 52,
 20,
 34,
 33,
 36,
 83,
 10,
 91,
 2,
 35]

#### Convierte `sample_list_2` en un conjunto llamado `set2`. Imprime la longitud del conjunto. ¿Su longitud sigue siendo 80?

In [99]:
set2 = set(sample_list_2)

In [102]:
#Contar elementos en samples
print('sample_list_1: ',len(sample_list_1)),
print('set1: ',len(set1))
print('sample_list_2: ',len(sample_list_2))
print('set2: ',len(set2))

sample_list_1:  80
set1:  80
sample_list_2:  80
set2:  58


#### Identifica los elementos presentes en `set1` pero no en `set2`. Asigna los elementos a un nuevo conjunto llamado `set3`.

In [103]:
# Encontrar elementos comunes entre dos sets
set3 = set1.intersection(set2)

#### Identifica los elementos presentes en `set2` pero no en `set1`. Asigna los elementos a un nuevo conjunto llamado `set4`.

In [108]:
# Encontrar los elementos que solamente estan en set2
set4 = set2.difference(set1)
set4

{19, 21, 24, 31, 33, 40, 41, 43, 51, 62, 82, 99, 100}

#### Ahora, identifica los elementos compartidos entre `set1` y `set2`. Asigna los elementos a un nuevo conjunto llamado `set5`.

In [107]:
# Encontrar los elementos compartidos entre set1 y set2
set5 = set1.union(set2)
set5

{0,
 1,
 2,
 3,
 4,
 5,
 6,
 7,
 8,
 9,
 10,
 11,
 12,
 13,
 14,
 16,
 18,
 19,
 20,
 21,
 22,
 23,
 24,
 26,
 27,
 29,
 30,
 31,
 32,
 33,
 34,
 35,
 36,
 37,
 38,
 39,
 40,
 41,
 42,
 43,
 44,
 45,
 46,
 47,
 48,
 49,
 50,
 51,
 52,
 53,
 54,
 55,
 56,
 57,
 58,
 60,
 61,
 62,
 63,
 64,
 65,
 67,
 68,
 69,
 71,
 72,
 73,
 74,
 75,
 76,
 77,
 78,
 79,
 80,
 81,
 82,
 83,
 84,
 85,
 86,
 87,
 88,
 89,
 90,
 91,
 92,
 93,
 94,
 95,
 96,
 98,
 99,
 100}

In [109]:
#Encontrar los elementos del 0 al 100 que no están en set1 ni en set2
set_all = set(range(0,101))
set_all.difference(set5)

{15, 17, 25, 28, 59, 66, 70, 97}

#### ¿Cuál es la relación entre los siguientes valores:

* len(set1)
* len(set2)
* len(set3)
* len(set4)
* len(set5)

Use una fórmula matemática para representar esa relación. Pruebe su fórmula con código Python. 

#### Elimina todos los elementos de la siguiente lista de `set1` si están presentes en el conjunto. Imprime los elementos restantes.

```
list_to_remove = [1, 9, 11, 19, 21, 29, 31, 39, 41, 49, 51, 59, 61, 69, 71, 79, 81, 89, 91, 99]
```

### Diccionarios

`clear` Elimina todos los elementos del diccionario

`items()` Devuelve una lista que contiene una tupla para cada par clave-valor

`keys` Devuelve una lista de las claves en el diccionario

`values` Devuelve una lista de todos los valores del diccionario

`pop()` Elimina el elemento con la clave especificada. Me devuelve el valor.

`popitem` Elimina el último par clave-valor insertado

`update` Actualiza el diccionario con los pares clave-valor especificados

### 💪 Hands-on 

In [128]:
# Crear un diccionario de 3 estudiantes (María, Carlos y José) con su nombre y notas en Matemáticas, Biología, Física e Inglés
estudiantes_dict = {
    "María": {"Matemáticas": 8, "Biología": 7, "Física": 5, "Inglés": 5},
    "Carlos": {"Matemáticas": 9, "Biología": 5, "Física": 6, "Inglés": 5},
    "José": {"Matemáticas": 5, "Biología": 5, "Física": 5, "Inglés": 3}
}


In [129]:
# Agregar un estudiante con sus calificaciones: María tiene ha sacado un 8 en Matemáticas y un 7 en Biología, Carlos tiene un 6 en Física y un 9 en Matemáticas, José un 3 en Inglés

In [130]:
# Muestra todos los estudiantes y sus calificaciones: usando print & format
for estudiante, notas in estudiantes_dict.items():
    print(f"Estudiante: {estudiante}")
    for asignatura, nota in notas.items():
        print(f"  {asignatura}: {nota}")

Estudiante: María
  Matemáticas: 8
  Biología: 7
  Física: 5
  Inglés: 5
Estudiante: Carlos
  Matemáticas: 9
  Biología: 5
  Física: 6
  Inglés: 5
Estudiante: José
  Matemáticas: 5
  Biología: 5
  Física: 5
  Inglés: 3


In [131]:
# Calcular el promedio de un estudiante
nombre = "María"
if nombre in estudiantes_dict:
    notas = estudiantes_dict[nombre]
    promedio = sum(notas.values()) / len(notas)
    print(f"El promedio de {nombre} es: {promedio:.2f}")

El promedio de María es: 6.25


In [132]:
# Actualizar la calificación de un estudiante: Carlos va a revisión y le bajan la nota de Física a un 5
estudiantes_dict["Carlos"]["Física"] = 5


In [133]:
# Calcula la media de Carlos
carlos_notas = estudiantes_dict["Carlos"]
carlos_promedio = sum(carlos_notas.values()) / len(carlos_notas)
carlos_promedio

6.0

In [134]:
# Calcula la media la clase
total_promedio = 0
for notas in estudiantes_dict.values():
    total_promedio += sum(notas.values()) / len(notas)
total_promedio /= len(estudiantes_dict)
round(total_promedio, 2)

5.58

In [135]:
# ¿Qué alumnos han aprobado?
estudiantes_aprobados = []
for estudiante, notas in estudiantes_dict.items():
    if all(nota >= 5 for nota in notas.values()):
        estudiantes_aprobados.append(estudiante) 
estudiantes_aprobados

['María', 'Carlos']

## Resumen
Ahora te toca a ti, ¿qué hemos aprendido hoy?