# Estructuras de datos

Hay 4 elementos en Python que nos permiten almacenar colecciones de datos.
- Listas
- Tuplas
- Sets
- Diccionarios

### Listas

In [None]:
lst = []

Las listas pueden contener diferentes tipos de datos.

In [15]:
lst_ = [ 1, 1.0, True]
for i in lst_:
    print(type(i))

<class 'int'>
<class 'float'>
<class 'bool'>


In [16]:
sum(lst_)

3.0

#### Métodos de lista
`append` Agrega un elemento al final de la lista.

In [20]:
lst_.append(2)
print(lst_)

[1, 1.0, True, 2, 2]


In [21]:
lista2 = ["Laura", "Alberto", "Pepe"]
lst_.append(lista2)
print(lst_)

[1, 1.0, True, 2, 2, ['Laura', 'Alberto', 'Pepe']]


`extend` Extiende la lista añadiéndole todos los elementos del iterable

In [37]:
lst_ = ["Juan"]
lst_2 = ["Ana", "Maria"]

lst_.extend(lst_2)
print(lst_)

['Juan', 'Ana', 'Maria']


`insert` Inserta un elemento en una posición dada. El primer argumento es el índice del elemento que se insertará antes, por lo que a.insert(0, x) inserta al principio de la lista y a.insert(len(a), x) es equivalente a a.append(x).

In [38]:
lst_ .insert(1, "Alberto")
print(lst_)

['Juan', 'Alberto', 'Ana', 'Maria']


`remove` Elimina el primer elemento de la lista cuyo valor sea x. Lanza un ValueError si no existe dicho elemento.

In [39]:
lst_.remove("Alberto")
print(lst_)

['Juan', 'Ana', 'Maria']


`pop` extrae el elemento de la lista en la posición indicada y lo devuelve. Si no se especifica ningún índice, a.pop() extrae y devuelve el último elemento de la lista.

In [41]:
lst_elementos = ['a', 'b', 'c', 'd', 'e']
lst_elementos.pop(2)
print(lst_elementos)

['a', 'b', 'd', 'e']


`clear` Elimina todos los elementos de la lista

In [42]:
lst_ = [ 1, 1.0, True]
lst_.clear()
print(lst_)

[]


`count` Devuelve el número de veces que x aparece en la lista.

In [None]:
# True equivale a 1 
lst_ = [ 1, 1.0, True]
lst_.count(1)   

3

`list.sort()` Véase también [sorted()](https://docs.python.org/3/howto/sorting.html).

In [None]:
lst_ = [5,1,3,2,4]
lst_.sort()
print(lst_)


[1, 2, 3, 4, 5]


`list.reverse()`
Invierte los elementos de la lista en su lugar.

In [None]:
lst_ = [1,2,3,4,5]
lst_.reverse()
print(lst_)

[5, 4, 3, 2, 1]


`slicing` no es un método como tal, pero podemos jugar con los elementos de las listas y sus posiciones

In [None]:
texto = "Hola Mundo"
print(texto[0:4])


Hola


[1, 2, 3, 4, 5]

`start, step, stop`

In [55]:
lst_ = [1,2,3,4,5]
lst_[-1]

5

In [56]:
lst_ = [1,2,3,4,5]
lst_[:]

[1, 2, 3, 4, 5]

In [58]:
lst_ = [1,2,3,4,5]
lst_[0:2]

[1, 2]

In [None]:
lst_ = [1,2,3,4,5]
lst_[::2]

# Los que estén en posición par

[1, 3, 5]

In [None]:
lst_=[[2,3,9,6],[0,2,1000,[10,20,30]],["hola"]]
lst_[1][3][2]

30

### Tuplas

Las tuplas en Python son un tipo de datos o estructura que permite almacenar datos de forma muy similar a las listas, excepto que son inmutables. Por lo tanto, no podremos:
- cambiar los elementos
- agregar nuevos valores

- Listas: []
- Tuplas: (), contienen diferentes tipos de datos. Tienen menos métodos porque están pensadas para ser un poco más inmutables. Python las utiliza mucho a nivel interno. 

Ventajas de las tuplas
* Más rápidas
* Los datos no se pueden modificar

También es posible que utilicemos tuplas cuando queramos devolver múltiples valores en el `return` de una función

In [None]:
#Lista [] y sus métodos
[i for i in dir([]) if "_" not in i]


['append',
 'clear',
 'copy',
 'count',
 'extend',
 'index',
 'insert',
 'pop',
 'remove',
 'reverse',
 'sort']

In [None]:
# Tuplas () y sus métodos
[i for i in dir(()) if "_" not in i]

['count', 'index']

-----------------------------

##### Challenge 1: Tuplas

¿Sabías que puedes crear tuplas con un solo elemento?

**En la celda a continuación, define una variable `tup` con un solo elemento `"p"`.**<br>

In [65]:
tup = ("p")

#### Ahora intenta agregar los siguientes elementos a `tup`. 

¿Puedes hacerlo? Explícalo.

```
"y", "t", "h", "o", "n"
```

In [None]:
lista = list(tup)
lista.append("y")
lista.append("t")
lista.append("h")
lista.append("o")
lista.append("n")
print(lista)

tup = tuple(lista)

# Para appendear nuevos elementos necesitamos pasar la tupla a lista, puesto que las tuplas son inmutables

['p', 'y', 't', 'h', 'o', 'n']


#### Divida `tup` en `tup1` y `tup2` con 4 elementos en cada uno. 

`tup1` debería ser `("p", "y", "t)` y `tup2` debería ser `("h", "o", "n")`.

*Sugerencia: use números de índice positivos para la asignación de `tup1` y use números de índice negativos para la asignación de `tup2`. Los números de índice positivos cuentan desde el principio, mientras que los números de índice negativos cuentan desde el final de la secuencia.*

También imprima `tup1` y `tup2`.

In [75]:
tup1 = tup[:3]
print(tup1)
tup2 = tup[3:]
print(tup2)

('p', 'y', 't')
('h', 'o', 'n')


#### Agregue `tup1` y `tup2` en `tup3` usando el operador `+`.

Luego imprima `tup3` y verifique si `tup3` es igual a `tup`.

In [None]:
tup3 = tup1 + tup2
print(tup3)

# Sí, las tuplas se pueden concatenar y se forma exactamente la misma tupla que tup original    

('p', 'y', 't', 'h', 'o', 'n')


#### ¿Cuál es el número de índice de `"h"` en `tup3`?

In [77]:
tup3.index("h")

3

#### Ahora, usa un bucle FOR para verificar si cada letra de la siguiente lista está presente en `tup3`:

```
letters = ["a", "b", "c", "d", "e"]
```

Para cada letra que verifiques, imprime `True` si está presente en `tup3`, de lo contrario imprime `False`.

*Sugerencia: solo necesitas hacer un bucle en `letters`. No necesitas hacer un bucle en `tup3` porque hay un operador de Python `in` que puedes usar. Consulta la [referencia](https://stackoverflow.com/questions/17920147/how-to-check-if-a-tuple-contains-an-element-in-python).*

In [80]:
letter = ["a", "b", "c", "d", "e"]

for i in letter:
    if i in tup3:
        print(f"La letra {i} está.")
        print("True")
    else:
        print(f"La letra {i} no está.")
        print("False")

La letra a no está.
False
La letra b no está.
False
La letra c no está.
False
La letra d no está.
False
La letra e no está.
False


#### ¿Cuántas veces aparece cada letra de `letters` en `tup3`?

Imprime la cantidad de veces que aparece cada letra.

In [81]:
# No hay letras de la lista que estén en la tupla

-----------------------------

### Sets (conjuntos)
Los sets (conjuntos) se utilizan para almacenar varios elementos en una única variable. A diferencia de las listas, contienen elementos individuales y no tienen un orden.

![image.png](attachment:image.png)

In [1]:
ej = set()
ej

set()

In [6]:
set([1,2,3])

{1, 2, 3}

`add` Agrega un elemento al conjunto

In [17]:
set_1 = {1,2,3,4,5}
set_2 = {6,7,8,9,10}

In [18]:
set_1.add(6)
print(set_1)

{1, 2, 3, 4, 5, 6}


`clear` Borra todos los elementos del conjunto

In [16]:
set_1.clear()
print(set_1)

set()


`copy` Devuelve una copia del conjunto

In [19]:
set1 = {1, 2, 3, 4, 5}
setcopia = set1.copy()
print(setcopia)

{1, 2, 3, 4, 5}


`difference()` Devuelve un conjunto que contiene la diferencia entre dos o más conjuntos. Lo que realmente devuelve son los elementos que están SÓLO en el primer conjunto.

In [None]:
set_1 = {1,2,3,4,5}
set_2 = {4,5,6,7,8}
set_1.difference(set_2)

#Devuelve los elementos que están en el primer conjunto pero no en el segundo (Diagrama dibujado arriba)

{1, 2, 3}

`discard` y `remove`: el método incorporado discard() en Python elimina el elemento del conjunto solo si el elemento está presente en el conjunto. Si el elemento no está presente en el conjunto, no se genera ningún error ni excepción y se imprime el conjunto original.

`discard` Elimina el elemento especificado

In [24]:
set_1 = {1,2,3,4,5}
set_1.discard(3)
print(set_1)

{1, 2, 4, 5}


`remove` Elimina el elemento especificado

In [27]:
set1 = {1, 2, 3, 4, 5}
set1.remove(2)
print(set1)

{1, 3, 4, 5}


`intersection()` Devuelve un conjunto que es la intersección de dos o más conjuntos

In [None]:
set_1 = {1,2,3,4,5}
set_2 = {4,5,6,7,8}
set_1.intersection(set_2)

# Devuelve los elementos que están en ambos conjuntos (Diagrama dibujado arriba)

{4, 5}

`issubset` Devuelve si otro conjunto contiene o no este conjunto

In [None]:
set_1 = {1,2,3,4,15}
set_2 = {1,2,3,4,5,6,7,8,9,10}

set_1.issubset(set_2)
#Comprueba si todos los elementos del primer conjunto están en el segundo conjunto o del pequeño al grande

False

## Código

`issuperset` Devuelve si este conjunto contiene otro conjunto o no

In [28]:
set1 = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
set2 = {1, 2, 3}

set1.issuperset(set2)
#Comprueba si todos los elementos del segundo conjunto están en el primero o del grande al pequeño

True

`pop` Elimina un elemento del conjunto. Elimina el primer elemento de un conjunto y, además, nos lo devuelve. Se diferencia de las listas que no tienen parámetros a los que pasar un índice.

In [33]:
set1 = {1, 2, 3, 4, 5}
set1.pop()
print(set1)

{2, 3, 4, 5}


`union` Devuelve un conjunto que contiene la unión de conjuntos

In [35]:
set1 = {1, 2, 3, 4, 5}
set2 = {4, 5, 6, 7, 8}

set1.union(set2)
#Como es un set no devuelve elementos repetidos aunque estén en ambos conjuntos

{1, 2, 3, 4, 5, 6, 7, 8}

`update` Actualiza el conjunto con otro conjunto o cualquier otro iterable. No devuelve uno nuevo, solo actualiza el anterior.

In [36]:
set1 = {1, 2, 3, 4, 5}
set1.update({6,7,8})
print(set1)

{1, 2, 3, 4, 5, 6, 7, 8}


### 💪 Hands-on 

In [63]:
import random   

⚠️ ¿Te salió el mensaje: módulo no encontrado? Prueba en una celda: <br>
`!pip install random`<br>
`import random`

#### En la celda siguiente, crea una lista llamada `sample_list_1` con 80 valores aleatorios. 

Requisitos:

* Cada valor es un número entero comprendido entre 0 y 100.
* Cada valor de la lista es único.

Imprime `sample_list_1` para revisar sus valores

*Sugerencia: usa `random.sample` ([referencia](https://docs.python.org/3/library/random.html#random.sample)).*

In [78]:
sample_list_1 = random.sample(range(1, 100), k=80)

#### Convierte `sample_list_1` en un conjunto llamado `set1`. Imprime la longitud del conjunto. ¿Su longitud sigue siendo 80?

In [80]:
set_1 = set(sample_list_1)
print(set_1)
print(len(set_1))

{1, 2, 3, 4, 6, 8, 10, 11, 13, 14, 16, 17, 18, 19, 20, 21, 22, 23, 24, 26, 27, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 45, 46, 47, 48, 49, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 68, 69, 70, 71, 72, 73, 76, 77, 78, 80, 81, 82, 83, 84, 85, 87, 88, 89, 90, 92, 95, 97, 98, 99}
80


#### Crea otra lista llamada `sample_list_2` con 80 valores aleatorios.

Requisitos:

* Cada valor es un número entero comprendido entre 0 y 100.
* Los valores de la lista no tienen que ser únicos.

*Sugerencia: usa un bucle FOR.*

In [96]:
sample_list_2 = []

for _ in range(80):
    aleatorio = random.randint(1, 100)
    sample_list_2.append(aleatorio)

print(sample_list_2)
print(len(set(sample_list_2)))

[1, 93, 49, 46, 59, 4, 17, 37, 63, 43, 70, 13, 24, 64, 9, 91, 84, 63, 54, 58, 69, 43, 54, 36, 25, 80, 74, 84, 49, 65, 9, 45, 50, 3, 66, 28, 66, 18, 76, 33, 75, 16, 4, 100, 1, 94, 11, 92, 49, 22, 67, 77, 2, 87, 70, 92, 34, 18, 38, 85, 20, 4, 55, 58, 60, 17, 64, 81, 85, 76, 47, 7, 44, 81, 33, 35, 23, 26, 63, 33]
57


#### Convierte `sample_list_2` en un conjunto llamado `set2`. Imprime la longitud del conjunto. ¿Su longitud sigue siendo 80?

In [97]:
set2 = set(sample_list_2)
print(len(set2))

57


#### Identifica los elementos presentes en `set1` pero no en `set2`. Asigna los elementos a un nuevo conjunto llamado `set3`.

In [101]:
set3 = set_1.difference(set2)

#### Identifica los elementos presentes en `set2` pero no en `set1`. Asigna los elementos a un nuevo conjunto llamado `set4`.

In [102]:
set4 = set2.difference(set_1)

#### Ahora, identifica los elementos compartidos entre `set1` y `set2`. Asigna los elementos a un nuevo conjunto llamado `set5`.

In [103]:
set5 = set4.union(set3)
print(set5)

{6, 7, 8, 9, 10, 14, 19, 21, 25, 27, 28, 29, 30, 31, 32, 39, 40, 41, 42, 44, 48, 50, 51, 52, 53, 56, 57, 61, 62, 66, 67, 68, 71, 72, 73, 74, 75, 78, 82, 83, 88, 89, 90, 91, 93, 94, 95, 97, 98, 99, 100}


`start, step, stop`

#### ¿Cuál es la relación entre los siguientes valores:

* len(set1)
* len(set2)
* len(set3)
* len(set4)
* len(set5)

Use una fórmula matemática para representar esa relación. Pruebe su fórmula con código Python. 

#### Elimina todos los elementos de la siguiente lista de `set1` si están presentes en el conjunto. Imprime los elementos restantes.

```
list_to_remove = [1, 9, 11, 19, 21, 29, 31, 39, 41, 49, 51, 59, 61, 69, 71, 79, 81, 89, 91, 99]
```

### Diccionarios

In [None]:

# Ejemplo con set
for i in {1,2,90,3,4,5}:
    print(i)

# [] Tiene orden y tiene índice
# {} No tiene orden ni índice
# () Tuplas tienen orden pero no índice


# {:} Diccionario, es un conjunto de pares clave:valor

1
2
3
4
5
90


In [40]:
{"Nombre":"Laura", "Edad":30}

{'Nombre': 'Laura', 'Edad': 30}

In [None]:
{"Nombre":"Laura", "Edad":30, "Nombre":"Carlos"}
#Se sobreescribe el nombre y se queda el último valor asignado

{'Nombre': 'Carlos', 'Edad': 30}

`clear` Elimina todos los elementos del diccionario

In [46]:
diccionario = {"Nombre":"Laura", "Edad":30, "Ciudad":"Madrid"}
print(diccionario)
diccionario.clear()
print(diccionario)

{'Nombre': 'Laura', 'Edad': 30, 'Ciudad': 'Madrid'}
{}


`items()` Devuelve una lista que contiene una tupla para cada par clave-valor

In [47]:
diccionario = {"Nombre":"Laura", "Edad":30, "Ciudad":"Madrid"}
print(diccionario.items())

dict_items([('Nombre', 'Laura'), ('Edad', 30), ('Ciudad', 'Madrid')])


`keys` Devuelve una lista de las claves en el diccionario

In [48]:
diccionario = {"Nombre":"Laura", "Edad":30, "Ciudad":"Madrid"}
print(diccionario.keys())

dict_keys(['Nombre', 'Edad', 'Ciudad'])


`values` Devuelve una lista de todos los valores del diccionario

In [49]:
diccionario = {"Nombre":"Laura", "Edad":30, "Ciudad":"Madrid"}
print(diccionario.values())

dict_values(['Laura', 30, 'Madrid'])


`pop()` Elimina el elemento con la clave especificada. Me devuelve el valor.

In [50]:
diccionario = {"Nombre":"Laura", "Edad":30, "Ciudad":"Madrid"}
print(diccionario)
diccionario.pop("Edad")
print(diccionario)

{'Nombre': 'Laura', 'Edad': 30, 'Ciudad': 'Madrid'}
{'Nombre': 'Laura', 'Ciudad': 'Madrid'}


`popitem` Elimina el último par clave-valor insertado

In [51]:
diccionario = {"Nombre":"Laura", "Edad":30, "Ciudad":"Madrid"}
print(diccionario)
diccionario.popitem()
print(diccionario)

{'Nombre': 'Laura', 'Edad': 30, 'Ciudad': 'Madrid'}
{'Nombre': 'Laura', 'Edad': 30}


`update` Actualiza el diccionario con los pares clave-valor especificados

In [52]:
diccionario = {"Nombre":"Laura", "Edad":30, "Ciudad":"Madrid"}
print(diccionario)
diccionario.update({"Edad":31, "Pais":"España"})
print(diccionario)

{'Nombre': 'Laura', 'Edad': 30, 'Ciudad': 'Madrid'}
{'Nombre': 'Laura', 'Edad': 31, 'Ciudad': 'Madrid', 'Pais': 'España'}


### 💪 Hands-on 

In [53]:
# Crear un diccionario de estudiantes
diccionario = {}

In [54]:
# Agregar un estudiante con sus calificaciones: María tiene ha sacado un 8 en Matemáticas y un 7 en Biología, Carlos tiene un 6 en Física y un 9 en Matemáticas, José un 3 en Inglés
diccionario.update({"María":{"Matemáticas":8, "Biología":7}, "Carlos":{"Física":6, "Matemáticas":9}, "José":{"Inglés":3}})
print(diccionario)

{'María': {'Matemáticas': 8, 'Biología': 7}, 'Carlos': {'Física': 6, 'Matemáticas': 9}, 'José': {'Inglés': 3}}


In [55]:
# Muestra todos los estudiantes y sus calificaciones: usando print & format
for estudiante, calificaciones in diccionario.items():
    print(f"Estudiante: {estudiante}")
    for asignatura, nota in calificaciones.items():
        print(f"  {asignatura}: {nota}")

Estudiante: María
  Matemáticas: 8
  Biología: 7
Estudiante: Carlos
  Física: 6
  Matemáticas: 9
Estudiante: José
  Inglés: 3


In [56]:
# Calcular el promedio de un estudiante
estudiante = "María"
calificaciones = diccionario[estudiante]
promedio = sum(calificaciones.values()) / len(calificaciones)
print(f"El promedio de {estudiante} es: {promedio}")

El promedio de María es: 7.5


In [57]:
# Actualizar la calificación de un estudiante: Carlos va a revisión y le bajan la nota de Física a un 5
diccionario["Carlos"]["Física"] = 5
print(diccionario)

{'María': {'Matemáticas': 8, 'Biología': 7}, 'Carlos': {'Física': 5, 'Matemáticas': 9}, 'José': {'Inglés': 3}}


In [58]:
# Calcula la media de Carlos
calificaciones_carlos = diccionario["Carlos"]
promedio_carlos = sum(calificaciones_carlos.values()) / len(calificaciones_carlos)
print(f"El promedio de Carlos es: {promedio_carlos}")

El promedio de Carlos es: 7.0


In [59]:
# Calcula la media la clase
total_notas = 0
num_notas = 0
for calificaciones in diccionario.values():
    total_notas += sum(calificaciones.values())
    num_notas += len(calificaciones)
promedio_clase = total_notas / num_notas
print(f"El promedio de la clase es: {promedio_clase}")


El promedio de la clase es: 6.4


In [60]:
# ¿Qué alumnos han aprobado?
for estudiante, calificaciones in diccionario.items():
    promedio = sum(calificaciones.values()) / len(calificaciones)
    if promedio >= 5:
        print(f"{estudiante} ha aprobado con un promedio de {promedio}")
    else:
        print(f"{estudiante} no ha aprobado con un promedio de {promedio}")

María ha aprobado con un promedio de 7.5
Carlos ha aprobado con un promedio de 7.0
José no ha aprobado con un promedio de 3.0


## Resumen
Ahora te toca a ti, ¿qué hemos aprendido hoy?