![imagen](../../imagenes/python.jpg)

# Python Colecciones

#### Autor: [Daniel Ortiz López](https://www.linkedin.com/in/daniel-ortiz-l%C3%B3pez/)

Las colecciones son una manera de agrupar varios elementos. En otros notebooks vimos cómo funcionan las listas, que es la colección más usada, pero se trata solo de la punta del iceberg. En Python tenemos varias manera de almacenar conjuntos de datos, dependiendo del tipo de dato, finalidad, tipo de acceso y rendimiento.

1. [Listas](#1.-Listas)
2. [Tuplas](#2.-Tuplas)
3. [Diccionarios](#3.-Diccionarios)
4. [Sets](#4.-Sets)
5. [Intersecciones](#5.-Intersecciones)
6. [Conversiones entre colecciones](#6.-Conversiones-entre-colecciones)
7. [Resumen](#7.-Resumen)

## 1. Listas
Conocemos bastante ya de las listas. Veamos un repaso de lo que podemos hacer con ellas, así como algunas funcionalidades nuevas

In [13]:
# Listas de números, strings, booleanos, con elementos repetidos, listas anidadas...
nums = [6, 2, 8, 3, 4, 5, 5]
months = ["Enero", "Febrero", "Marzo"]
mix = [5, 7, "Abril", True, None, ["Blanco", "Negro"]]

# Longitud de la lista
print(len(nums))

# Indexación
print(months[0])
print(months[len(months)-1]) # -1 porque len = 3 y el orden de los elementos es [0,1,2]

7
Enero
Marzo


### Acceso
Entre corchetes introducimos el indice del elemento al que queremos acceder

In [11]:
months = ["Enero", "Febrero", "Marzo"]
print(months)
print(months[0])
print(months[1])
print(months[2])

print("\n")

# Si lo que queremos es acceder al ultimo, o penultimo
print(months[-1])
print(months[-2])

['Enero', 'Febrero', 'Marzo']
Enero
Febrero
Marzo


Marzo
Febrero


Si planteamos el problema al revés. Tenemos los valores de la lista y lo que queremos es obtener el índice de eso valores dentro de la lista

In [23]:
months = ["Enero", "Febrero", "Marzo", "Marzo"]
print(months)

months.index("Marzo") # Devuelve el indice de la primera ocurrencia

['Enero', 'Febrero', 'Marzo', 'Marzo']


2

**Slicing**: usamos slicing para acceder a varios elementos seguidos de la lista

In [32]:
degrees = [22, 34, 15, 26, 18, 22]
print(degrees[2:4])

[15, 26]


### Modificar elementos
Las listas son mutables, por lo que podremos modificarlas

In [5]:
# Accediendo mediante el indice
months = ["Enero", "Febrero", "Marzo"]
print(months)

months[2] = "Abril"
print(months)

['Enero', 'Febrero', 'Marzo']
['Enero', 'Febrero', 'Abril']


### Añadir elementos
Se añade al final de la lista si usamos `append`, o si queremos en un lugar concreto, mediante `insert`

In [12]:
# Con append lo añadimos al final de la lista
motorcycles = ['honda', 'yamaha', 'suzuki']
print(motorcycles)

motorcycles.append('ducati')
print(motorcycles)

# Con insert lo añadimos donde queramos
motorcycles.insert(2, 'kawasaki')
print(motorcycles)

['honda', 'yamaha', 'suzuki']
['honda', 'yamaha', 'suzuki', 'ducati']
['honda', 'yamaha', 'kawasaki', 'suzuki', 'ducati']


In [8]:
# Es muy comun crear una lista vacia, y a lo largo del programa, ir añadiendo elementos
motorcycles = []

motorcycles.append('honda')
motorcycles.append('yamaha')
motorcycles.append('suzuki')
print(motorcycles)

['honda', 'yamaha', 'suzuki']


### Eliminar elementos
Para eliminar elementos se usar `remove`. Si no existe, da error, así que cuidado con esta sentencia.

En ocasiones resulta útil quedarnos con el elemento eliminado. Para ello usamos `pop()`, que elimina el elemento que le inquemos, y además devuelve ese elemento por lo que podremos guardarlo en una variable para usarlo después.

In [16]:
cars = ["VW", "Seat", "BMW", "VW"]
print(cars)

cars.remove("VW") # Elimina el primer elemento únicamente
print(cars)

['VW', 'Seat', 'BMW', 'VW']
['Seat', 'BMW', 'VW']


In [24]:
# Eliminar elementos por indice, y guardar ese valor en una variable
cars = ["VW", "Seat", "BMW", "VW"]
print(cars)

seat = cars.pop(1)
print(cars)
print(seat)

# Si no podemos argumentos, devuelve el ultimo elemento
ult = cars.pop()
print(cars)
print(ult)

['VW', 'Seat', 'BMW', 'VW']
['VW', 'BMW', 'VW']
Seat
['VW', 'BMW']
VW


<table align="left">
 <tr><td width="80"><img src="../../imagenes/error.png" style="width:auto;height:auto"></td>
     <td style="text-align:left">
         <h3>ERRORES remove</h3>
         
 </td></tr>
</table>

In [18]:
cars = ["VW", "Seat", "BMW", "VW"]
print(cars)

cars.remove("Audi")

['VW', 'Seat', 'BMW', 'VW']


ValueError: list.remove(x): x not in list

### Métodos: ordenar, tamaño, invertir orden, ocurrencia
En este apartado veremos los métodos más útiles, pero podrás consultar el resto en [este enlace](https://www.w3schools.com/python/python_ref_list.asp)

In [30]:
degrees = [22, 34, 15, 26, 18, 22]
print(degrees)

# Ordenar
degrees.sort()
print(degrees)

# Tamaño de la lista
print(len(degrees))

# Invertir el orden
degrees.reverse()
print(degrees)

# Ocurrencia de un valor
print(degrees.count(22))

[22, 34, 15, 26, 18, 22]
[15, 18, 22, 22, 26, 34]
6
[34, 26, 22, 22, 18, 15]
2


<table align="left">
 <tr><td width="80"><img src="../../imagenes/error.png" style="width:auto;height:auto"></td>
     <td style="text-align:left">
         <h3>ERRORES indice</h3>
         
 </td></tr>
</table>

Mucho cuidado cuando accedemos a los elementos de la lista. Es un error muy habitual acceder a un índice que no existe en la lista.

Si estamos accediendo al ultimo elemento, en vez de poner el numero de su indice, poner mejor `-1`, y asi evitamos errores

In [50]:
degrees = [22, 34, 15, 26, 18, 22]
print(degrees)
print(degrees[-1])

degrees[6]

[22, 34, 15, 26, 18, 22]
22


IndexError: list index out of range

Si tenemos este tipo de errores y no sabemos resolverlos, lo mejor es imprimirse elemento a elemento, además de la longitud de la lista.

<table align="left">
 <tr><td width="80"><img src="../../imagenes/ejercicio.png" style="width:auto;height:auto"></td>
     <td style="text-align:left">
         <h3>Ejercicio de listas</h3>

Piensa en al menos 3 personas que invitarías a cenar
<ol>
    <li>Utiliza la lista de invitados para imprimir cada uno por pantalla, mediante un bucle</li>
    <li>Ordena alfabeticamente tu lista de invitados</li>
    <li>¿Quién es el primer primer invitado de la lista?</li>
    <li>Te llama uno de ellos a última hora que no va a poder asistir. Eliminalo de la lista</li>
    <li>Por suerte te ha llamado un amigo que no iba a asistir y al final si puede. Añadelo a mitad de la lista</li>
</ol>
         
 </td></tr>
</table>

## 2. Tuplas
Muy similares a las listas. Si en Notebooks anteriores definíamos a las listas como ordenadas y mutables, las tuplas son ordenadas e inmutables.

* **Inmutables**: una vez creada la tupla con sus elementos iniciales, no se puede modificar
* **Ordenadas**: podemos acceder a sus elementos a través del indice y reordenar la tupla según queramos

Las tuplas se suelen usar para pequeñas colecciones de datos que no van a cambiar a lo largo del programa, como es el caso de las constantes.

Si las listas se construían mediante corchetes `[]`, las tuplas lo hacen con los paréntesis `()`

In [33]:
primera_tupla = (3, "text")

Los paréntesis ya se usan para reordenar operaciones `5 * (3 + 4)`, por lo que hay que añadir una coma cuando definamos una tupla con un único elemento

In [35]:
tupla_uno = (1,)
print(type(tupla_uno))

<class 'tuple'>


In [44]:
# Anidacion de tuplas
tupla_anid = (1, 2, 3, ("A", "B", "C"))
print(tupla_anid)

# El acceso es como en las listas
print(tupla_anid[0])

# Tambien son elementos iterables
for i in tupla_anid:
    print(i)
    
# El slicing también funciona igual
print(tupla_anid[0:2])

# Longitud de la tupla
print(len(tupla_anid))

(1, 2, 3, ('A', 'B', 'C'))
1
1
2
3
('A', 'B', 'C')
(1, 2)
4


<table align="left">
 <tr><td width="80"><img src="../../imagenes/error.png" style="width:auto;height:auto"></td>
     <td style="text-align:left">
         <h3>ERRORES tuplas</h3>
         
 </td></tr>
</table>

Cuidado que las tuplas son inmutables, y una vez creadas no las podrás modificar después

In [42]:
tupla_error = (1,2,3,4,5,6)
tupla_error[3] = 10

TypeError: 'tuple' object does not support item assignment

In [45]:
# Si queremos añadir elementos, podemos meterlos en otra tupla y sumarlas para que se concatenen
tupla_1 = (1, 2, 3)
tupla_2 = (4, 5, 6)

print(tupla_1 + tupla_2)

(1, 2, 3, 4, 5, 6)


### Listas y tuplas
Podemos combinar listas y tuplas que no tendremos ningún problema, siempre y cuando respetemos las propiedades de cada tipo de dato.

In [48]:
frutas = ["Manzanas", ("Naranjas", "Limones"), "Fresas"]
print(frutas)
print(frutas[1])
print(frutas[1][1])

['Manzanas', ('Naranjas', 'Limones'), 'Fresas']
('Naranjas', 'Limones')
Limones


## 3. Diccionarios
En este tipo de colecciones no solo podemos agrupar datos, sino que tenemos la posibilidad de establecer una relación entre los mismos, con la forma clave: valor.

La sintaxis  es mediante llaves `{}`

> nombre_diccionario = {clave: valor}

Si veíamos que las listas son elementos mutables y y ordenadas, y las tuplas inmutables y ordenadas, los diccionarios son:

* **Mutables**: podemos modificar sus elementos
* **Desordenado**: la potencia de acceso de los diccionarios es su formato clave-valor, no su orden. Aun así, el dicionario conserva el orden de los elemento según los vamos insertando.

Vamos a declarar un diccionario en el que definiremos elementos de un coche

In [66]:
coche = {"color": "Gris",
        "marca": "VW",
        "peso": 1500,
        "Cambio automatico": True}

print(coche)

{'color': 'Gris', 'marca': 'VW', 'peso': 1500, 'Cambio automatico': True}


Se puede almacenar todo tipo de datos: numero, cadena, booleano, listas, tuplas, diccionarios...

A la hora de declarar el diccionario, lo podemos hacer en una sola linea `coche = {"color"="Gris", "marca"...}`, aunque se recomienda por sencillez a la hora de leer el código, realizar esta acción en varias líneas. Si escribimos el primer elemento y presionamos enter, Jupyter introduce automáticamente la tabulación.

### Acceso, modificación, añadir, eliminar

In [68]:
# Acceso
print(coche["color"])
print(coche["Cambio automatico"])

# Modificar elementos
coche["color"] = "Blanco"
print(coche["color"])

# Añadir elementos
coche["puertas"] = 4
print(coche)

# Eliminar elementos
del coche["puertas"]
print(coche)

# Obtener las claves
print(coche.keys())

# También los valores
print(coche.values())

Blanco
True
Blanco
{'color': 'Blanco', 'marca': 'VW', 'peso': 1500, 'Cambio automatico': True, 'puertas': 4}
{'color': 'Blanco', 'marca': 'VW', 'peso': 1500, 'Cambio automatico': True}
dict_keys(['color', 'marca', 'peso', 'Cambio automatico'])
dict_values(['Blanco', 'VW', 1500, True])


Para más detalle de los métodos de los diccionario puedes [consultar la documentación](https://www.w3schools.com/python/python_ref_dictionary.asp)

In [57]:
# Podemos empezar tambien mediante un diccionario vacío
tienda = {}
tienda["Direccion"] = "Avenida de ..."
tienda["Tamaño"] = 250

print(tienda)

{'Direccion': 'Avenida de ...', 'Tamaño': 250}


<table align="left">
 <tr><td width="80"><img src="../../imagenes/error.png" style="width:auto;height:auto"></td>
     <td style="text-align:left">
         <h3>ERRORES en diccionarios</h3>
         
 </td></tr>
</table>

Si hay una clave que no existe en el diccionario, saltará un error.

En este caso, el error es bastante intuitivo: `KeyError`, no encuentra la clave

In [59]:
coche = {"color": "Gris",
        "marca": "VW"
        }

coche["peso"]

KeyError: 'peso'

**¿Cómo solventar esto?** Sirmpre tienes la opción de usar el bloque `try/except`, pero en este caso, los diccionarios tienen una solución más elegante: `get(clave, valor si no existe)`

In [60]:
coche = {"color": "Gris",
        "marca": "VW"
        }

coche_peso = coche.get('peso', 'No encuentra peso')
print(coche_peso)

No encuentra peso


### Iterar
Que el diccionario no esté ordenado, no quiere decir que no podamos interar sus elementos, ya que también es un **interable**, como los son las listas o las tuplas.

In [64]:
coche = {"color": "Gris",
        "marca": "VW"
        }

for i in coche: # Esta recorriendo las claves
    print(i) # Imprimimos la clave
    print(coche[i]) # Imprimimos el valor
    
# Otra menera de recorrer los elementos
for clave, valor in coche.items():
    print(clave, valor)

color
Gris
marca
VW
color Gris
marca VW
