![Lumber](images/data_images/lumber.jpg)

Photo by [Matthaeus](https://unsplash.com/photos/GRXAclOGeOQ?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText) on [Unsplash](https://unsplash.com/search/photos/structure?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText)

# Motivación

Python, como otros lenguajes de programación, utiliza los **tipos de datos** para indicar cómo va a representar los datos, lo que condiciona los valores que puede tomar y qué operaciones podremos realizar sobre ellos. En este apartado veremos los tipos de datos simples y también trabajaremos con otros conceptos básicos, como almacenar datos usando **variables**, cómo mostrar su contenido, operaciones aritméticas básicas, tomar decisiones basadas en estos valores, etc.

# Guión

1. Introducción a tipo de datos y variables
2. Cadenas de texto
3. Números (enteros, decimales, complejos...)
4. Booleanos
5. Condicionales

# Listas
---

https://pythonista.io/cursos/py101/tipos-de-datos-basicos-y-operadores

# Definición

Una lista es una colección ordenada (**secuencia**) de elementos, a priori relacionados conceptualmente, pero no necesariamente de la misma naturaleza (tipo).

## Sintaxis

Las listas en Python se definen utilizando corchetes `[` y `]` y separando sus elementos por comas `,`

## Ejemplo

Supongamos que queremos guardar las 3 series que más nos gustan:

In [382]:
netflix_favs = ['The Umbrella Academy', 'Stranger Things', 'Black Mirror']

Dado que las listas son colecciones de objetos, es una buena práctica darles un **nombre plural**, que represente la generalidad de los elementos que almacena.

> [PEP 8](https://www.python.org/dev/peps/pep-0008/) $\Rightarrow$ Dejar un espacio después de cada coma.

# Accediendo a cada elemento de una lista

Cada elemento en una lista ocupa una posición determinada. Python se dice que es de **índice-0** de tal forma que el primer elemento de una secuencia (véase *strings*) empieza en 0.

Para acceder al elemento que ocupa la posición $i$ tendremos que usar corchetes y la variable $i$, que se denomina el **índice** de la lista.

In [383]:
netflix_favs

['The Umbrella Academy', 'Stranger Things', 'Black Mirror']

![List anatomy](images/data_structures/list_anatomy.png)

![List anatomy](images/data_structures/list_anatomy_pa.png)

In [384]:
netflix_favs[0]

'The Umbrella Academy'

In [385]:
netflix_favs[1]

'Stranger Things'

In [386]:
netflix_favs[2]

'Black Mirror'

![List anatomy](images/data_structures/list_anatomy_na.png)

In [387]:
netflix_favs[-1]

'Black Mirror'

In [388]:
netflix_favs[-2]

'Stranger Things'

In [389]:
netflix_favs[-3]

'The Umbrella Academy'

# `IndexError`

Si tratamos de acceder a un elemento que no existe en la lista, obtendremos un error (excepción) explicando que el índice está fuera de rango:

In [391]:
netflix_favs[3]

IndexError: list index out of range

![Error](images/common/error.gif)

# Accediendo a todos los elementos de una lista

Si quisiéramos imprimir nuestras series favoritas, no habría demasiado problema:

In [392]:
print(netflix_favs[0])

The Umbrella Academy


In [393]:
print(netflix_favs[1])

Stranger Things


In [394]:
print(netflix_favs[2])

Black Mirror


Pero ahora imaginemos que, después de varios años de uso de Netflix, ya tenemos cientos de series almacenadas en nuestro *Netflix-favs*. No tendría ningún sentido estar escribiendo cientos de *print* para mostrarlas.

Para solucionar esto existen las **sentencias iterativas**, y en concreto, el **bucle for**:

In [395]:
for serie in netflix_favs:
    print(serie)

The Umbrella Academy
Stranger Things
Black Mirror


- La palabra clave `for` indica que se va a empezar un bucle.
- La variable *serie* es una variable temporal que va tomando los elementos de la lista en cada *iteración* del bucle.
    - En la primera iteración el valor de la variable *serie* es `'The Umbrella Academy'`
    - En la segunda iteración el valor de la variable *serie* es `'Stranger Things'`.
    - En la tercera iteración el valor de la variable *serie* es `'Black Mirror'`.
- Después de esto no hay más elementos en `netflix_favs` y por lo tanto, el bucle termina.

# Haciendo más cosas en cada iteración

No estamos limitados a imprimir únicamente el valor de una variable dentro de un bucle. Podemos hacer mucho más que eso:

In [396]:
for serie in netflix_favs:
    print(f'Me gusta --> {serie}')

Me gusta --> The Umbrella Academy
Me gusta --> Stranger Things
Me gusta --> Black Mirror


# Controlando el contexto del bucle

Python usa la **indentación** como mecanismo para indicar los bloques que están dentro de otros:

In [397]:
print('Aquí van mis series favoritas de Netflix:')
for serie in netflix_favs:
    print('Me gusta:')
    print(serie)
print('Y eso es todo amigxs!')

Aquí van mis series favoritas de Netflix:
Me gusta:
The Umbrella Academy
Me gusta:
Stranger Things
Me gusta:
Black Mirror
Y eso es todo amigxs!


> [PEP 8](https://www.python.org/dev/peps/pep-0008/) $\Rightarrow$ Se recomienda usar **1 tabulador $\approx$ 4 espacios** para indentar los bloques de código.

# El bucle `while`

En Python sólo existen dos formas de iterar, mediante un bucle `for` o mediante un bucle `while`. Este último bucle no recorre una colección sino que establece una condición de salida.

Supongamos que queremos recorrer nuestro *Netflix-favs* e imprimir las series, pero parando cuando la longitud del título de la serie sea menor o igual que 14:

In [398]:
i = 0
while len(netflix_favs[i]) > 14:
    print(netflix_favs[i])
    i += 1

The Umbrella Academy
Stranger Things


# Enumerando una lista

Al iterar sobre una lista es posible querer conocer el índice del elemento actual. La función `enumerate` nos proporciona precisamente esto:

In [202]:
print('Aquí van mis series favoritas de Netflix por orden de preferencia:')
for i, serie in enumerate(netflix_favs):
    position = i + 1
    print(f'{position}: {serie}')

Aquí van mis series favoritas de Netflix por orden de preferencia:
1: The Umbrella Academy
2: Stranger Things
3: Black Mirror


- La variable `i` toma los índices ($0, 1, 2, \ldots$), mientras que la variable `serie` toma los elementos de la lista.
- Como siempre, el índice empieza en 0. Esto hay que tenerlo en cuenta.

# Controlando el flujo del bucle

Python permite usar dos palabras clave dentro de un bucle para controlar su flujo: **break** y **continue**.

## `break`

Se usa para romper inmediatamente el bucle y salir:

![break](images/data_structures/break.png)

## `continue`

Se usa para saltar la iteración actual y continuar a la siguiente:

![continue](images/data_structures/continue.png)

# Operaciones comunes en listas

## Modificando elementos de una lista

Supongamos que tus gustos han cambiado, y que ahora te gusta más *The Crown* que *The Umbrella Academy*. Podemos modificar este elemento de la lista de la siguiente forma:

In [203]:
netflix_favs[0] = 'The Crown'
netflix_favs

['The Crown', 'Stranger Things', 'Black Mirror']

> Para modificar un elemento de una lista debemos acceder mediante su índice.

# Encontrando un elemento en una lista

Sé cuáles son mis series favoritas, pero no recuerdo exactamente qué posición ocupa *Black Mirror* dentro de mi *Netflix-favs*. Puedo encontrar un elemento de una lista de la siguiente forma:

In [204]:
netflix_favs

['The Crown', 'Stranger Things', 'Black Mirror']

In [205]:
netflix_favs.index('Black Mirror')

2

> Como siempre, recordar que Python es **índice-0**, con lo cual *Black Mirror* ocuparía la tercera posición ($2 + 1$)

# `ValueError`

Un momento, yo recuerdo que en algún momento me gustó *The Umbrella Academy*, vamos a buscarla en nuestro *Netflix-favs*:

In [206]:
netflix_favs.index('The Umbrella Academy')

ValueError: 'The Umbrella Academy' is not in list

Cuando el elemento que buscamos no existe en nuestra lista, Python nos devuelve una excepción de tipo `ValueError`.
![Error](images/common/error.gif)

# Comprobando si un elemento está en una lista

Supongamos que quiero saber si *Mindhunter* está dentro de mis series favoritas:

In [207]:
netflix_favs

['The Crown', 'Stranger Things', 'Black Mirror']

In [208]:
'Mindhunter' in netflix_favs

False

In [209]:
'Stranger Things' in netflix_favs

True

Utilizando el operador `in` podemos comprobar si un elemento pertenece a una lista.

# Añadiendo elementos al final de una lista

Acabo de descubrir *House of Cards* y me parece una serie de culto. No cabe duda de que voy a añadirla a mis series favoritas de Netflix:

In [210]:
netflix_favs.append('House of Cards')
netflix_favs

['The Crown', 'Stranger Things', 'Black Mirror', 'House of Cards']

El método `append` nos permite añadir elementos al final de una lista.

# Insertando elementos en una lista

Supongamos que he visto recientemente *Jessica Jones* y me ha gustado mucho. De hecho, la quiero incluir en mi *Netflix-favs*.

Me gusta más que *Stranger Things* pero menos que *The Crown*. Así que la voy a insertar en medio:

In [211]:
netflix_favs

['The Crown', 'Stranger Things', 'Black Mirror', 'House of Cards']

In [212]:
netflix_favs.insert(1, 'Jessica Jones')
netflix_favs

['The Crown',
 'Jessica Jones',
 'Stranger Things',
 'Black Mirror',
 'House of Cards']

Podemos usar el método `insert` indicando la posición (índice), a la izquierda de la cual se insertará el elemento que queramos.

# Creando una lista vacía

Hasta ahora hemos partido de una lista creada desde el principio con elementos. Pero volvamos al pasado, a cuando empezamos a ver series en Netflix. En ese momento no teníamos aún ninguna serie favorita. Por lo tanto:

In [213]:
# Crea una lista vacía de nuestras series favoritas en Netflix
netflix_favs = []

netflix_favs.append('Stranger Things')
netflix_favs.append('House of Cards')
netflix_favs.append('Jessica Jones')

for serie in netflix_favs:
    print(f'Me gusta: {serie}')

Me gusta: Stranger Things
Me gusta: House of Cards
Me gusta: Jessica Jones


# Ordenando una lista

Podemos ordenar una lista alfabéticamente, en cualquier orden:

In [214]:
netflix_favs

['Stranger Things', 'House of Cards', 'Jessica Jones']

In [215]:
for serie in sorted(netflix_favs):
    print(serie)

House of Cards
Jessica Jones
Stranger Things


In [216]:
for serie in sorted(netflix_favs, reverse=True):
    print(serie)

Stranger Things
Jessica Jones
House of Cards


In [217]:
netflix_favs

['Stranger Things', 'House of Cards', 'Jessica Jones']

## Ordenando con modificación de la lista

Si utilizamos el método `sort()` estaremos modificando el orden de la lista original:

In [218]:
netflix_favs

['Stranger Things', 'House of Cards', 'Jessica Jones']

In [219]:
netflix_favs.sort()

In [220]:
netflix_favs

['House of Cards', 'Jessica Jones', 'Stranger Things']

# Invirtiendo los elementos de una lista

Supongamos que queremos modificar nuestro orden de preferencia de las series que más nos gustan. Podemos hacerlo de la siguiente manera:

In [221]:
netflix_favs

['House of Cards', 'Jessica Jones', 'Stranger Things']

In [222]:
netflix_favs.reverse()

In [223]:
netflix_favs

['Stranger Things', 'Jessica Jones', 'House of Cards']

> Nótese que `reverse()` es un método con *cambios permanentes* que modifica el orden original de la lista.

# Encontrando la longitud de una lista

Al principio es sencillo contabilizar cuántas series favoritas tenemos en nuestro *Netflix-favs*, pero a medida que crece la lista se hace más complicado. Podemos obtener la longitud de una lista de manera sencilla:

In [224]:
netflix_favs

['Stranger Things', 'Jessica Jones', 'House of Cards']

In [225]:
len(netflix_favs)

3

> La función `len` devuelve un **número entero**.

# Borrando elementos de una lista

## Borrando elementos por posición

Supongamos que en nuestro *Netflix-favs* nos ha dejado de gustar nuestra serie favorita. Eso implica borrar el primer elemento de la lista:

In [226]:
netflix_favs

['Stranger Things', 'Jessica Jones', 'House of Cards']

In [227]:
del(netflix_favs[0])

In [228]:
netflix_favs

['Jessica Jones', 'House of Cards']

## Borrando elementos por valor

Supongamos que, en esta racha negativa, deja también de gustarnos *House of Cards*. Podemos borrar esta serie usando su nombre:

In [229]:
netflix_favs

['Jessica Jones', 'House of Cards']

In [230]:
netflix_favs.remove('House of Cards')

In [231]:
netflix_favs

['Jessica Jones']

> Si utlizamos el método `remove` sólo se borrará el primer elemento con el valor indicado.

## Extrayendo elementos de una lista

Supongamos que queremos ver la serie que menos nos gusta de las que están en nuestro *Netflix-favs*, pero una vez vista queremos quitarla de dicha lista.

Hay una forma en Python de extraer un elemento de una lista y devolverlo a la vez:

In [232]:
netflix_favs = ['You', 'Glow', 'The Haunting', 'Narcos']

In [233]:
# devuelve el último elemento de la lista y lo extrae
netflix_favs.pop()

'Narcos'

In [234]:
netflix_favs

['You', 'Glow', 'The Haunting']

No estamos obligados a extraer el último elemento. Podemos extraer aquel elemento que nos interese pasando al método `pop` el índice que corresponda:

In [235]:
netflix_favs

['You', 'Glow', 'The Haunting']

In [236]:
# devuelve el elemento que ocupa la posición 1 (ojo 0-index)
netflix_favs.pop(1)

'Glow'

In [237]:
netflix_favs

['You', 'The Haunting']

# Troceado de listas

Dado que las listas son colecciones (secuencias) de elementos, podemos seleccionar *"trozos"* de esta colección. Para definir estos trozos hay que especificar el índice de comienzo y el índice de finalización.

Supongamos que queremos saber las 3 series favoritas de nuestro *Netflix-favs*:

In [238]:
netflix_favs = ['Orange is the New Black', 'You', 'Dark', 'Glow', 'The Haunting', 'Narcos']

- El índice de comienzo (*inf*) será el 0.
- El índice de finalización (*sup*) será el 3, ya que en el troceado llega a (*sup* - 1)

In [239]:
netflix_favs[0:3]

['Orange is the New Black', 'You', 'Dark']

In [240]:
# si omitimos el índice de comienzo éste tomará el valor 0
netflix_favs[:3]

['Orange is the New Black', 'You', 'Dark']

Supongamos que que queremos mostrar las últimas 3 series de nuestro *Netflix-favs*:

In [241]:
netflix_favs

['Orange is the New Black', 'You', 'Dark', 'Glow', 'The Haunting', 'Narcos']

In [242]:
netflix_favs[3:6]

['Glow', 'The Haunting', 'Narcos']

Pero es posible que no sepamos cuántas series tenemos en nuestro en nuestra lista, con lo que habrá que buscar alternativas a la sentencia anterior:

In [243]:
# si omitimos el índice de finalización éste tomará el último índice de la lista
netflix_favs[-3:]

['Glow', 'The Haunting', 'Narcos']

# Copiando una lista

Supongamos que queremos hacer una copia de seguridad de nuestras series favoritas, de tal forma que si borramos algo por accidente, mantengamos el respaldo intacto.

Se puede usar la notación de troceado para hacer copias de una lista:

In [244]:
netflix_favs

['Orange is the New Black', 'You', 'Dark', 'Glow', 'The Haunting', 'Narcos']

In [245]:
# al omitir comienzo y finalización, toma los valores por defecto de primer y último índice
backup_netflix_favs = netflix_favs[:]

In [246]:
del(backup_netflix_favs[0])
backup_netflix_favs

['You', 'Dark', 'Glow', 'The Haunting', 'Narcos']

In [247]:
netflix_favs

['Orange is the New Black', 'You', 'Dark', 'Glow', 'The Haunting', 'Narcos']

# Listas numéricas

Las listas numéricas no tienen ninguna diferencia con las listas de cadenas de texto que hemos visto hasta ahora, más allá del tipo de los elementos que almacenan.

Pero existen ciertas funciones de apoyo que facilitan el manejo de listas numéricas.

Supongamos que queremos crear una lista con las posibles **puntuaciones** que asignar a cada serie. En principio podemos pensar en 5 valores. A priori no parece demasiado complicado hacer esta lista de forma manual

In [260]:
ranking_values = [1, 2, 3, 4, 5]

¿Qué pasaría si en vez de 5 valores son 100, 200, o 1 millón?. Hacerlo "a mano" sería agotador y muy ineficiente. Aquí entra en juego la función `range` que devuelve un *generador* de valores numéricos en el que es posible indicar *límite inferior*, *límite superior* e incluso el *paso*.

## `range`

Supongamos que queremos ampliar las posibles puntuaciones del 1 al 100:

In [261]:
for ranking_value in range(1, 101):
    print(ranking_value, end=',')

1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99,100,

> `range(a, b)` genera una secuencia de valores enteros consecutivos en el intervalo abierto $[a, b)$

## Dando pasos

Supongamos ahora que, para que no sea tan lioso, queremos que las puntuaciones de las series vayan de 10 en 10. Para ello podemos usar un tercer parámetro en la función `range` que indica el *paso* o incremento de la variable en cada iteración del bucle:

In [262]:
for raking_value in range(0, 101, 10):
    print(raking_value)

0
10
20
30
40
50
60
70
80
90
100


## Explicitando listas

Cabe la posibilidad de querer *almacenar una lista* con los valores numéricos a partir del generador. Para ello basta con hacer lo siguiente:

In [263]:
ranking_values = list(range(0, 101, 10))

In [264]:
ranking_values

[0, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100]

# Operaciones básicas con listas numéricas

Existen tres funciones que se pueden usar fácilmente con listas numéricas: *mínimo*, *máximo* y *suma*. Supongamos una lista de rankings asignados a series de Netflix:

In [265]:
rankings = [47, 78, 24, 97, 35, 44]

In [266]:
min(rankings)

24

In [267]:
max(rankings)

97

In [268]:
sum(rankings)

325

# Convirtiendo cadenas de texto en listas

Una operación bastante común es convertir una cadena de texto en una lista, o viceversa. Este hecho se justifica, entre otros motivos, porque la *entrada de usuario* suele ser en forma de cadenas de texto, y necesitas un tratamiento posterior para procesarlas.

Supongamos que un usuario nos da sus series favoritas en forma de cadena de texto separadas por comas. Lo que queremos es convertir esta cadena de texto en una lista:

In [366]:
favourite_series = 'The Crown,Mad Men,Black Mirror,Inmortals,Noche de lobos,Las chicas del cable'

El método que nos permite *"cortar"* o *"trozear"* la cadena de texto es `split` al que tenemos que pasarle el carácter (o caracteres) que se usará como patrón:

In [367]:
favourite_series.split(',')

['The Crown',
 'Mad Men',
 'Black Mirror',
 'Inmortals',
 'Noche de lobos',
 'Las chicas del cable']

# Convirtiendo listas en cadenas de texto

La operación inversa a la que acabamos de ver es convertir una lista en una cadena de texto.

Supongamos que partimos de la lista de series favoritas de Netflix y queremos transformarla en una cadena texto:

In [368]:
favourite_series = ['The Crown',
                    'Mad Men',
                    'Black Mirror',
                    'Inmortals',
                    'Noche de lobos',
                    'Las chicas del cable'
                   ]

El método que nos permite realizar esta operación es `join`, y como su nombre indica permite unir cada uno de los elementos de la lista con un carácter (o caracteres) que especifiquemos:

In [369]:
','.join(favourite_series)

'The Crown,Mad Men,Black Mirror,Inmortals,Noche de lobos,Las chicas del cable'

## `TypeError`

Supongamos que en vez de tener una lista con nombres de series lo que tenemos es una lista con el número de temporadas de cada serie:

In [1]:
total_seasons = [3, 4, 1, 1, 7, 5, 2, 2]

In [2]:
','.join(total_seasons)

TypeError: sequence item 0: expected str instance, int found

![Error](images/common/error.gif)

Este error es muy común y se produce porque, para poder usar `join`, todos los elementos de la lista tienen que ser cadenas de texto. Habría que transformar los elementos de la lista a cadenas de texto:

In [3]:
total_seasons_as_str = []
for season in total_seasons:
    total_seasons_as_str.append(str(season))

Y ahora sí que ya podríamos usar el método `join`:

In [4]:
','.join(total_seasons_as_str)

'3,4,1,1,7,5,2,2'

# Listas por comprensión

Las listas por comprensión son una forma "lógica" de generar listas. Pongo "lógica" entre paréntesis porque depende del enfoque que se le de puede parecer más o menos complicado. El concepto de listas por comprensión proviene de la definición de los conjuntos por comprensión, en la que se definen las "características" que debe tener un conjunto de elementos.

![Listas por comprensión](images/data_structures/list_comprehension.png)

Normalmente las listas por comprensión ocupan una única línea y permiten generar listas de forma concisa. No es menos cierto que las listas por comprensión pueden ser todo lo complejas que se quieran, pero en la mayoría de los casos se suelen simplificar.

## Comprensiones numéricas

Supongamos que queremos generar una lista con todos los años en los que se han estrenado películas en Netflix. Sabiendo que la creación de Netflix fue un 29 de agosto de 1997, podríamos hacer lo siguiente:

In [270]:
premiere_years = []
for year in range(1997, 2020):
    premiere_years.append(year)

Mostramos el contenido de nuestra lista:

In [271]:
for year in premiere_years:
    print(year, end=',')

1997,1998,1999,2000,2001,2002,2003,2004,2005,2006,2007,2008,2009,2010,2011,2012,2013,2014,2015,2016,2017,2018,2019,

La forma de hacer lo mismo con *listas por comprensión* es la siguiente:

In [272]:
premiere_years = [year for year in range(1997, 2020)]

Mostramos el contenido de nuestra lista:

In [273]:
for year in premiere_years:
    print(year, end=',')

1997,1998,1999,2000,2001,2002,2003,2004,2005,2006,2007,2008,2009,2010,2011,2012,2013,2014,2015,2016,2017,2018,2019,

A priori parece que tampoco hemos ganado tanto. Pero imaginemos ahora que queremos filtrar y sacar únicamente los años de estreno **pares**.

En la versión convencional de bucles se haría de la siguiente manera:

In [274]:
premiere_years = []
for year in range(1997, 2020):
    if year % 2 == 0:
        premiere_years.append(year)

Mostramos el contenido de nuestra lista:

In [275]:
for year in premiere_years:
    print(year, end=',')

1998,2000,2002,2004,2006,2008,2010,2012,2014,2016,2018,

Ahora vamos a crear la versión de listas por comprensión donde se puede apreciar la simplificación de código que se produce:

In [278]:
premiere_years = [year for year in range(1997, 2020) if year % 2 == 0]

Mostramos el contenido de nuestra lista:

In [279]:
for year in premiere_years:
    print(year, end=',')

1998,2000,2002,2004,2006,2008,2010,2012,2014,2016,2018,

## Comprensiones no numéricas

Supongamos que, dado nuestro *Netflix-favs*, queremos generar una nueva serie sólo con las series que tienen menos de 5 caracteres y además pasarlas a mayúsculas:

In [282]:
netflix_favs

['Orange is the New Black', 'You', 'Dark', 'Glow', 'The Haunting', 'Narcos']

In [284]:
brief_netflix_favs = [serie.upper() for serie in netflix_favs if len(serie) < 5]

Mostramos el contenido de nuestra lista:

In [285]:
for serie in brief_netflix_favs:
    print(serie)

YOU
DARK
GLOW


# Tuplas
---

## ¿Qué es una tupla?

Las tuplas son, básicamente, **listas que no se pueden modificar**. Las listas son bastante dinámicas: pueden crecer añadiendo o insertando elementos, y se pueden acortar borrando elementos. En una lista se puede modificar cualquier elemento. Algunas veces nos interesa este comportamiento, pero otras veces podemos querer asegurarnos de que ningún usuario o bloque de código pueda cambiar una lista. Para ese propósito se definieron las tuplas.

![Tuplas](images/data_structures/tuple.png)

Técnicamente, las listas son *objetos mutables* y las tuplas son *objetos inmutables*.

# Definiendo tuplas y accediendo a sus elementos

Si partimos de la premisa (no necesariamente cierta) de que los géneros de las series de Netflix son inmutables, podríamos crear una tupla para almacenarlos:

In [287]:
netflix_genres = ('Thrillers', 'Terror', 'Reality TV', 'Documentales',
                  'Anime', 'Infantiles y familiares', 'Monólogos de humoristas',
                  'Más populares', 'Acción', 'Comedias', 'Dramas',
                  'Ciencia ficción y fantásticas', 'Románticas', 'Doramas')

Acceder a los elementos de una tupla es análogo al caso de las listas:

In [289]:
for genre in netflix_genres:
    print(genre, end=',')

Thrillers,Terror,Reality TV,Documentales,Anime,Infantiles y familiares,Monólogos de humoristas,Más populares,Acción,Comedias,Dramas,Ciencia ficción y fantásticas,Románticas,Doramas,

## Intento de modificación de una tupla

Hasta ahora no hemos visto gran diferencia entre una lista y una tupla, pero fijémonos lo que ocurre si quiero modificar un elemento de una tupla:

In [290]:
netflix_genres[0] = 'Superdrama'

TypeError: 'tuple' object does not support item assignment

Nos devuelve un `TypeError` e indica que no se puede asignar valores en una tupla.

## Tuplas de 1 elemento

Aunque no es frecuente, se podría dar la situación de tener una tupla con un único elemento. Podemos suponer que, en el año 1997, cuando Netflix empezó su andadura, quizás sólo habían series de *Comedia*. En ese caso tendríamos los siguientes géneros:

In [291]:
netflix_genres = ('Comedia')

Pero resulta que si miramos el tipo de la variable que acabamos de crear nos llevamos una sorpresa. No es una tupla, es una... cadena de texto!

In [292]:
type(netflix_genres)

str

Y eso es porque las tuplas de 1 elemento tienen que acabar en `,`:

In [294]:
netflix_genres = ('Comedia',)
type(netflix_genres)

tuple

# Conjuntos
---

# ¿Qué es un conjunto?

Un conjunto es una colección **desordenada** de objetos **únicos**.

![Conjuntos](images/data_structures/set.png)

Entre las operaciones más comunes destacamos la pertenencia, unicidad, intersección, unión o diferencia.

# Creación de conjuntos

Sabemos que no hay dos personas iguales. Basándonos en esta propiedad podemos crear un conjunto de los protagonistas de una serie determinada:

In [297]:
# reparto de The Crown (es más largo)
the_crown_cast = {'Claire Foy', 'Jared Harris', 'Alex Jennings', 'Harry Hadden-Paton', 'Lia Williams'}

Mostramos el contenido de nuestro conjunto:

In [298]:
for person in the_crown_cast:
    print(person)

Lia Williams
Alex Jennings
Jared Harris
Harry Hadden-Paton
Claire Foy


# Creación de conjuntos a partir de listas

Supongamos que tenemos una lista de actrices y actores de distintas series de Netflix. Es probable que repitan como protagonistas en varias series:

In [295]:
cast = ['Wagner Moura', 'Alberto Ammann', 'Kerry Bishé', 'Paulina Gaitán',
        'Manolo Cardona', 'Wagner Moura', 'Paulina Gaitán', 'Taliana Vargas']

Mediante la creación de un conjunto utilizando la función `set` podemos eliminar duplicados, por la propiedad de unicidad que cumplen los conjuntos:

In [296]:
set(cast)

{'Alberto Ammann',
 'Kerry Bishé',
 'Manolo Cardona',
 'Paulina Gaitán',
 'Taliana Vargas',
 'Wagner Moura'}

# Pertenencia de un elemento a un conjunto

Al igual que las listas y las tuplas, los conjuntos también nos permiten comprobar la pertenencia de elementos. Supongamos que queremos verificar si una determinada actriz o actor está en el reparto de la serie *The Crown*:

In [299]:
person = 'Ben Miles'

In [300]:
person in the_crown_cast

False

In [301]:
person = 'Alex Jennings'

In [302]:
person in the_crown_cast

True

# Operaciones entre conjuntos

Dados dos conjuntos se pueden llevar a cabo distintas operaciones. Supongamos que tenemos el reparto de dos series distintas de Netflix como conjuntos y queremos realizar ciertas operaciones entre ellos:

In [318]:
madmen_cast = {'Jon Hamm', 'Christina Hendricks', 'Kiernan Shipka', 'Bryan Batt', 'Jay R. Ferguson'}
madmen_cast

{'Bryan Batt',
 'Christina Hendricks',
 'Jay R. Ferguson',
 'Jon Hamm',
 'Kiernan Shipka'}

In [321]:
blackmirror_cast = {'Jesse Plemons', 'Douglas Hodge', 'Andrew Gower', 'Jon Hamm', 'Maxine Peake', 'Jake Davies'}
blackmirror_cast

{'Andrew Gower',
 'Douglas Hodge',
 'Jake Davies',
 'Jesse Plemons',
 'Jon Hamm',
 'Maxine Peake'}

## Unión

Todos los elementos del primer conjunto junto a todos los elementos del segundo conjunto:

In [322]:
madmen_cast | blackmirror_cast

{'Andrew Gower',
 'Bryan Batt',
 'Christina Hendricks',
 'Douglas Hodge',
 'Jake Davies',
 'Jay R. Ferguson',
 'Jesse Plemons',
 'Jon Hamm',
 'Kiernan Shipka',
 'Maxine Peake'}

## Intersección

Elementos que están, a la vez, en ambos conjuntos:

In [323]:
madmen_cast & blackmirror_cast

{'Jon Hamm'}

## Diferencia

Elementos que están en el primer conjunto pero que no están en el segundo conjunto:

In [324]:
madmen_cast - blackmirror_cast

{'Bryan Batt', 'Christina Hendricks', 'Jay R. Ferguson', 'Kiernan Shipka'}

# Diccionarios
---

# ¿Qué es un diccionario?

Al igual que un diccionario de la vida real donde disponemos de palabras y definición, los diccionarios en Python son estructuras de datos que permiten vincular información en forma de pares **clave-valor**.

![Diccionario](images/data_structures/dict.png)

# Sintaxis

Supongamos que queremos mejorar nuestro *Netflix-favs* y asociar a cada serie un ránking propio (que será un número entero entre 1 y 5):

In [325]:
netflix_favs = {'Stranger Things': 5,
                'Black Mirror': 5,
                'The Crown': 4,
                'House of Cards': 4,
                'Mindhunter': 3,
                'Narcos': 5}

Podemos acceder al ránking de cualquier serie de una forma sencilla:

In [326]:
netflix_favs['House of Cards']

4

# `KeyError`

Si intentamos acceder a una serie (*clave*) que no existe obtendremos una excepción de tipo *KeyError*:

In [328]:
netflix_favs['Los Vigilantes de la playa']

KeyError: 'Los Vigilantes de la playa'

![Error](images/common/error.gif)

# Accediendo a los valores de forma segura

Python provee de un método que nos puede sacar de apuros. El método `get` intenta buscar la clave que le pasamos y si no la encuentra devuelve `None`. También existe la posibilidad de pasarle el valor que queremos que nos devuelva si no encuentra la clave:

In [332]:
print(netflix_favs.get('Los Vigilantes de la playa'))

None


In [331]:
netflix_favs.get('Los Vigilantes de la playa', 0)

0

En el caso de que la clave exista funciona igual que el acceso mediante corchetes:

In [336]:
netflix_favs.get('Narcos')   # equivalente a netflix_favs['Narcos']

5

# Recorriendo los elementos de un diccionario

Queremos recorrer todo nuestro *Netflix-favs* e imprimir las series de una forma diferente:

In [340]:
for serie, ranking in netflix_favs.items():
    print(f'{serie}: {ranking}⭐️')

Stranger Things: 5⭐️
Black Mirror: 5⭐️
The Crown: 4⭐️
House of Cards: 4⭐️
Mindhunter: 3⭐️
Narcos: 5⭐️


> `serie` y `ranking` son nombres de variables. Podemos usar cualquier nombre que queramos respetando una nomenclatura que represente los valores que toman.

> A bajo nivel lo que está pasando realmente es que el método `items` devuelve una tupla de dos elementos, que son asignados a las dos variables definidas (*clave-valor*).

# Añadiendo elementos a un diccionario

Si queremos añadir una nueva serie con su correspondiente ranking a nuestro *Netflix-favs* podemos hacerlo de la siguiente manera. Entre corchetes especificamos la clave y asignamos su valor:

In [341]:
netflix_favs['The Umbrella Academy'] = 3
netflix_favs['Russian Doll'] = 2

In [342]:
for serie, ranking in netflix_favs.items():
    print(f'{serie}: {ranking}⭐️')

Stranger Things: 5⭐️
Black Mirror: 5⭐️
The Crown: 4⭐️
House of Cards: 4⭐️
Mindhunter: 3⭐️
Narcos: 5⭐️
The Umbrella Academy: 3⭐️
Russian Doll: 2⭐️


# Modificando valores de un diccionario

Supongamos que hemos vuelto a ver *The Crown* y ya no nos parece tan buena serie. Queremos rebajar su ranking a 3. Para hacerlo podemos acceder a la clave utilizando los corchetes y asignar el nuevo valor:

In [343]:
netflix_favs['The Crown'] = 3

In [344]:
for serie, ranking in netflix_favs.items():
    print(f'{serie}: {ranking}⭐️')

Stranger Things: 5⭐️
Black Mirror: 5⭐️
The Crown: 3⭐️
House of Cards: 4⭐️
Mindhunter: 3⭐️
Narcos: 5⭐️
The Umbrella Academy: 3⭐️
Russian Doll: 2⭐️


# Borrando elementos de un diccionario

La hemos tomado con *The Crown* y ya no sólo nos vale con rebajar su ranking, es que ya no la queremos tener ni dentro de la lista de nuestras series favoritas:

## `pop`

El uso del método `pop` nos permite borrar una clave y nos devuelve su valor:

In [345]:
netflix_favs.pop('The Crown')

3

In [346]:
netflix_favs

{'Stranger Things': 5,
 'Black Mirror': 5,
 'House of Cards': 4,
 'Mindhunter': 3,
 'Narcos': 5,
 'The Umbrella Academy': 3,
 'Russian Doll': 2}

## `del`

El uso del método `del` nos permite borrar *clave-valor* sin retornar nada. Supongamos que hemos cambiado de opinión sobre *Russian Doll* y que la queremos eliminar de nuestro *Netflix-favs*:

In [347]:
del(netflix_favs['Russian Doll'])

In [348]:
netflix_favs

{'Stranger Things': 5,
 'Black Mirror': 5,
 'House of Cards': 4,
 'Mindhunter': 3,
 'Narcos': 5,
 'The Umbrella Academy': 3}

# Modificando claves de un diccionario

Hasta ahora hemos visto cómo modificar los valores de un diccionario, pero modificar una clave de un diccionario no es sencillo. De hecho hay que buscar un *"atajo"* para poder conseguirlo.

Supongamos que añadimos una nueva serie pero que incorpora un error ortográfico:

In [349]:
netflix_favs['Mindhunterrr'] = 2

Para corregirlo tenemos que hacer una copia del valor en la nueva clave y borrar la errónea:

In [350]:
netflix_favs['Mindhunter'] = netflix_favs['Mindhunterrr']
del(netflix_favs['Mindhunterrr'])

In [351]:
netflix_favs

{'Stranger Things': 5,
 'Black Mirror': 5,
 'House of Cards': 4,
 'Mindhunter': 2,
 'Narcos': 5,
 'The Umbrella Academy': 3}

# Recorriendo las claves de un diccionario

Anteriormente hemos visto cómo iterar sobre todos los elementos (*clave-valor*) de un diccionario. Pero también podemos recorrer sólo las claves.

Supongamos que queremos mostrar sólo los nombres de nuestras series favoritas:

In [352]:
for serie in netflix_favs.keys():
    print(serie)

Stranger Things
Black Mirror
House of Cards
Mindhunter
Narcos
The Umbrella Academy


El código anterior es equivalente a `for serie in netflix_favs:`, pero uno de los principios del [Zen de Python](https://es.wikipedia.org/wiki/Zen_de_Python) nos dice que *"Explícito es mejor que implícito"*.

## Claves de un diccionario como lista

Aunque el método `keys` sea realmente un *generador*, podemos obtener una lista con una conversión explícita:

In [354]:
list(netflix_favs.keys())

['Stranger Things',
 'Black Mirror',
 'House of Cards',
 'Mindhunter',
 'Narcos',
 'The Umbrella Academy']

# Recorriendo los valores de un diccionario

De igual modo, existe la posibilidad de recorrer sólo los valores del diccionario.

Supongamos que queremos mostrar sólo los rankings de nuestras series favoritas:

In [353]:
for ranking in netflix_favs.values():
    print(ranking)

5
5
4
2
5
3


## Valores de un diccionario como lista

Aunque el método `values` sea realmente un *generador*, podemos obtener una lista con una conversión explícita:

In [355]:
list(netflix_favs.values())

[5, 5, 4, 2, 5, 3]

# Recorriendo un diccionario en orden

Para Python >= 3.7 se garantiza que un diccionario mantiene el orden de inserción de sus claves. Pero más allá de este detalle, podríamos querer recorrer un diccionario en orden alfabético de sus claves.

Supongamos que queremos mostrar nuestro *Netflix-favs* con las series ordenadas alfabéticamente:

In [356]:
for serie in sorted(netflix_favs.keys()):
    ranking = netflix_favs[serie]
    print(f'{serie}: {ranking}⭐️')

Black Mirror: 5⭐️
House of Cards: 4⭐️
Mindhunter: 2⭐️
Narcos: 5⭐️
Stranger Things: 5⭐️
The Umbrella Academy: 3⭐️


# Estructuras de datos anidadas
---

# Anidamiento

El anidamiento es un concepto muy potente ya que permite poner una lista o un diccionario dentro de otra lista o diccionario. Son estructuras de datos más complejas pero que permiten, en ciertos casos, modelar mejor la realidad de nuestro problema.

![Matroska](images/data_structures/matroska.png)

# Diccionario de listas

Supongamos que queremos ampliar nuestro *Netflix-favs* de tal forma que no sólo almacenemos un único ranking de la serie completa, sino que guardemos una valoración por cada una de las temporadas de la serie:

In [357]:
netflix_favs = {'Black Mirror': [5, 4, 4, 3],
                'Stranger Things': [5, 5],
                'The Crown': [4, 5],
                'After Life': [3],
                'Mad Men': [5, 4, 5, 3, 4, 5, 4]
               }

In [358]:
netflix_favs

{'Black Mirror': [5, 4, 4, 3],
 'Stranger Things': [5, 5],
 'The Crown': [4, 5],
 'After Life': [3],
 'Mad Men': [5, 4, 5, 3, 4, 5, 4]}

## Recorriendo los elementos de un diccionario de listas

Hay que entender que esta estructura de datos, en un primer nivel, es un diccionario. Por lo tanto la forma de recorrerlo es utilizando el método `items`. Sabemos positivamente que las claves son cadenas de texto (nombres de series) pero la diferencia es que los valores del diccionario son listas (rankings). Debido a ello tendremos que usar un bucle para recorrer cada uno de los elementos de los rankings de las temporadas:

In [377]:
for serie, rankings in netflix_favs.items():
    print(serie + ': ', end='')
    for ranking in rankings:
        print(ranking, end=' ')
    print()

Black Mirror: 5 4 4 3 
Stranger Things: 5 5 
The Crown: 4 5 
After Life: 3 
Mad Men: 5 4 5 3 4 5 4 


# Diccionario de diccionarios

Supongamos que damos un paso más en nuestro *Netflix-favs* y para cada serie vamos a almacenar los siguientes elementos:

- Año de lanzamiento.
- Número de temporadas.
- Ranking.
- Clasificación por edades.

In [378]:
netflix_favs = {
    'Narcos': {
        'premiere_year': 2015,
        'total_seasons': 3,
        'ranking': 5,
        'age_limit': '16+'
    },
    'The Good Place': {
        'premiere_year': 2016,
        'total_seasons': 3,
        'ranking': 4,
        'age_limit': '13+'
    },
    'Sense8': {
        'premiere_year': 2015,
        'total_seasons': 2,
        'ranking': 3,
        'age_limit': '16+'
    },
    'La niebla': {
        'premiere_year': 2017,
        'total_seasons': 1,
        'ranking': 5,
        'age_limit': '16+'
    },
}

## Recorriendo los elementos de un diccionario de diccionarios

In [381]:
for serie, features in netflix_favs.items():
    print(serie)
    for feature, value in features.items():
        print(f'\t{feature}: {value}')

Narcos
	premiere_year: 2015
	total_seasons: 3
	ranking: 5
	age_limit: 16+
The Good Place
	premiere_year: 2016
	total_seasons: 3
	ranking: 4
	age_limit: 13+
Sense8
	premiere_year: 2015
	total_seasons: 2
	ranking: 3
	age_limit: 16+
La niebla
	premiere_year: 2017
	total_seasons: 1
	ranking: 5
	age_limit: 16+


# Otras estructuras anidadas

Python permite el anidamiento de cualquier estructura. Esto implica que podríamos tener listas de listas, listas de diccionarios, diccionarios de listas de listas, diccionarios de diccionarios de listas, etc.

Un detalle muy importante a tener en cuenta es que cada nivel de anidamiento supone mayor complejidad en la estructura de datos. Cuando la profunidad del anidamiento es muy elevada quizás deberíamos plantearnos si existe otra estructura de datos en Python que nos permita representar de manera más adecuada la información que necesitamos.

De hecho, uno de los principios del [Zen de Python](https://es.wikipedia.org/wiki/Zen_de_Python) nos dice que *"Plano es mejor que anidado"*.