In [1]:
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

# Estructuras de datos

Python incorpora varios tipos compuestos de datos de forma nativa. Podemos ver un tipo compuesto como una estructura de datos que nos permite almacenar una colección de elementos o valores. Si has trabajado con otros lenguajes, un ejemplo sencillo sería un vector o _array_ de elementos. Python nos ofrece más alternativas, con características diferentes dependiendo de cómo se almacenan los valores dentro de la estructura y de qué operaciones podemos hacer.

## Secuencias

Empezaremos por las estructuras de tipo _secuencial_. Son tipos de datos compuestos por una serie de elementos, preservando el orden o posición en el que se añaden a la estructura. Por este motivo, se dice que son tipos _ordenados_.

> **Importante** Como a veces se presta a confusión, vamos a recalcarlo. Aquí _ordenado_ no significa que conforme añades elementos, estos se reordenen (p.ej. numéricamente o alfabéticamente). Solo hace referencia a que conservan el orden en el que son añadidos, es decir, su _orden posicional_. 

Todos los subtipos de secuencias en Python tienen en común varias operaciones, como el acceso indexado o por posición, el _rebanado_, la concatenación o la pertenencia.

### Listas

En Python, las listas son probablemente el tipo compuesto de uso más extendido por su versatilidad y sencillez.
Una lista es una secuencia ordenada de elementos. A diferencia de los vectores o _arrays_ de otros lenguajes, en una lista se pueden mezclar elementos de tipos distintos sin problema. Aunque lo habitual es que todos los elementos tengan el mismo tipo.

La forma común de definir una lista es incluyendo los elementos separados por comas entre un par de corchetes.


In [2]:
# creamos una lista vacía usando un par de corchetes sin ningún elemento dentro
lista_vacia = []
# podemos crear una lista de números
lista_nums = [1, 6, 2, 5, 3, 4]
# o una lista de cadenas de texto
lista_frutas = ["pera", "manzana", "ciruela", "cereza"]
# o una lista mezclando valores de cualquier tipo
lista_mezcla = [10, "veinte", 30.0, "cuarenta"]
# incluso podemos meter una lista como elemento dentro de otra lista
listas_anidadas = ["Aqui hay", ["listas", "anidadas"], [1, 2]]

Si te has fijado, la última lista de ejemplo tiene listas anidadas como elementos. ¿Cuańtos elementos dirías que tiene la lista de nivel superior? ¿Serías capaz de identificarlos? Podemos usar lo que hemos aprendido de bucles para comprobarlo

In [None]:
for elemento in listas_anidadas:
    print(elemento)

Aqui hay
['listas', 'anidadas']
[1, 2]


Para acceder a los 
elementos de una lista por su índice o posición, ponemos el índice entre corchetes también.

El primer elemento de una lista (y de cualquier secuencia) tiene el índice cero. Así que si una lista tiene _n_ elementos, para acceder al último tendremos que usar el índice _(n - 1)_.

In [3]:
# Longitud de la lista
len(lista_nums)
# Longitud de la lista anidada: cada "sub-lista" interna es vista como un único elemento
len(listas_anidadas)
# Seleccionar un elemento
lista_nums[0]                     # El primer valor lo obtenemos con el índice cero
lista_nums[5]                     # El elemento para el índice 5
lista_nums[len(lista_nums) - 1]   # El último elemento está en LEN - 1
# Al seleccionar en una lista anidada
listas_anidadas[1]                # El elemento devuelto puede ser otra lista
# Si usamos índices negativos, empezamos a contar desde el final
lista_nums[-1]                    # Devuelve el último elemento de la lista
lista_nums[-len(lista_nums)]      # Devuelve el primer elemento de la lista

6

3

1

4

4

['listas', 'anidadas']

4

1

Para aclarar mejor cómo funcionan los índices para acceder a un elemento, imagina que tenemos la lista `[ 'A', 'B', 'C', 'D', 'E', 'F' ]`. La siguente figura muestra a qué posición referencia un índice positivo o un índice negativo.

<img src="./img/fig_lista_indices.png" width=250px />

En lugar de ver los índices _"apuntando"_ a cada elemento, pensemos que los índices marcan las posiciones _entre elementos_ de la secuencia. En este caso, el índice 6 referencia una posición fuera de los límites de la lista y produciría un error.

Ahora es más fácil ver cómo podemos seleccionar una _"rebanada"_ de elementos contiguos de una lista. Indicamos el índice o posición inicial desde donde empezamos la selección y la posición final hasta donde queremos llegar, escribiéndolos dentro de los corchetes separados por dos puntos (`:`). En las rebanadas, el elemento correspondiente al límite inicial siempre se incluye, pero el elemento en el límite final queda excluído.

In [None]:
letras = ['A','B','C','D','E','F']
# Seleccionamos una "rebanada" con los dos primeros elementos
letras[0:2]
letras[2:5]   
# Si no especificamos el segundo índice, seleccionamos hasta el final
letras[2:]
# y si no especificamos el primer índice, seleccionamos desde el principio
letras[:4]    
# También podemos usar la notación de índices negativos.
# Seleccionamos desde la penúltima posición (incluída) hasta el final
letras[-2:]   
# Seleccionamos desde el inicio hasta la penúltima posición (excluída)
letras[:-2]   
# Como el primer índice siempre se incluye 
# y el segundo siempre se excluye, 
# podemos reconstruir la lista así
letras[:2] + letras[2:]

Las listas sí son _mutables_, es decir, sí podemos modificar el contenido de los elementos de una lista

In [None]:
print(lista_frutas)
# modificamos un elemento individual
lista_frutas[1] = "uva"

print(lista_frutas)
# también podemos reemplazar los valores de una "rebanada"
lista_frutas[2:] = ["naranja", "aguacate"]

print(lista_frutas)
# o eliminar algunos valores, reemplazando con la lista vacía
lista_frutas[1:3] = []

print(lista_frutas)
# o vaciarla entera
lista_frutas[:] = []
print(lista_frutas)

['pera', 'manzana', 'ciruela', 'cereza']


También podemos concatenar listas o replicarlas

In [None]:
lista_1 = ['a', 'b', 'c']
lista_2 = [100, 200, 300]

# concatenación
lista_1 + lista_2
# replicar la lista tres veces
3 * lista_1

['a', 'b', 'c', 100, 200, 300]

Y podemos extraer los elementos de una lista y asignaros a distintas variables de forma sencilla con una sola instrucción

In [None]:
x, y, z = lista_2
print(x)
print(y)
print(z)

100
200
300


Las listas en Python incluyen varios métodos para consultarlas y modificarlas

In [None]:
# añadir un elemento al final de la lista
lista_1.append('d')
print(lista_1)
# extraer el último elemento de la lista
ultimo_valor = lista_1.pop()
print(ultimo_valor)
print(lista_1)
# insertar un elemento delante de una posición concreta

# inserta 'e' en la posición cero (al principio)
lista_1.insert(0, 'e')
# inserta 'f' en la posición 2
lista_1.insert(2, 'c')
print(lista_1)
# buscar en qué posición está un elemento 
# (si no existe dará un error)
lista_1.index('b')
# contar el número de veces que aparece un elemento
lista_1.count('c')
# borrar el primer elemento de la lista 
# que coincida con el valor dado
lista_1.remove('c')
print(lista_1)
# ordenar los valores de la lista 
# (dependiendo del tipo: alfabéticamente, numéricamente...)
lista_1.sort()
print(lista_1)
# invertir el orden de la lista
lista_1.reverse()
print(lista_1)
# borrar un elemento indicando la posición
del lista_1[2]
print(lista_1)
# limpiar todos los elementos de la lista
lista_1.clear()
print(lista_1)

['a', 'b', 'c', 'd']


Como ves, no te engañábamos cuando decíamos que las listas son muy versátiles y fáciles de usar.

#### Más sobre variables, listas y mutabilidad

Acabas de ver cómo crear y manipular el contenido de listas en Python. Antes de continuar, vamos a aprovechar para explicar un detalle más sobre las variables, su contenido y lo que ocurre al hacer asignaciones en Python.

Imagina el siguiente caso habitual. Tienes una variable (pongamos `lista1`) y la inicializas con unos valores cualesquiera. Más adelante, tal vez tras hacer varios cálculos y operaciones con la primera variable, necesitas crear otra nueva variable (digamos `lista2`) e inicializarla con la misma lista que tenga la primera en ese momento. Así que le asignas la primera variable a la última.

In [None]:
# Creamos e inicializamos la primera variable
lista1 = [1, 2, 3]

# Hacemos nuestras operaciones ...

# Y ahora necesitamos crear una nueva variable
# e inicializarla con la misma lista que tenga lista1
lista2 = lista1
print(lista2)                          # [1, 2, 3]

# Obviamente, ahora deben tener el mismo valor
lista1 == lista2                       # True

[1, 2, 3]


True

Obviamente, tras la asignación, ambas variables tienen el mismo valor. Pero es que, en realidad, no solo tienen el mismo valor, si no que _apuntan_ al mismo contenido. Ambas son dos nombres o _referencias_ al mismo dato, a la misma lista, y no dos copias distintas con los mismos valores.

Una variable en Python no deja de ser eso, un nombre o _referencia_ a un valor o estructura de datos que está almacenada de algún modo en memoria. En Python, la operación de asignación de una variable a otra _no copia_ el contenido, si no que define un nuevo nombre o _referencia_ al mismo contenido que la variable original.

Podemos ver que dos variables representan el mismo objeto con el operador `is`.

¿Y esto qué implica? Piénsalo... Si modificamos un elemento en la segunda variable, ¿qué ocurre con la primera?

Como ambas variables no son más que nombres o referencias para la misma lista en memoria, la primera variable mostrará también el nuevo valor.

In [None]:
# Comprobamos que las dos variables 
# representan el mismo objeto
lista2 is lista1                       # True
# Modificamos lista2
lista2[1] = 99

# Y vemos que lista1 nos devuelve 
# el mismo contenido modificado
print(lista1)                          # [1, 99, 3]

True

No obstante, si en lugar de modificar el valor de los elementos de la lista, asignamos una lista distinta, estaremos definiendo un nuevo objeto o estructura de datos. La variable usada pasará a nombrar ese nuevo objeto independiente; las dos variables ya no serán _referencias_ al mismo contenido.


In [None]:
# Si asignamos una nueva lista a la segunda variable
lista2 = [7, 8, 9]

# Dejan de referenciar al mismo contenido
lista2 is lista1                     # False
# Incluso aunque usemos la primera variable 
# en la expresión para definir de la segunda
lista2 = 2 * lista1         # Replicación de la primera lista

# Las estructuras de datos que referencian son distintas
lista2 is lista1            # False

False

A la hora de trabajar con estructuras de datos mutables (como las listas), deberás tener todo esto en cuenta para evitar modificar accidentalmente el contenido de una variable al manipular una segunda.

Si necesitas una copia idéntica pero independiente de una lista, puedes usar el método `copy()`.

In [None]:
lista1 = [1, 2, 3]

# Con copy() creas una nueva lista, copia exacta de la original,
# pero independiente
lista2 = lista1.copy()

# Los valores en las listas son iguales
lista2 == lista1                     # True
# ¡¡Pero no son el mismo objeto!!
lista2 is lista1                     # False

True