# Estructura de datos: listas

**Objetivo.**
Describir la estructura de datos `list ` mediante la exposición de ejemplos.

<p xmlns:cc="http://creativecommons.org/ns#" xmlns:dct="http://purl.org/dc/terms/"><a property="dct:title" rel="cc:attributionURL" href="https://github.com/repomacti/pensamiento_computacional">Pensamiento Computacional a Python</a> by <a rel="cc:attributionURL dct:creator" property="cc:attributionName" href="https://gmc.geofisica.unam.mx/luiggi">Luis Miguel de la Cruz Salas</a> is licensed under <a href="https://creativecommons.org/licenses/by-sa/4.0/?ref=chooser-v1" target="_blank" rel="license noopener noreferrer" style="display:inline-block;">CC BY-SA 4.0<img style="height:22px!important;margin-left:3px;vertical-align:text-bottom;" src="https://mirrors.creativecommons.org/presskit/icons/cc.svg?ref=chooser-v1" alt=""><img style="height:22px!important;margin-left:3px;vertical-align:text-bottom;" src="https://mirrors.creativecommons.org/presskit/icons/by.svg?ref=chooser-v1" alt=""><img style="height:22px!important;margin-left:3px;vertical-align:text-bottom;" src="https://mirrors.creativecommons.org/presskit/icons/sa.svg?ref=chooser-v1" alt=""></a></p> 

# Introducción

Hay cuatro tipos de estructuras de datos, también conocidas como *colecciones*. Cuando se selecciona un tipo de colección, es importante conocer sus propiedades para incrementar la eficiencia y/o la seguridad de los datos. La siguiente tabla resume estos cuatro tipos:

|Tipo|Ordenada|Inmutable|Indexable|Duplicidad|
|-:|:-:|:-:|:-:|:-:|
|List |SI|NO|SI|SI|
|Tuple|SI|SI|SI|SI|
|Sets |NO|NO|NO|NO|
|Dict |NO|NO|SI|NO|


# Listas

* Consisten en una secuencia **ordenada** y **mutable** de elementos. 
    - **Ordenadas** significa que cada elemento dentro de la lista está indexado y mantiene su orden definido en su creación.
    - **Mutable** significa que los elementos de la lista se pueden modificar, y además que se pueden agregar o eliminar elementos.
* Las listas pueden tener elementos **duplicados**, es decir, **elementos del mismo tipo y con el mismo contenido**.
* Las listas se definen usando corchetes `[]` y `,` para separar sus elementos.

<div class="alert alert-success">

## Ejemplo 1.
    
Vamos a crear las siguientes listas:

* `gatos` : Razas de gatos.
* `origen` : Origen de cada raza de gatos.
* `pelo_largo`: Si tienen pelo largo o no.
* `pelo_corto`: Si tienen pelo corto o no.
* `peso_minimo`: El peso mínimo que pueden tener.
* `peso_maximo`: El peso máximo que pueden tener.

</div>

In [None]:
# Listas con elementos de tipo cadena (str)
gatos = ['Persa', 'Sphynx', 'Ragdoll','Siamés']
origen = ['Irán', 'Toronto', 'California', 'Tailandia']

# Listas con elementos de tipo lógico (bool)
pelo_largo = [True, False, True, False]
pelo_corto = [False, False, False, True]

# Listas con elementos de tipo flotante
peso_minimo = [2.3, 3.5, 5.4, 2.5]
peso_maximo = [6.8, 7.0, 9.1, 4.5]

In [None]:
# Revisamos el tipo y contenido de cada lista
print(type(gatos), gatos)
print(type(origen), origen)
print(type(pelo_largo), pelo_largo)
print(type(pelo_corto), pelo_corto)
print(type(peso_minimo), peso_minimo)
print(type(peso_maximo), peso_maximo)

**Observaciones**:
* Cada lista contiene 4 elementos. 
* Los elementos de cada lista son del mismo tipo. Aunque es posible que los elementos sean de tipos diferentes.
* Los elementos son cadenas, flotantes y tipos lógicos.

# Indexado

Se puede acceder a cada elemento de las listas de manera similar a como se hace con las cadenas, veáse el tema **Indexación de las cadenas** en la notebook [05_cadenas.ipynb](./05_cadenas.ipynb).

Por ejemplo:

In [None]:
gatos[0] # Primer elemento

In [None]:
gatos[1:4] # Todos los elementos, desde el 1 hasta el 3

In [None]:
gatos[-1] # Último elemento

In [None]:
gatos[::2] # Todos los elementos en saltos de dos en dos

In [None]:
gatos[::-1] # Todos los elementos en reversa

Para conocer el contenido y tipo de alguno de los elementos podemos hacer lo siguiente:

In [None]:
print(type(gatos[0]), gatos[0])
print(type(pelo_largo[2]), pelo_largo[2])
print(type(peso_maximo[-1]), peso_maximo[-1])

# Mutabilidad de las listas.

Usando el indexado es posible cambiar el contenido de los elementos de una lista. 

Veamos los siguientes ejemplos:

* Modificamos el elemento 1 de la lista `peso_maximo`.

In [None]:
print('Original  :', peso_maximo) # Antes
peso_maximo[1] = 100.5 
print('Modificado:', peso_maximo) # Después

* El tipo de los elementos puede ser diferente del original.

In [None]:
print('Original  :', peso_maximo) # Antes
peso_maximo[1] = "una cadena" 
print('Modificado:', peso_maximo) # Después

* Incluso es posible agegar otra lista en uno de los elementos:

In [None]:
print('Original  :', peso_maximo) # Antes
peso_maximo[1] = [1,2,'a','b','c'] 
print('Modificado:', peso_maximo) # Después

* Se pueden usar rangos para modificar varios elementos a la vez.

In [None]:
print('Original  :', peso_maximo) # Antes
peso_maximo[1:3] = ['a', 'b'] 
print('Modificado:', peso_maximo) # Después

* Se pueden modificar elementos en saltos diferentes a uno.

In [None]:
print('Original  :', peso_maximo) # Antes
peso_maximo[::2] = [0.0, 0.0] 
print('Modificado:', peso_maximo) # Después

In [None]:
# Regresamos a los valores originales de la lista peso_maximo
peso_maximo[0:3] = [6.8, 7.0, 9.1]
print(peso_maximo)

# Nombres e identificadores

Es importante entender la forma en como están almacenados los elementos de la lista en memoria. Veamos el siguiente ejemplo.

Generamos otro nombre para la lista (no se crea una copia):

In [None]:
p_min = peso_minimo

Verificamos que sea la misma lista:

In [None]:
print(id(p_min), p_min)
print(id(peso_minimo), peso_minimo)

Podemos acceder a un elemento de la lista usando el indexado y ver su contenido y su identificador en memoria. Por ejemplo, para ver el elemento con índice `2` de la lista `p_min` hacemos lo siguiente:

In [None]:
print(id(p_min[2]), p_min[2])
print(id(peso_minimo[2]), peso_minimo[2])

Observa que la lista completa tiene su propio identificador, y cada elemento de la lista tiene un identificador diferente. 

Eliminamos el nombre `peso_minimo`:

In [None]:
del peso_minimo 

Ya no existe el nombre `peso_minimo`, por lo que la siguiente declaración dará un error:

In [None]:
print(peso_minimo) 

Pero aún se puede acceder a la lista original a través del nombre `p_min`:

In [None]:
print(id(p_min), p_min) 

Se puede eliminar un elemento de la lista:

In [None]:
del p_min[2] 

Veamos el estado actual de la lista:

In [None]:
print(id(p_min), p_min) 

# Funciones incorporadas que operan sobre las listas.

Existen muchas operaciones que se pueden realizar sobre las listas usando funciones incorporadas (*built-in functions*).

## `len()`: determina la longitud de la lista.

In [None]:
len(gatos) 

## `max()`: determina el máximo elemento de la lista.

In [None]:
max(peso_maximo) 

## `min()`: determina el mínimo elemento de la lista.

In [None]:
min(peso_maximo) 

## `any()`: revisa si ALGÚN elemento es `True`.

In [None]:
any(pelo_largo) 

## `all()`: revisa si TODOS los elementos son `True`.

In [None]:
all(pelo_corto)

## `sorted()`: ordena los elementos de la lista.

In [None]:
print(peso_maximo) # Lista original antes del ordenamiento
sorted(peso_maximo) 

La función `sorted()` genera una nueva lista ordenada, pero no modifica la lista original. Si se imprime la lista `peso_maximo` veremos que no ha cambiado:

In [None]:
print(peso_maximo)

## `sum()`: suma los elementos de la lista. 

In [None]:
# El operador suma debe estar definido para el tipo de los elementos de la lista
sum(peso_maximo) 

## `enumerate()`: enumera los elementos de una lista.

Genera tuplas del tipo `(i, elemento)`.


In [None]:
list(enumerate(origen)) 

Observa que para el caso de `enumerate()` el resultado se debe convertir a un tipo que se pueda desplegar, en este se convierte a una lista usando `list()`.

## `zip()`: agrupa los elementos de dos listas.

Genera tuplas del tipo `(gatos[i], origen[i])`.

In [None]:
list(zip(gatos, origen)) 

Observa que para el caso de `zip()` el resultado se debe convertir a un tipo que se pueda desplegar, en este se convierte a una lista usando `list()`.

# Operadores sobre listas

Se pueden usar los operadores `+`, `*` e `in` sobre las listas.

## `+`: concatena listas.

In [None]:
gatos + peso_maximo # Concatenación de dos listas

## `*`: replica listas.

In [None]:
origen * 2 # Duplicación de la lista

## `in`: revisa si un elemento está en la lista.

In [None]:
'Siamés' in gatos # ¿Está el elemento `Siamés` en la lista gatos?

# Métodos de las listas (comportamiento)

En términos de Programación Orientada a Objetos, la clase `<class 'list'>` define una serie de métodos que se pueden aplicar sobre los objetos del tipo `list`. Veamos algunos ejemplos:

In [None]:
print(gatos) # Imprimimos la lista original

In [None]:
gatos.append('Siberiano') # Se agrega un elemento al final de la lista

In [None]:
print(gatos)

In [None]:
gatos.append('Persa') # Se agrega otro elemento al final de la lista, repetido

In [None]:
print(gatos)

In [None]:
gatos.remove('Persa') # Eliminamos el elemento 'Persa' de la lista

In [None]:
print(gatos) 

Observa que solo se elimina el primer elemento `Persa` que encuentra.

In [None]:
gatos.insert(0,'Persa') # Podemos insertar un elemento en un lugar específico de la lista

In [None]:
print(gatos)

In [None]:
gatos.pop() # Extrae el último elemento de la lista

In [None]:
print(gatos)

In [None]:
gatos.sort() # Ordena la lista

In [None]:
print(gatos)

In [None]:
gatos.reverse() # Modifca la lista con los elementos en reversa

In [None]:
print(gatos)

In [None]:
pelo_corto.extend(pelo_largo) # Concatena dos listas

In [None]:
print(pelo_corto)

In [None]:
pelo_corto.count(False) # Contar los elementos que tengan el valor 'False'

In [None]:
pelo_corto.count(True) # Contar los elementos que tengan el valor 'True'

<div class="alert alert-success">

## Ejemplo 2.
    
Considera la lista original `peso_minimo = [2.3, 3.5, 5.4, 2.5]`. El nombre fue eliminado en un ejemplo anterior. Vamos a recuperar la lista a través del nombre `p_min` que aún existe:
</div>

Veamos el identificador y contenido  de `p_min`

In [None]:
print(id(p_min), p_min)

Necesitamos insertar el valor 5.4 en el lugar 2 de la lista:

In [None]:
p_min.insert(2, 5.4)

Revisamos el identificador y contenido  de `p_min`

In [None]:
print(id(p_min), p_min)

Recuperamos el nombre original:

In [None]:
peso_minimo = p_min

Revisamos el identificador y contenido  de `peso_minimo`

In [None]:
print(id(peso_minimo), peso_minimo)

Eliminamos `p_min`

In [None]:
del p_min

Una descripción detallada de los métodos de la listas se puede ver en [More on Lists](https://docs.python.org/3/tutorial/datastructures.html#more-on-lists).

# Copiando listas

* Una lista es un objeto que contiene varios elementos.
* Para crear una copia de una lista, se debe generar un espacio de memoria en donde se copien todos los elementos de la lista original y asignar un nuevo nombre para esta nueva lista.
* Lo anterior no se puede hacer simplemente con el operador de asignación `=`.

Veamos un ejemplo:

In [None]:
gatitos = gatos

In [None]:
print(gatos)
print(gatitos)

Podemos observar que al imprimir la lista mediante los nombres `gatos` y `gatitos` obtenemos el mismo resultado. Ahora, modifiquemos el primer elemento usando el nombre `gatitos`: 

In [None]:
gatitos[0] = 'Singapur'

In [None]:
print(gatos)
print(gatitos)

Observamos que al imprimir la lista usando `gatos` y `gatitos` volvemos a obtener el mismo resultado. Lo anterior significa que el operador de asignación solamente creó un nuevo nombre para el mismo objeto en memoria, por lo que en realidad no hizo una copia de la lista. Lo anterior lo podemos verificar usando la función `id()` para ver la dirección en memoria del objeto:

In [None]:
print(id(gatitos))
print(id(gatos))

## Copiando con `[:]`

Para crear una nueva lista copiando todos los elementos podemos hacer lo siguiente:

In [None]:
gatitos = gatos[:]

In [None]:
print(type(gatitos))
print(id(gatitos))
print(gatitos)

print(type(gatos))
print(id(gatos))
print(gatos)

Observa que el identificador en memoria de cada lista es diferente por lo que se trata de listas diferentes.

## Copiando con el método `copy()`

La clase `<class 'list'>` contiene un método llamado `copy()` que efectivamente realiza una copia de la lista:

In [None]:
gatitos = gatos.copy()

In [None]:
print(type(gatitos))
print(id(gatitos))
print(gatitos)

print(type(gatos))
print(id(gatos))
print(gatos)

Observa que el identificador en memoria de cada lista es diferente por lo que se trata de listas diferentes.

## Copiando con el constructor

La función `list()` transforma un objeto *iterable* en una lista. La podemos usar para copiar una lista como sigue:

In [None]:
gatitos = list(gatos)

In [None]:
print(type(gatitos))
print(id(gatitos))
print(gatitos)

print(type(gatos))
print(id(gatos))
print(gatos)

Observa que el identificador en memoria de cada lista es diferente por lo que se trata de listas diferentes.

<div class="alert alert-info">

**Nota**.

<font color="Black">
    
Lo que sucede en este último caso, es que se ejecuta el constructor de la clase `<class 'list'>`, el cual recibe un objeto iterable (lista, tupla, diccionario, entre otros), copia todos los elementos de ese iterable y los pone en una lista que se almacena en un espacio en memoria diferente al iterable original.
</font>
</div>



## Copiando con la biblioteca `copy`

La biblioteca **copy** de Python ofrece herramientas para copiado de objetos. Veamos un ejemplo:

In [None]:
# Importamos la biblioteca copy
import copy

# Usamos la función copy()
gatitos = copy.copy(gatos)

In [None]:
print(type(gatitos))
print(id(gatitos))
print(gatitos)

print(type(gatos))
print(id(gatos))
print(gatos)

Observa que el identificador en memoria de cada lista es diferente por lo que se trata de listas diferentes.

Más información sobre el uso de esta biblioteca se puede ver en [Shallow and deep copy operations](https://docs.python.org/3/library/copy.html).

# Listas mas complejas.

Las listas pueden contener cualquier tipo de dato de Python e incluso tipos construidos por el usuario. Veamos el siguiente ejemplo:

In [None]:
lst = ['a', 'b', 'c', [1, 2, 3], 5+1j, 'lista muy compleja']

Observa que:
* los primeros tres elementos, `lst[0]`, `lst[1]` y `lst[2]` son de tipo `str`,
* el cuarto elemento, `lst[3]`, es una lista,
* el quinto elemento, `lst[4]`, es un número complejo,
* y el último elemento, `lst[5]`, es una cadena.

Podemos usar los nombres `lst[i]`, con `i` =0,1,2,3,4,5, como nombres de variables. 

El contenido y tipo de cada elemento se puede conocer usando esos nombres:

In [None]:
print(lst[0], type(lst[0]))
print(lst[1], type(lst[1]))
print(lst[2], type(lst[2]))
print(lst[3], type(lst[3]))
print(lst[4], type(lst[4]))
print(lst[5], type(lst[5]))

Podemos acceder a los elementos individuales de los objetos que son más complejos. Por ejemplo, para `lst[3]` y `lst[5]` que son una lista y una cadena respectivamente, hacemos lo siguiente:

In [None]:
# Segundo elemento de la lista 'lst[3]'
print(lst[3][1], type(lst[3][1]))

# Cuarto elemento de la cadena 'lst[5]'
print(lst[5][3], type(lst[5][3]))

Otro ejemplo:

In [None]:
superlista = ['México', 3.141592, 20, 1j, [1,2,3,'lista']]

In [None]:
superlista

In [None]:
superlista[0] # El elemento 0 de la lista

In [None]:
superlista[4] # El elemento 4 de la lista (este elemento es otra lista)

In [None]:
superlista[4][2] # El elemento 2 del elemento 4 de la lista original