# 2.4 Colecciones
***

Anteriormente vimos algunos tipos de datos básicos como los enteros, los flotantes, los complejos, las cadenas de texto y los booleanos. En esta ocasión veremos algunos tipos de colecciones de datos:    

- `Listas`
- `Tuplas`
- `Diccionarios`

Las ***colecciones*** son objetos que contienen un conjunto de datos con los cuales se pueden hacer ciertas operaciones. Todos los tipos de colecciones pueden albergar todos los tipos de datos (incluso usted puede albergar una colección dentro de otra colección).<br>
    
Cada tipo de colección tiene distintos atributos que la caracterizan. Es por eso que es importante conocer cada una y decidir cual usar.

## 2.4.1 Listas
***

La `lista` es un tipo de colección ordenada. Sería equivalente a lo que en otros lenguajes se conoce por arrays, o vectores. Las listas pueden contener cualquier tipo de dato: números, cadenas, booleanos, y también listas.

Una ventaja de las listas en Python es que maneja distintos tipos de datos. Además, las listas son mutables, ya que pueden ser modificadas en cualquier momento. 

Las listas siguen el formato `[Dato0, Dato1, ... , Dato(n-1)]`. Note como cada dato contenido en la lista tiene una posición asignada, donde el primer dato tiene la posición 0.

A continuación se muestra un ejemplo de lista:

In [1]:
lista1 = ["Hola", 23, True, [4,-5.2], ["variable",["y"]]]

Al analizar la lista `lista1`, note como tiene distintos tipos de datos contenidos dentro de ella. La siguiente tabla muestra la posición en la lista, el dato almacenado, y el tipo de dato que almacena:

|Posición | Dato | Tipo de dato|
| ---|---|---|
| 0 | "Hola" | `string`|
| 1 | 23 | `int`|
| 2 | True | `bool`|
| 3 |\[4,-5.2\] | `list`|
| 4 |\["variable",\["y"\]\] | `list`|

En la posición 4 de `lista1`, el dato almacenado es una lista `["variable",["y"]]` con dos valores, donde el segundo valor es otra lista `["y"]`. Manejar listas permite controlar y usar distintos tipos de datos para distintos usos. 

Otra característica a notar es que el tipo de dato para una lista tiene el nombre de `list`.

A continuación se muestra otro ejemplo de lista, donde se usan otros tipos de coleccionables que se verán y analizarán más adelante, pero por ahora solo sirven como demostración de la facilidad de albergar estos datos en una lista.

In [2]:
lista2 = ["prueba", {"x":1,"y":2}, ("a","b","c")]

Las listas contienen cualquier tipo y cantidad de datos que se requieran, aunque hay situaciones en que es conveniente definir una lista vacía para modificarla después. Para construir una lista vacía, basta solo definir su nombre y no agregarle ningún dato, como se muestra a continuación:

In [3]:
lista_vacia = []

### 2.4.1.1 Construyendo una matriz a partir de listas

Debido a que las listas pueden ser vistas como arreglos o vectores, es posible construir una matriz en Python utlizando este tipo de coleccionable. Suponga que se requiere construir la siguiente matriz identidad:

$$\begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix}$$

Para programar esta matriz en Python, cada renglón de la matriz representará una lista, entonces se obtiene:

In [4]:
matriz = [[1,0,0],
          [0,1,0],
          [0,0,1]]
print(matriz)

[[1, 0, 0], [0, 1, 0], [0, 0, 1]]


Si ejecuta la línea de código anterior, el resultado muestra como cada lista está contenida de una lista mayor, siguiendo la idea original. Para mejorar la redacción, se da un intro después de cada lista para identificarla como una matriz, aunque no es necesario.

### 2.4.1.2 Cómo acceder a los datos de una lista

Ya hemos visto como se construyen las listas en Python pero, ¿y si queremos saber que contiene esa lista?

Responder esta pregunta es sencilla, puesto que solo se tendría que ejecutar `print(lista)` y se mostraría la lista en pantalla. Pero si se quisiera un dato en específico, habría que indicarle a Python la posición del dato que nos interesa.

Si se desea conocer el dato de una lista, se sigue el formato `lista[i]`, donde `i` es la posición del dato a buscar. Hay que tomar en cuenta que `i` toma valores desde 0 hasta $n-1$, donde $n$ es la cantidad de elementos que contiene la lista. Recuerde que el formato de una lista en Python es `[Dato0, Dato1, ... , Dato(n-1)]`.

Retomando la lista creada anteriormente, `lista1`, se desea conocer los datos de la posición 2 y 3, entonces se escribe:

In [5]:
lista1 = ["Hola", 23, True, [4,-5.2], ["variable",["y"]]]

print(lista1[2])
print(lista1[3])

True
[4, -5.2]


El resultado de la celda anterior es `True`, ya que este dato se encuentra en la posición 2 de `lista1`. Del mismo modo, `[4,-5.2]` es el dato contenido en la posición 3

Si se desea acceder a varios elementos de la lista a la vez, se sigue el formato `lista[i:j:k]`, donde `i` es la posición inicial, `j ` es la posición final, y `k`, los saltos a dar. Si no se da un valor para cualquiera de estos, Python lo tomará como 0.

Para un valor de `j` dado, puede visualizarlo como un ciclo `for`, donde se registrarán todos los datos desde `i` hasta `j-1`

Para entender esto, nombremos una nueva lista:

In [6]:
lista = [2, "Python", True, [1,1], False, ["x",1]]

Si se desea obtener todos los elementos desde `2` hasta `True`, debe comenzar desde el cero hasta 2 + 1 para obtener todos los datos. La siguiente celda muestra el proceso:

In [7]:
print(lista[:3])

[2, 'Python', True]


Además, se puede acceder a los elementos de una lista mediante una secuencia. Si introducimos un valor de `k`, se estarían indicando los pasos que debe tomar Python. Corra la siguiente celda de código y verifique que, efectivamente, se tomaron los pasos para regresar cada valor.

In [8]:
print(lista[:5:2])

[2, True, False]


Por el momento se ha visto lo que pasa cuando `i`, `j`, y `k` toman valores positivos, pero no se limite. Estos valores también pueden tomar valores negativos. ¿Cómo se comportaría el método cuando se le introducen negativos? La secuencia cambiaría de sentido. Suponga que se quiere conocer el último elemento de la lista, pero no sabemos en qué posición se encuentra, entonces basta con escribir -1, como se muestra a continuación:

In [9]:
print(lista[-1])

['x', 1]


El resultado de la línea de código anterior es el último dato de `lista`, que es `['x',1]`. La siguiente celda muestra los resultados para diferentes intervalos:

In [10]:
# Los datos de la lista se muestran de derecha a izquierda
print(lista[::-1])

# Se muestran los datos desde la posición 0 hasta el penúltimo dato
print(lista[:-1])

# Se muestran los datos desde la posición antepenúltima hasta el último dato, dando saltos de 2
print(lista[-3::2])

[['x', 1], False, [1, 1], True, 'Python', 2]
[2, 'Python', True, [1, 1], False]
[[1, 1], ['x', 1]]


*¿Cómo se puede modificar el dato de una lista?* 

Ahora que conoce como acceder a los datos de una lista, modificar el dato dado una posición es sencillo. La siguiente línea de código muestra un cambio realizado a `lista`:

In [11]:
lista = [2, "Python", True, [1,1], False, ["x",1]]

# Se realiza una modificación, asignandole a la posicion indicada un nuevo dato
lista[2] = False

print(lista)

[2, 'Python', False, [1, 1], False, ['x', 1]]



### 2.4.1.3 Ciclo `for` y las listas

Suponga que se tiene una lista con múltiples datos, pero usted desea operar de cierta manera con todos los datos de la lista (o con algunos exclusivamente, dependiendo del caso). El ciclo `for` permite realizar esto, y existen dos formas de realizarlo: usando la lista misma, o de la forma tradicional.

#### Usando la lista para iterar

Para usar una lista dentro de un ciclo `for`, basta con escribir el formato `for i in lista`, donde `i` es solo una variable que permite iterar.

La siguiente celda de código muestra un ejemplo:

In [12]:
valores = [115,784,924,12,679]

# se desea obtener la suma de todos los datos
count = 0

for i in valores:
    count += i
    
print(count)

2514


Cada valor de `i` será un dato de la lista. Entonces, el primer valor de `i` es 115, el segundo valor de `i` es 784, y así sucesivamente.

#### Usando `range()` para iterar

La celda de código anterior se puede realizar de la misma manera usando `range()`. Para esta explicación se utilizará una función aplicada a las listas de nombre `len`, misma que se explicará junto con otras funciones más adelante.

La función `len` permite conocer la cantidad de datos que hay en una lista. El ciclo for a construir deberá ser capaz de recorrer el contenido de la lista y no pasarse de ella. Repitiendo el mismo ejemplo anterior se obtiene:

In [13]:
valores = [115,784,924,12,679]

# se desea obtener la suma de todos los datos
count = 0

for i in range(len(valores)):
    count += valores[i]
    
print(count)

2514


Note como a `range()` se le entrega el resultado de la función `len`. La función `len` regresa la cantidad de elementos contenidos en `valores`, con un total de 5. Entonces, el ciclo `for` irá de 0 a 4, los números suficientes para marcar la posición de todos los elementos en la lista `valores`.

Para sumarle a `count` cada dato contenido en `valores`, se indica la posición en la lista conforme el ciclo `for` avanza. Para la primera iteración se tiene `i=0`, entonces el dato en la posición `valores[0]` es 115, y se suma a `count`.

Usted debe saber escoger la manera en como usará un ciclo `for` para una lista. Debe saber que la primera forma solo maneja los datos de una lista, pero la segunda forma ofrece un número que puede ser usado como posición y en muchas más presentaciones.

### 2.4.1.4 Operaciones con listas

Las listas manejan un tipo diferente de operaciones que aquellas que se aplican a otros tipos de datos, como los enteros o flotantes.

#### Operación suma `+`

La suma de listas no devolverá la suma de cada dato de cada lista, ni tiene una semejanza con la suma de vectores. La suma de listas consiste en juntar los datos de dos listas en una misma.

In [14]:
l1, l2  = [1,2,3,4,5], [6,7,8,9,10]

print(l1+l2)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


#### Operación pertenece `in`

Si se desea conocer si un dato pertenece a una lista, basta con escribir la siguiente estructura:

In [15]:
pares = [0,2,4,6,8,10]

print(5 in pares)

False


El resultado de la celda anterior es `False`, indicando que el valor 5 no se encuentra en la lista.

Más adelante podrá conocer la posición de un dato si es que este mismo se encuentra en la lista.

### 2.4.1.5 Funciones a listas

Existen funciones que permiten manipular los datos de una lista, así como usarlos para diferentes operaciones convenientes. En este apartado solo se manejarán las más importantes, por lo que deberá buscar una documentación más completa respecto a funciones y métodos aplicados a listas.

#### Función `len`

La función `len` regresa la cantidad de elementos que tiene una lista. Esta función se explicó anteriormente al analizar las listas y el ciclo `for`.

In [16]:
lista_3 = ["Hola", True, -5.2, []]

# Note como se ingresa el nombre de la variable de la lista
# en la función
print(len(lista_3))

4


#### Función `append`

La función `append` añade un nuevo dato a la lista, en su última posición.

In [17]:
# El nuevo dato a ingresar puede ser de cualquier tipo
lista_3.append("x")

print(lista_3)

['Hola', True, -5.2, [], 'x']


#### Función `extend`

La función `extend` permite añadir múltiples datos al final de una lista, a diferencia de la función `append`, donde solo se añade un dato.

Al utilizar esta función, por ser varios datos que se deben de ingresar, estos deben de estar contenidos dentro de una lista. Siguiendo esta idea, el argumento que reciba `extend` puede ser una variable que contenga a una lista ya definida.

In [18]:
lista_3 = ["Hola", True, -5.2, []]

dl = [1,1,1]

# Se agregan 3 datos arbitrarios
lista_3.extend([0, True, "count"])

# Se agrega la lista >>dl<<
lista_3.extend(dl)

print(lista_3)

['Hola', True, -5.2, [], 0, True, 'count', 1, 1, 1]


#### Función `sum`

La función `sum` permite sumar todos los datos de una lista. Tenga cuidado al usar esta función, ya que debe asegurarse que todos los datos de la lista son enteros o flotantes.

In [19]:
datos = [1,2,-5.4,6.7,2/3]

print(sum(datos))

4.966666666666667


#### Función `insert`

La función `insert` permite añadir un nuevo dato a una lista en una posición deseada. Su formato es `lista.insert(i,Dato)`, donde `i` es la posición deseada.

In [20]:
datos = [1,2,-5.4,6.7,2/3]

# Se agrega el numero 3 despues del 2
datos.insert(2,3)

print(datos)

[1, 2, 3, -5.4, 6.7, 0.6666666666666666]


#### Función `remove`

La función `remove` permite extraer un dato de una lista. A diferencia de otras funciones, `remove` solo necesita conocer la estructura del dato, mas no su posición.

In [21]:
orden = [0,1,2,3,4,5,6,7,8,9,10]

#Se desea extraer todos los numeros pares
for i in range(0,11,2):
    orden.remove(i)
    
print(orden)

[1, 3, 5, 7, 9]


#### Función `pop`

Una desventaja de la función `remove` es que el dato extraido no se puede conservar en una variable. La función `pop` si permite ser asignada a una variable.

El formato es `lista.pop(k)`, donde `k` es la posición del dato a extraer. Si la función no recibe ningún argumento, se extraerá el último dato de la lista.

In [22]:
datos = [0,3,9,2,"error",8,9]

# Se extrae el unico dato que no es un numero
palabra = datos.pop(4)

print(datos,"\n",palabra)

[0, 3, 9, 2, 8, 9] 
 error


#### Función `index`

La función `index` ayuda a localizar la posición de un dato de acuerdo a como está compuesto.

In [23]:
lista = [2, "Python", True, [1,1], False, ["x",1]]

# ¿En donde esta ubicada la lista [1,1]?
print(lista.index([1,1]))

3


#### Función `sort`

La función `sort` ordena los **números** de una lista. Si se desea que sea de forma ascendente, se ejecuta la función sin ningún parámetro; si se desea que sea de forma descendente, entonces la función recibe el parámetro `reverse = True`.

In [24]:
lista = [100,150,22,153,1558]
lista.sort()

print(lista)

[22, 100, 150, 153, 1558]


Esta función tiene un comportamiento definido. Si la lista a ordenar contiene más listas, el resultado será en base a cada número menor dentro de cada lista. La siguiente celda muestra este caso:

In [25]:
lista = [[1,8,2],[9,4,2],[-2,0,1]]
lista.sort()
print(lista)

[[-2, 0, 1], [1, 8, 2], [9, 4, 2]]


Si la lista se compone de cadenas de texto, el orden será en base a las letras.

In [26]:
lista = ["abc","hola","serpiente","java"]
lista.sort()
print(lista)

['abc', 'hola', 'java', 'serpiente']


#### Función `split`

La función `split` permite convertir una cadena de texto a una lista en base a un caracter especial.

In [27]:
texto = "cadena,de,texto,en,python"

# Se convierte una lista de cada palabra
print(texto.split(','))

['cadena', 'de', 'texto', 'en', 'python']


#### Función `zip`

La función `zip` permite trabajar con los datos de dos listas al mismo tiempo, en pares ordenados. Esta función normalmente es utilizada en ciclos `for`.

El formato de la función es `for i,j in zip(lista1,lista2)`.

Para visualizar esto, se tienen dos listas, `x` y `y`, y se desea escribir una nueva lista donde su contenido sea la suma en pares ordenados de cada dato de `x` y `y`.

In [28]:
x = [41,-54,2,48,72,2,62]
y = [48,20,-4,99,36,45,8]

# En esta variable se guardaran los resultados
resultado = []

for i,j in zip(x,y):
    resultado.append(i+j)
    
print(resultado)

[89, -34, -2, 147, 108, 47, 70]


## 2.4.2 Tuplas
***

Todo lo que hemos explicado sobre las listas se aplica también a las `tuplas`, a excepción de la forma de definirla.

Las tuplas son inmutables, es decir, sus valores no se pueden modificar una vez creada; y tienen un tamaño fijo. Una ventaja de las tuplas sobre las listas es que las primeras ocupan menos espacio de memoria.

El formato de una tupla es `(dato0, dato1, ..., dato(n-1))`. A diferencia de las listas, las tuplas se definen con paréntesis. La siguiente celda de código muestra un ejemplo de una tupla:

In [29]:
tupla = ("Hola", 23, True, [1,2],(4,5))

print(type(tupla))

<class 'tuple'>


Para crear una tupla, también se pueden obviar los paréntesis y Python reconocerá que es una tupla, simplificando la sintaxis. A esto se le conoce como **empaquetar**.

In [30]:
x = "fy", False, [0,1]
print(x)

('fy', False, [0, 1])


Note como a la variable `x` se le asignaron distintos resultados, pero Python los junta todos y los asigna en forma de tupla. Si se desea **desempaquetar** el contenido, se deben asignar tantas variables como los datos en la tupla. La siguiente celda muestra este procedimiento:

In [31]:
valor1, valor2, valor3 = x
print(f"{valor1}\n{valor2}\n{valor3}")

fy
False
[0, 1]


Las tuplas son similares a las listas en cuanto a los datos que albergan, ya que pueden contener una tupla en sus datos. El tipo de dato que caracteriza a las tuplas recibe el nombre de `tuple`.

Como se mencionó anteriormente, una tupla no puede ser modificada después de ser creada. Si se ejecuta una función para las listas, vistas anteriormente, marcará un error, como lo muestra la siguiente celda:

In [32]:
tupla = ("Hola", 23, True, [1,2],(4,5))

tupla.append("nuevo dato")

AttributeError: 'tuple' object has no attribute 'append'

De igual forma, si se desea acceder a un dato contenido en una tupla, se sigue el mismo formato mencionado anteriormente: `tupla[i:j:k]`, donde `i` es la posición inicial, `j ` es la posición final, y `k`, los saltos a dar. Si no se da un valor para cualquiera de estos, Python lo tomará como 0.

In [None]:
tupla = ("Hola", 23, True, [1,2],(4,5))

print(tupla[:3:2])

### 2.4.2.1 Conversiones entre tuplas y listas

En ocasiones, al ejecutar funciones de distintos módulos, el resultado regresado es una tupla, pero puede ser conveniente manejar este resultado como una lista. Para transformar una tupla a una lista, basta con escribir `list(tupla)`.

Del mismo modo, si se desea convertir una lista a una tupla, se utiliza la función `tuple(lista)`.

In [33]:
tupla1 = True, False, 3, "FCFM"
print(list(tupla1))

lista1 = [False, 90, "UADEC", []]
print(tuple(lista1))

[True, False, 3, 'FCFM']
(False, 90, 'UADEC', [])


## 2.4.3 Diccionarios
***

Los `diccionarios`, también llamados *matrices asociativas*, deben su nombre a que son colectores que relacionan una clave y un valor. 

Los diccionarios tienen el formato ```{clave0:valor0, clave1:valor1, ...}```. Note como a cada clave se le asigna un valor por medio de dos puntos. Como clave se puede usar cualquier valor inmutable: números, cadenas, booleanos, tuplas...

Los diccionarios pueden ser modificados, pero no pueden existir más de dos claves iguales.

A continuación, se muestra un ejemplo de diccionario:

In [34]:
Cal_Sem = {"Física 1": 70, "Cálculo": 90, "Algebra": 100, "Laboratorio": 80}

Un diccionario presenta una gran agilidad a la hora de buscar un valor que está asociado a un dato (clave). Si se desea acceder a este valor, basta con usar la misma sintaxis para las listas o tuplas, pero en vez de indicar la posición se indicará la clave. El formato es `diccionario[clave]`.

Del diccionario anterior, se desea encontrar la calificación obtenida para Laboratorio, entonces se escribe:

In [35]:
print(Cal_Sem["Laboratorio"])

80


Como se mencionó anteriormente, las listas son objetos mutables, por lo que no son candidatas para ser claves. Sin embargo, pueden ser valores asociados, y acceder a una lista por medio de un diccionario es por el formato `diccionario[clave][posición]`.

A continuación, se muestra un ejemplo:

In [36]:
dicc = {"vector1": [1,2,3], "vector2":[-8,5,4]}

# Se desea buscar la segunda componente del vector dos
print(dicc["vector2"][1])

5


Si se desea modificar un valor asignado a una clave, basta con señalar la clave y dar un nuevo valor.

Si del diccionario anterior se desea cambiar el vector 1, se sigue:

In [37]:
dicc["vector1"] = [3,8,5]

print(dicc)

{'vector1': [3, 8, 5], 'vector2': [-8, 5, 4]}


### 2.4.3.1 Recorrer valores y claves de un diccionario

Al igual que en las listas, usted puede iterar dentro de un diccionario para manejar o analizar su contenido. Hay 3 formas de recorrer un diccionario, cada una con su método adecuado:

* **claves y valores:** `diccionario.items()`
* **claves**: `diccionario.keys()`
* **valores**: `diccionario.values()`

A continuación, se construye un diccionario y se muestra el uso de cada método:

In [38]:
D = {"OP":True, "ERA":250, "RGB":[1,2,3], "NDA": True}

# Claves y valores

for i in D.items():
    print(i)
print("\n")

# Claves

for i in D.keys():
    print(i)
print("\n")

# Valores

for i in D.values():
    print(i)
print("\n")

('OP', True)
('ERA', 250)
('RGB', [1, 2, 3])
('NDA', True)


OP
ERA
RGB
NDA


True
250
[1, 2, 3]
True




Note que cuando se iteró sobre el diccionario buscando las claves y valores, el resultado final es una tupla, ya que se están manejando dos datos a la vez. Para evitar esto, basta con repetir el ciclo `for` pero con dos variables iterativas.

In [39]:
D = {"OP":True, "ERA":250, "RGB":[1,2,3], "NDA": True}

for i,j in D.items():
    print(i,j)

OP True
ERA 250
RGB [1, 2, 3]
NDA True
