# Colecciones: Listas, tuplas y conjuntos
<a href="https://colab.research.google.com/github/milocortes/diplomado_ciencia_datos_mide/blob/edicion-2024/talleres/collections_mide_2024.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

![python-ecosystem](https://github.com/milocortes/python_course_summer_school_DMDU_2022/raw/main/notebooks/images/data_structures.jpg)
<div style="text-align: center"> https://www.youtube.com/watch?v=B31LgI4Y4DQ </div>





## Estructuras de datos

Una estructura de datos es una forma de organización, administración y almacenamiento que permite un acceso y modificación eficientes.

Una de las cosas más importantes al escribir programas eficientes es comprender las garantías de las estructuras de datos que estamos utilizando.

Una gran parte de una programación eficiente consiste en saber qué preguntas estamos tratando de responder con nuestros datos y elegir una estructura de datos que pueda responder estas preguntas rápidamente.

## Listas y tuplas

Lista y tuplas son una clase de estructuras de datos llamadas *arreglos* (*arrays*).

Un arreglo es una lista plana de datos con algún orden intrínseco.

![array.png](attachment:array.png)

Por lo general, en este tipo de estructuras de datos, el orden relativo de los elementos es tan importante como los propios elementos.

 El conocimiento *a priori* del orden es increíblemente valioso: al saber que los datos en nuestro arreglo están en una posición específica, podemos recuperarlos en $O(1)$.


## Listas y tuplas

En python tenemos dos tipos de arreglos: Listas y tuplas
* **Listas** son arreglos dinámicos que nos permiten modificar y redimensionar los datos que estamos almacenando.
* **Tuplas** son arreglos estáticos cuyo contenido es fijo e inmutable.



## Listas y tuplas

La memoria del sistema en una computadora se puede considerar como una serie de cubos numerados, cada uno capaz de contener un número.

Python almacena datos en estos cubos *por referencia*, lo que significa que el número en sí simplemente apunta o se refiere a los datos que realmente nos interesan.

Como resultado, estos cubos pueden almacenar cualquier tipo de datos que queramos.

## Listas y tuplas

Cuando queremos crear un arreglo (y, por lo tanto, una lista o una tupla), primero debemos asignar un bloque de memoria del sistema (donde cada sección de este bloque se usará como un puntero de tamaño entero a los datos reales).

Esto implica ir al kernel del sistema y solicitar el uso de $\texttt{N}$ cubos consecutivos.

![system_memory.png](attachment:system_memory.png)




## Listas

Una lista se crea encerrando una lista de elementos separados por comas entre corchetes cuadrados:

La lista de Python puede contener diferentes tipos de elementos; un elemento de una lista puede ser cualquier objeto de Python.

La función de lista incorporada más básica es la $\texttt{len}$ ,que devuelve el número de elementos en una lista:

## Indices de listas

Python comienza a contar desde 0; pedir el elemento 0 devuelve el primer elemento de la lista, pedir el elemento 1 devuelve el segundo elemento, y así sucesivamente.

Si los índices son números negativos, indican posiciones que cuentan desde el final de la lista, siendo -1 la última posición de la lista, -2 la penúltima posición, y así sucesivamente.

## Segmentación de lista

Python puede extraer o asignar a una sublista completa con una operación conocida como *slicing*. En vez de usar <code>list[index]</code> para extraer el elemento del índice, utilizamos <code>list[index1:index2]</code>
para extraer todos los elementos, incluidos <code> index1</code> y hasta (pero sin incluir) <code> index2</code> en una nueva lista.

También es posible no definir <code>index1</code> o <code>index2</code>. Dejando fuera <code>index1</code> significa "Ir desde el principio de la lista" y dejando fuera <code>index2</code> significa "Ir al final de la lista":


Omitiendo ambos índices crea una nueva lista que va desde el principio hasta el final de la lista original, es decir, copia la lista.

## Modificación de listas

Puede usar la notación de índice de lista para modificar una lista, así como para extraer un elemento de ella. Coloque el índice en el lado izquierdo del operador de asignación:

La notación de slicing también se puede usar aquí. Escribir algo como <code>list_a[index1:index2] = list_b</code> ocasiona que todos los elementos de <code>list_a</code> entre <code>index1</code> y <code>index1</code> sean reemplazado por los elementos de <code>list_b</code>.

<code>list_b</code> puede tener más o menos elementos de los que se eliminan <code>list_a</code>, en cuyo caso es alterado el tamaño de <code>list_a</code>.



Agregar un solo elemento a la lista es una operación tan común que hay un método especial <code>append</code> (función asociada) para ello

Puede ocurrir un problema si intenta agregar una lista a otra. La lista se agrega como un elemento único de la lista principal:

El método <code>extend</code> es como el método <code>append</code> excepto que le permite agregar una lista a otra:


Hay también un método especial <code>insert</code> para insertar un nuevo elemento de lista entre dos elementos existentes al principio de la lista. <code>insert</code> se utiliza como método de listas y toma dos argumentos adicionales.
El primer argumento adicional es la posición del índice en la lista donde debe insertarse el nuevo elemento, y el segundo es el propio elemento nuevo:

Es más fácil pensar en <code>list.insert(n,element)</code> como <code>insert</code> <code>elem</code> justo antes del *n*-ésimo elemento de la lista.


Cualquier cosa que se pueda hacer con <code>insert</code> también se puede hacer con slicing.

La instrucción <code>del</code>  es el método preferido para eliminar elementos de las lista o segmentos. No hace nada que no se pueda hacer con slicing, pero por lo general es más fácil de recordar y de leer:

El método <code>remove</code> no es lo contrario de <code>insert</code>. Mientras <code>insert</code> inserta un elemento en una ubicación específica, <code>remove</code> busca la primera instancia de un valor dado en una lista y elimina ese valor de la lista:

Si <code>remove</code> no puede encontrar nada para eliminar, genera un error.

El método <code>reverse</code> es un método de modificación de lista más especializado.
<code>reverse</code> invierte eficientemente una lista:

## Ordenamiento de listas

Las listas se pueden ordenar usando el método incorporado <code>sort</code> :

El ordenamiento también funciona con strings

El método <code>sort</code>  puede ordenar casi cualquier cosa porque Python puede comparar casi cualquier cosa. Pero hay una advertencia en el ordenamiento: El método de clave predeterminado utilizado por <code>sort</code> requiere que todos los elementos de la lista sean de tipos comparables.

## Otras operaciones comunes con listas
### Pertenencia a una lista con el operador <code>in</code>

Es fácil probar si un valor está en una lista usando el operador <code>in</code>  que devuelve un valor booleano. También puede utilizar el inverso, el operador<code>not in</code> :

# Concatenación de listas con el operador <code>+</code>

Para crear una lista concatenando dos listas existentes, se utiliza el operador <code>+</code> (concatenación de listas), el cual deja las listas a concatenar sin cambios:

# Inicialización de listas con el operador <code>*</code>

S puede usar el operador <code>*</code>  para producir una lista de un tamaño dado, que se inicializa a un valor dado. Esta operación es común para trabajar con listas grandes cuyo tamaño se conoce de antemano.

## Elemento de la lista con el valor mínimo o máximo con <code>min</code> y <code>max</code>

Se puede usar <code>min</code> y <code>max</code> para encontrar los elementos más pequeños y más grandes en una lista. Por lo general se utiliza <code>min</code> y <code>max</code> principalmente con listas numéricas
, pero puedes usarlos con listas que contengan cualquier tipo de elemento.


### Listar coincidencias con <code>count</code>

<code>count</code>  también busca a través de una lista, buscando un valor dado, pero devuelve el número de veces que el valor se encuentra en la lista en lugar de información posicional:


## Resumen de operaciones de lista
<img src="https://github.com/milocortes/diplomado_ciencia_datos_mide/blob/edicion-2024/templates/images/list_operations.png?raw=1" alt="Drawing" class="center" style="width: 800px; "/>


# Tuplas

*Tuples* son estructuras de datos que son muy similares a las listas, pero no se pueden modificar; solo se pueden crear. Las tuplas tienen roles importantes que las listas no pueden cumplir de manera eficiente, como ser llaves para los diccionarios.

## Conceptos básicos de tuplas

Crear una tupla es similar a crear una lista: asignando una secuencia de valores a una variable. Una lista es una secuencia encerrada entre <code>[]</code>;  una tupla es una secuencia encerrada entre<code>()</code>:

Después de crear una tupla, usarla es tan parecido a usar una lista que es fácil olvidar que las tuplas y las listas son tipos de datos diferentes:

La principal diferencia entre tuplas y listas es que las tuplas son inmutables. Un intento de modificar una tupla da como resultado un mensaje de error confuso, que es la forma en que Python dice que no sabe cómo asignar un elemento en una tupla:

Puede crear tuplas a partir de las existentes utilizando los operdores <code>+</code> y <code>*</code> :

Se puede hacer una copia de una tupla de cualquiera de las mismas formas que para las listas:


En el caso de tuplas de un elemento, Python requiere que el elemento de la tupla vaya seguido de una coma. En el caso de tuplas de elemento cero (vacías), no hay problema.

## Empaquetando y desempaquetando tuplas

Python permite que aparezcan tuplas en el lado izquierdo de un operador de asignación, en cuyo caso las variables en la tupla reciben los valores correspondientes de la tupla en el lado derecho del operador de asignación:

Este ejemplo se puede escribir de manera aún más simple, porque Python reconoce tuplas en un contexto de asignación incluso sin los paréntesis que las encierran:

Una línea de código ha reemplazado las siguientes cuatro líneas de código


El empaquetado y desempaquetado también se puede realizar utilizando delimitadores de lista:

## Conversión entre listas y tuplas

Las tuplas se pueden convertir fácilmente en listas con la función <code>list</code>, que toma cualquier secuencia como argumento y produce una nueva lista con los mismos elementos que la secuencia original.

De manera similar, las listas se pueden convertir en tuplas con la función <code>tuple</code> ,
que hace lo mismo pero produce una nueva tupla en lugar de una nueva lista:

In [5]:
la_tupla = 1,2,3,4
type(la_tupla)

tuple

In [11]:
la_lista = list(la_tupla)
la_lista

[1, 2, 3, 4]

In [12]:
tuple(la_lista)

(1, 2, 3, 4)

In [9]:
[elemento for elemento in la_tupla]

[1, 2, 3, 4]

# Conjuntos (Sets)

Un *conjunto* en Python es una colección desordenada de objetos utilizados cuando la pertenencia y la unicidad en el conjunto son las cosas principales que necesita saber sobre ese objeto.

Como las llaves de un diccionario, los elementos de un conjunto deben ser inmutables y hasheables.

Esto significa que los números enteros, flotantes, strings y tuplas pueden ser miembros de un conjunto, pero las listas, los diccionarios y los conjuntos en sí mismos, no.

## Operaciones con conjuntos

Además de las operaciones que aplican a las colecciones en general, tales como <code>in</code>, <code>len</code>, e iteración con <code>for</code> loops, los conjuntos tienen varias operaciones específicas del conjunto:

In [22]:
el_conjunto = {1,23, 1.2, True, "ervfvf"}


In [27]:
x = set([1,2,3,4,5,5,5,6,6,7,8])
x

{1, 2, 3, 4, 5, 6, 7, 8}