# Estructuras de datos

En Python, las **estructuras de datos** son formas de **organizar y almacenar datos** para que puedan ser utilizados de manera eficiente.
En este artículo revisaremos qué cuales son los diversos tipos de datos que podemos manipular en python, cuáles son sus características, ventajas y desventajas. En particular hablaremos de las:
* **listas**
* **tuplas**
* **sets**
* **diccionarios**


# Listas
Una **lista** es una **colección ordenada de elementos (o valores)**. 
Los elementos de una lista van encerrados entre corchetes `[ ]`. Por ejemplo:

In [1]:
frutas = ['manzana', 'platano', 'cereza']
print(frutas)

['manzana', 'platano', 'cereza']


```{note} Características de las listas
* **Mutabilidad**: Los elementos de una lista pueden ser modificados después de la creación de la lista
* **Ordenadas**: Los elementos de una lista están ordenados y mantienen el orden en el que se añadieron. Su posición lo indica su índice.
* Pueden contener **cualquier tipo de dato**: Una lista puede contener elementos de diferentes tipos de datos, como enteros, cadenas, flotantes, u otras listas
```

## Índices
Los elementos (o valores) de una lista se pueden acceder utilizando **índices numéricos**. El índice **¡comienza en 0 para el primer elemento!** y se incrementa de forma consecutiva.

<img src=https://railsware.com/blog/wp-content/uploads/2018/10/positive-indexes.png>

En este caso el valor `red` tiene el índice `0`, el valor `green` tiene el valor `1`, ...

Las listas son **mutables**, lo que significa que puedes cambiar su contenido. Por ejemplo, podemos añadir un elemento:

In [2]:
frutas.append('naranja')  # Podemos agregar un elemento a la lista
print(frutas)

['manzana', 'platano', 'cereza', 'naranja']


A continuación, se listan una serie de métodos que aprovechan la **mutabilidad** de las listas.

## Métodos de manipulación de listas
Como se comentó las listas son **mutables**, es decir, pueden modificarse. A continuación, se listan una serie de métodos que aprovechan la mutabilidad de las listas.

Empezamos creando una **lista inicial:**

In [43]:
listaAnimales = ["perro", "gato", "elefante"]

1. **append(elemento)**: Agrega un elemento al final de la lista.   

In [42]:
listaAnimales.append("jirafa")
print("Después de append:", listaAnimales)

Después de append: ['perro', 'gato', 'elefante', 'jirafa']


2. **extend(iterable)**: Agrega todos los elementos de un iterable al final de la lista.

In [5]:
listaAnimales.extend(["león", "tigre"])
print("Después de extend:", listaAnimales)

Después de extend: ['perro', 'gato', 'elefante', 'jirafa', 'león', 'tigre']


3. **insert(index, elemento)**: Inserta un elemento en una posición específica de la lista.

In [6]:
listaAnimales.insert(2, "zorro")  # Inserta "zorro" en la posición 2
print("Después de insert:", listaAnimales)

Después de insert: ['perro', 'gato', 'zorro', 'elefante', 'jirafa', 'león', 'tigre']


4. **remove(elemento)**: Elimina la primera aparición de un elemento de la lista.

In [7]:
listaAnimales.remove("elefante")
print("Después de remove:", listaAnimales) 

Después de remove: ['perro', 'gato', 'zorro', 'jirafa', 'león', 'tigre']


5. **pop(index)**: Elimina y devuelve el elemento en una posición específica de la lista.

In [8]:
elemento_eliminado = listaAnimales.pop(3)  # Elimina el elemento en la posición 3
print("Después de pop:", listaAnimales)  # Salida: ['perro', 'gato', 'zorro', 'león', 'tigre']
print("Elemento eliminado:", elemento_eliminado)  # Salida: 'jirafa'

Después de pop: ['perro', 'gato', 'zorro', 'león', 'tigre']
Elemento eliminado: jirafa


6. **index(elemento)**: Devuelve el índice de la primera aparición de un elemento en la lista.

In [9]:
indice = listaAnimales.index("zorro")
print("Índice de 'zorro':", indice)  # Salida: 2

Índice de 'zorro': 2


7. **count(elemento)**: Cuenta la cantidad de veces que un elemento aparece en la lista.

In [10]:
conteo = listaAnimales.count("perro")
print("Cantidad de veces que aparece 'perro':", conteo)

Cantidad de veces que aparece 'perro': 1


8. **sort()**: Ordena los elementos de la lista en orden ascendente.

In [11]:
listaAnimales.sort()
print(" Después de sort: ", listaAnimales)

 Después de sort:  ['gato', 'león', 'perro', 'tigre', 'zorro']


9. **reverse()**: Invierte el orden de los elementos en la lista.

In [12]:
listaAnimales.reverse()
print(" Después de reverse: ", listaAnimales)

 Después de reverse:  ['zorro', 'tigre', 'perro', 'león', 'gato']


### Otros métodos

Empezamos creando una **lista inicial de números**:

In [13]:
listaNumeros = [10, 30, 20, 50, 40]

1. **sum(lista)**: Suma los elementos en la lista.

In [14]:
suma_total = sum(listaNumeros)
print("Suma de los elementos:", suma_total)

Suma de los elementos: 150


2. **min(lista)**: Calcula el mínimo de los elementos de la lista.

In [15]:
minimo = min(listaNumeros)
print("Mínimo de los elementos:", minimo)

Mínimo de los elementos: 10


3. **max(lista)**: Calcula el máximo de los elementos de la lista.

In [16]:
maximo = max(listaNumeros)
print("Máximo de los elementos:", maximo)

Máximo de los elementos: 50


4. **len(lista)**: Cuenta la cantidad de elementos en la lista.

In [17]:
cantidad_elementos = len(listaNumeros)
print("Cantidad de elementos en la lista:", cantidad_elementos)

Cantidad de elementos en la lista: 5


5. **in (lista)**: Comprueba si algo está en una lista. La salida es TRUE o FALSE.

In [18]:
respuesta = 30 in(listaNumeros)
print(respuesta)

True


In [19]:
respuesta = 31 in(listaNumeros)
print(respuesta)

False


## Slices
Los **slices** en Python son una herramienta muy útil, que nos permite **extraer porciones de secuencias de elementos** (como listas, tuplas o cadenas) con muy poco código. La sintaxis básica para crear un slice en Python es la siguiente:
```python
slice[inicio:fin:paso]
```

```{note} Explicación
* inicio: Índice donde comienza el slice (incluido)
* fin: Índice donde termina el slice (no incluido)
* paso: Tamaño del paso o incremento entre elementos del slice (opcional)
```

Ejemplo:

In [20]:
# Definimos una lista de frutas
listaFrutas = ["manzana", "banana", "cereza", "dátil", "naranja", "uva"]

# Realizamos un slicing de la lista
# - Comenzamos en el índice 2 (que es "cereza")
# - Terminamos en el índice 5 (sin incluir "uva")
# - El paso es 1, lo que significa que tomamos cada elemento en el rango
sliceFrutas = listaFrutas[2:5:1]

# Imprimimos la sublista resultante
print(sliceFrutas)  # Esto mostrará: ['cereza', 'dátil', ' naranja']

['cereza', 'dátil', 'naranja']


### Consideraciones especiales
#### Omisión de valores
Podemos omitir uno, varios, o incluso todos los parámetros del Slice. Este se comportará distinto cada omisión.

```{admonition} Si no especificamos...
:class:tip
* El inicio, el slice comenzará desde el primer elemento. `lista[x:]`
* El fin, el slice terminará en el último elemento.  `lista[:x]`
* El paso, el slice usará un paso de 1
```

In [21]:
listaFrutas = ["manzana", "banana", "cereza", "dátil", "naranja", "uva"]

primeros_salvo_tres = listaFrutas[3:]  # Extrae los elementos del 3 al final
primeros_tres = listaFrutas[:3]  # Extrae los tres primeros elementos

print(primeros_salvo_tres)
print(primeros_tres)

['dátil', 'naranja', 'uva']
['manzana', 'banana', 'cereza']


#### Uso de índices negativos

Python permite usar **índices negativos** para referirse a elementos relativos final de la secuencia (en lugar que desde el principio). Parece un poco complicado, y al principio lía un poco. Veamos algún ejemplo:

In [22]:
listaFrutas = ["manzana", "banana", "cereza", "dátil", "naranja", "uva"]

ultimos_tres = listaFrutas[-3:]  # Extrae los últimos tres elementos
primeros_salvo_tres = listaFrutas[:-3]  # Extrae los elementos, salvo los tres últimos

print(ultimos_tres)
print(primeros_salvo_tres)


['dátil', 'naranja', 'uva']
['manzana', 'banana', 'cereza']


## 2. Tuplas
Una **tupla** es una *colección ordenada de elementos*, similar a una lista.

La diferencia significativa es que las tuplas son **inmutables**. Esto significa que una vez que se crea una tupla, no puedes cambiar su contenido. Las tuplas están encerradas entre paréntesis `( )`.

In [23]:
tupla_frutas = ('manzana', 'plátano', 'cereza')
print(tupla_frutas)

print(tupla_frutas[1])  # Salida: 'plátano'

('manzana', 'plátano', 'cereza')
plátano


### 2.1. Métodos aplicables a las tuplas
Las tuplas son **inmutables**, por lo que no tienen métodos que agreguen o eliminen elementos. Sin embargo, tienen dos métodos:

In [24]:
tuplaFrutas = ('manzana', 'plátano', 'cereza', 'plátano')

1. **count(elemento)**: Devuelve el número de veces que un valor ocurre en una tupla.

In [25]:
tuplaFrutas.count('plátano')

2

2. **index(elemento)**: Devuelve el primer índice en el cual un valor ocurre en una tupla.

In [26]:
tuplaFrutas.index('cereza')

2

In [27]:
# Ejemplo

tuplaNombres = ("Alberto", "María", "Sara", "Julián", "María")
conteo = tuplaNombres.count("María")
indice = tuplaNombres.index("Sara")


print(f"En la tupla, María aparece {conteo} veces y el índice de Sara es el {indice}")

En la tupla, María aparece 2 veces y el índice de Sara es el 2


## 3. Conjuntos / Sets
Un conjunto es una colección no ordenada de elementos únicos. Son útiles cuando quieres llevar un registro de una colección de elementos, pero no te importa su orden, no te preocupan los duplicados y deseas realizar operaciones de conjuntos como unión e intersección.

Los conjuntos están encerrados en llaves `{ }`. Por lo que su notación luce similar a los conjuntos de matemáticas (ejemplo: $A=\{1,2,3\}$ )

In [28]:
conjunto_frutas = {'manzana', 'plátano', 'cereza', 'manzana'}
print(conjunto_frutas)  # Output: {'cereza', 'plátano', 'manzana'} (se eliminan los duplicados, el orden puede variar)

{'plátano', 'manzana', 'cereza'}


### Métodos de manipulación de conjuntos
* add(elemento): Agrega un elemento al conjunto.
* remove(elemento): Elimina un elemento del conjunto. Lanza un KeyError si el elemento no se encuentra.
* discard(elemento): Elimina un elemento del conjunto si está presente.
* pop(): Elimina y devuelve un elemento arbitrario del conjunto. Lanza un KeyError si el conjunto está vacío.
* clear(): Elimina todos los elementos del conjunto.
* union(otro_conjunto): Devuelve un nuevo conjunto con elementos del conjunto y todos los demás.
* union(): Devuelve un nuevo conjunto con los elementos que están en ambos conjuntos
* intersection(otro_conjunto): Devuelve un nuevo conjunto con elementos comunes al conjunto y todos los demás.
* difference(otro_conjunto): Devuelve un nuevo conjunto con elementos en el conjunto que no están en los demás.

## 3. Diccionarios

Un **diccionario** es una colección no ordenada de **pares clave-valor**, donde cada **clave** debe ser **única**. Este tipo de datos es útil para almacenar relaciones entre pares de datos.

Los diccionarios también están encerrados en llaves `{ }`, pero se distinguen por el uso de dos puntos : para separar las **claves** y los **valores**.

<img src=https://www.programiz.com/sites/tutorial2program/files/python_dictionary-example.png>

In [29]:
pais_capital = {'Alemania': 'Berlín',
                 'Canada': 'Otawa',
                 'Reino Unido': 'Londres'}
# Para llamar la información en una llave debe usar la siguiente estructura diccionario["llave"]
print(pais_capital['Reino Unido'])  # Salida: 'Londres'

Londres


### Métodos de manipulación de diccionarios

In [30]:
# Crear un diccionario de países y sus poblaciones
pais_poblacion = {
    'China': 1444216107,
    'India': 1393409038,
    'Estados Unidos': 331002651,
    'Indonesia': 273523615,
    'Pakistán': 225199937
}

1. **keys()**: Devuelve una nueva vista de las claves del diccionario.

In [31]:
claves = pais_poblacion.keys()
print("Claves del diccionario (países):", claves)
# Salida: dict_keys(['China', 'India', 'Estados Unidos', 'Indonesia', 'Pakistán'])

Claves del diccionario (países): dict_keys(['China', 'India', 'Estados Unidos', 'Indonesia', 'Pakistán'])


2. **values()**: Devuelve una nueva vista de los valores del diccionario.

In [32]:
valores = pais_poblacion.values()
print("Valores del diccionario (poblaciones):", valores) 
# Salida: dict_values([1444216107, 1393409038, 331002651, 273523615, 225199937])

Valores del diccionario (poblaciones): dict_values([1444216107, 1393409038, 331002651, 273523615, 225199937])


3. **items()**: Devuelve una nueva vista de los elementos del diccionario (pares clave: valor).

In [33]:
elementos = pais_poblacion.items()
print("Elementos del diccionario (país, población):", elementos)  
# Salida: dict_items([('China', 1444216107), ('India', 1393409038), ('Estados Unidos', 331002651), ('Indonesia', 273523615), ('Pakistán', 225199937)])

Elementos del diccionario (país, población): dict_items([('China', 1444216107), ('India', 1393409038), ('Estados Unidos', 331002651), ('Indonesia', 273523615), ('Pakistán', 225199937)])


4. **get(clave, por_defecto)**: Devuelve el valor para clave si la clave está en el diccionario, de lo contrario devuelve por_defecto.

In [34]:
poblacion_india = pais_poblacion.get('India', 'No disponible')
print("Población de India:", poblacion_india)  # Salida: 1393409038

Población de India: 1393409038


In [35]:
# Intentar obtener una clave que no existe
poblacion_brasil = pais_poblacion.get('Brasil', 'No disponible')
print("Población de Brasil:", poblacion_brasil)  # Salida: 'No disponible'

Población de Brasil: No disponible


5. **update(clave:valor_actualizar)**: Actualiza el diccionario con los pares clave/valor entre paréntesis, sobrescribiendo las claves existentes o actualizándolas si ya existen.

In [36]:
pais_poblacion.update({'Brasil': 212559417, 'Pakistán': 230000000}) 
# Agrega Brasil y actualiza la población de Pakistán
print("Diccionario después de update:", pais_poblacion)  
# Salida: {'China': 1444216107, 'India': 1393409038, 'Estados Unidos': 331002651, 'Indonesia': 273523615, 'Pakistán': 230000000, 'Brasil': 212559417}

Diccionario después de update: {'China': 1444216107, 'India': 1393409038, 'Estados Unidos': 331002651, 'Indonesia': 273523615, 'Pakistán': 230000000, 'Brasil': 212559417}


6. **pop(clave)**: Elimina y devuelve el valor para clave si la clave está en el diccionario

In [37]:
poblacion_china = pais_poblacion.pop('China')
print("Diccionario después de pop:", pais_poblacion) 
print("Población de China eliminada:", poblacion_china)  # Salida: 1444216107
 
# Salida: {'India': 1393409038, 'Estados Unidos': 331002651, 'Indonesia': 273523615, 'Pakistán': 230000000, 'Brasil': 212559417}

Diccionario después de pop: {'India': 1393409038, 'Estados Unidos': 331002651, 'Indonesia': 273523615, 'Pakistán': 230000000, 'Brasil': 212559417}
Población de China eliminada: 1444216107


## Como evitar la confusion con los conjuntos
Tanto los diccionarios como los conjuntos se declaran usando corchetes `{ }`, por lo que en el caso que declares un diccionario o conjunto vacio luego puedes generar una confusion. En tal caso, puedes declarar los diccionarios y conjuntos de modo explicito de esta manera

In [38]:
miConjunto = set()
miDiccionario = dict()

## Apéndice A: Tabla comparativa

| Característica               | Listas                 | Diccionarios                     | Conjuntos                                | Tuplas                |
|:----------------------------:|:----------------------:|:--------------------------------:|:----------------------------------------:|:---------------------:|
| **Orden**                     | Ordenado               | No ordenado                     | No ordenado                              | Ordenado              |
| **Tipo de dato**              | Secuencia              | Mapeo                            | Conjunto                                 | Secuencia             |
| **Sintaxis**                  | [ ]                    | { clave : valor }                | { elemento1, elemento2 }                 | ( )                   |
| **Mutabilidad**               | Mutable                | Mutable (claves inmutables)      | Mutable                                  | Inmutable             |
| **Duplicados**                | Permite                | No permite (claves)              | No permite                               | Permite               |
| **Búsqueda por índice**       | Sí                     | No (búsqueda por clave)          | No                                       | Sí                    |
| **Búsqueda por valor**        | Sí                     | Sí (búsqueda de valores)         | Sí                                       | Sí                    |
| **Métodos principales**       | append, extend, remove | keys, values, items, get, update | add, remove, discard, union, intersection| count, index          |
| **Uso común**                 | Almacenar secuencias   | Almacenar pares clave-valor      | Almacenar colecciones sin duplicados     | Almacenar registros inmutables |


## Caso práctico: Eligiendo una estructura de datos
Suponga que usted fue elegido como asesor del código de una empresa y se encuentra con que la empresa almacena la información de sus productos de la siguiente manera

In [39]:
productos = ["Armarios", "Mesas", "Camas"]
stock = [100, 50, 75]
precios = [990, 590, 490]

¿Cuál sería una mejor manera de almacenar datos? ¿por qué eligió esa manera?

### Solución
Se ha optado por crear un **diccionario anidado**, o sea, un diccionario dentro de otro

In [40]:
# Diccionario para almacenar datos de productos
muebles_info = {
    "Armarios": {"stock": 100, "precio": 990},
    "Mesas": {"stock": 50, "precio": 590},
    "Camas": {"stock": 75, "precio": 490}
}

Esto es mejor por las siguientes razones:
* Integridad de datos: si eliminas un ítem en el diccionario, también eliminarás el resto de los datos relacionados con ese producto.
* Consistencia: todo está "adjunto" al mismo producto, así que si cambias un índice, todo también se moverá.
* Te ves obligado a agregar todos los datos relacionados de un producto.
* Sin duplicados: Los diccionarios tienen claves no duplicadas, por lo que puedes estar seguro de que solo hay un registro por producto.
* Legibilidad: Es más legible. `base["Producto B"]["stock"]` es mejor que `producto[1]` `stock[1]`.