# Tipos de dato estructurados

Los tipos de datos en Python se pueden clasificar en varias categorías principales, cada una con sus propias características y usos. A continuación se presenta una tabla que resume las categorías de tipos de datos más comunes en Python:

| Categoría   | Nombre        | Tipos                                                             | Mutable/Inmutable   |
|:------------|:--------------|:------------------------------------------------------------------|:--------------------|
| Número      | Booleanos     | bool (Ej: True o False)                                           | Inmutable           |
| (Atómicos)   | Enteros       | int o long (Ej: 3)                                                | Inmutable           |
|              | Coma flotante | float (real) (Ej: 2.5)                                            | Inmutable           |
|              | Complejos     | complex (parte real e imaginaria) (Ej: 2+1j)                      | Inmutable           |
| Secuencias  | Listas        | list(conjunto de elementos heterogéneos)                          | Mutable             |
|              | Tuplas        | tuple (conjunto de elementos heterogéneos)                        | Inmutable           |
|              | Rango         | range (array de enteros)                                          | Inmutable           |
|              | Cadenas       | str (cadena de caracteres encerrada en comillas dobles o simples) | Inmutable           |
| Mapas       | Hashtables    | dict (lista con campos “clave”)                                   | Mutable             |
| Conjuntos   | Conjuntos     | set (colección no ordenada, heterogénea, sin elementos repetidos) | Mutable             |

La diferencia entre se tipos mutables e inmutables radica en si el valor del objeto puede cambiar después de su creación. Los tipos mutables, como las listas y los diccionarios, permiten modificar su contenido, mientras que los tipos inmutables, como las tuplas y las cadenas de texto, no permiten cambios una vez creados.

La diferencia entre secuencias, mapas y conjuntos radica en la forma en que almacenan y acceden a los datos. Las secuencias mantienen un orden y permiten el acceso por índice, los mapas utilizan pares clave-valor para almacenar datos, y los conjuntos son colecciones no ordenadas que no permiten elementos duplicados. Todo esto lo veremos en detalle en las siguientes secciones.

## Listas

Las listas agrupan datos. Muchos lenguajes tienen arrays (veremos esos en python más adelante). Pero a diferencia de los arrays en la mayoría de los lenguajes, las listas pueden contener datos de diferentes tipos — no necesitan ser homogéneas. Los datos pueden ser una mezcla de enteros, números en punto flotante o complejos, cadenas, u otros objetos (incluyendo otras listas).

Al ser un objeto mutable, las listas pueden ser modificadas después de su creación: se pueden agregar, eliminar o cambiar elementos.



###Definición de listas

Una lista se define usando corchetes:

In [22]:
a = [1, 2.0, "my list", 4]
b = [] # Lista vacía

Podemos ver la lista completa imprimiéndola:

In [13]:
print(a)
print(b)

[1, 2.0, 'my list', 4]
[]


### Acceso a listas

Podemos acceder una lista para obtener un solo elemento utilizando el nombre de la lista seguido del índice (de tipo entero) del elemento entre corchetes. 

```{important}
En Python, los índices de las listas comienzan en 0. 
```


In [16]:
print(a[2])
print(a[-1]) # Acceso al último elemento de la lista
a[0:2] # Acceso a una porción de la lista

my list
4


[1, -2.0]

### Modificar elementos

Podemos cambiar elementos simplemente asignando un nuevo valor al índice correspondiente:

In [18]:
a[1] = -5.0
a

[1, -5.0, 'my list', 4]

### Añadir y eliminar elementos

Como todo en Python, una lista es un objeto que es instancia de una clase. Las clases tienen métodos (funciones) que saben cómo operar sobre un objeto de esa clase.

Hay muchos métodos que funcionan con listas. Dos de los más útiles son:
- `append`, para añadir al final de una lista
- `insert`, para añadir un elemento en una posición específica
- `pop`, para eliminar un elemento (si no ponemos nada, eliminará el último)
- `clear`, para borrar la lista completa

In [19]:
a.append(6)
print(a)
a.insert(2, "new element")
print(a)

[1, -5.0, 'my list', 4, 6]
[1, -5.0, 'new element', 'my list', 4, 6]


In [23]:
a.pop(1)
print(a)


[1, 'my list', 4]


## Tuplas

Las tuplas son similares a las listas en que pueden contener una colección de elementos heterogéneos. Sin embargo, a diferencia de las listas, las tuplas son inmutables, lo que significa que una vez creadas, no se pueden modificar (no se pueden agregar, eliminar o cambiar elementos). Esto las hace útiles para almacenar datos que no deben cambiar a lo largo del tiempo, como coordenadas geográficas o registros de datos fijos.

### Definición de tuplas
Las tuplas se definen utilizando paréntesis `()` en lugar de corchetes `[]`. Podemos ver la tupla completa utilizando la función `print()`:



In [None]:
tuple1 = (1, 2.0, "my tuple", 4)
tuple2 = () # Tupla vacía
print(tuple1)
print(tuple2)


### Acceso a tuplas
Al igual que las listas, podemos acceder a los elementos de una tupla utilizando índices:

In [None]:
print(tuple1[2])

No podremos modificar los elementos de una tupla después de su creación, ya que son inmutables. Por tanto, cualquier intento de asignar un nuevo valor a un índice específico resultará en un error.

In [None]:
tuple1[0]= 10 # Esto generará un error porque las tuplas son inmutables

Si queremos modificar una tupla, podemos convertirla en una lista, hacer los cambios necesarios y luego convertirla de nuevo en una tupla.

In [None]:
tuple1 = (1, 2.0, "my tuple", 4)
list_from_tuple = list(tuple1)
list_from_tuple[0] = 10  # Modificar el primer elemento
modified_tuple = tuple(list_from_tuple)
print(modified_tuple)  # Salida: (10, 2.0, "my tuple", 4)

## Rangos (`range`)

Los rangos son secuencias inmutables de números enteros que se utilizan comúnmente para generar secuencias de números en bucles `for` o para crear listas de números enteros. La función `range()` genera un objeto de rango que representa una secuencia de números enteros dentro de un rango especificado.

### Definición de rangos
La función `range()` puede tomar uno, dos o tres argumentos:
- `range(fin)`: Genera números desde 0 hasta `fin - 1`.
- `range(ini, fin)`: Genera números desde `ini` hasta `fin - 1`.
- `range(ini, fin, inc)`: Genera números desde `ini` hasta `fin - 1`, incrementando en `inc`.

In [None]:
r1= range(5)          # Números del 0 al 4
r2= range(2, 7)       # Números del 2 al 6
r3= range(1, 10, 2)   # Números del 1 al 9, de 2 en 2


No obstante, no podemos imprimir directamente un objeto de rango para ver sus elementos. Esto ocurre porque un objeto de rango no almacena todos los números en memoria, sino que genera cada número sobre la marcha cuando se accede a él.

Para visualizar los elementos de un rango, podemos convertirlo en una lista utilizando la función `list()`. O bien, usar un bucle `for` para iterar sobre los elementos del rango y mostrarlos uno por uno.

In [None]:
print(r1) # Esto no mostrará los elementos del rango
print(list(r1)) # Convertir el rango a una lista para ver sus elementos

for num in r2:
    print(num)

### Acceso a los rangos

Podemos acceder a un elemento de un rango utilizando índices, similar a las listas y tuplas. 

In [None]:
print(r1[2])  # Acceso al tercer elemento del rango
print(r2[-1]) # Acceso al último elemento del rango
print(r3[1:4])  # Acceso a una porción del rango

## Cadenas de caracteres

Las cadenas de caracteres (strings) son secuencias inmutables de caracteres encerradas entre comillas simples (`'`) o dobles (`"`). Al igual que las tuplas, las cadenas no pueden ser modificadas después de su creación.

### Definición de cadenas
Las cadenas se definen encerrando texto entre comillas simples o dobles:

In [None]:
cadena1 = "Hola, mundo!"
cadena2 = 'Python es genial.'

print(cadena1)
print(cadena2)

### Acceso a caracteres en una cadena
Para acceder a una cadena, podemos utilizar índices de manera similar a las listas y tuplas:

In [None]:
print(cadena1[7])  # Acceso al carácter en el índice 7
print(cadena2[-1]) # Acceso al último carácter de la cadena
print(cadena1[0:4])  # Acceso a una porción de la cadena


## Diccionarios
Los diccionarios son estructuras de datos que almacenan pares clave-valor. Cada valor en un diccionario está asociado a una clave única, lo que permite un acceso rápido y eficiente a los valores mediante sus claves. Los diccionarios son mutables, lo que significa que podemos agregar, eliminar o modificar pares clave-valor después de su creación.

### Definición de diccionarios
Los diccionarios se definen utilizando llaves `{}` y pares clave-valor separados por dos puntos `:`. 
- Las claves deben de ser cadenas o valores enteros
- Los valores pueden ser de cualquier tipo (entero, real, listas, tuplas, otro diccionario...)
 Por ejemplo:


In [None]:
mi_diccionario = {'clave1': 'valor1', 'clave2': 'valor2'}
print(mi_diccionario)

### Acceso a valores en un diccionario
Podemos acceder a los valores en un diccionario utilizando sus claves entre corchetes:

In [None]:
print(mi_diccionario['clave1'])  # Acceso al valor asociado a 'clave1'

### Modificación de diccionarios
Podemos modificar pares clave-valor asignando un valor a una clave. No se pueden modificar las claves una vez creadas.

In [None]:

mi_diccionario['clave1'] = 'nuevo_valor1'  # Modificar el valor asociado a 'clave1'
print(mi_diccionario)   

### Añadido /borrado de elementos en un diccionario

Podemos añadir nuevos pares clave-valor simplemente asignando un valor a una nueva clave. 

Para eliminar un par clave-valor, podemos usar el método `pop()`. Podemos borrar el diccionario entero utilizando el método `clear()`, igual que en las listas.


In [None]:
mi_diccionario['clave3'] = 'valor3'  # Agregar un nuevo par clave-valor
mi_diccionario.pop('clave2')  # Elimina el par clave-valor asociado a 'clave2'

print(mi_diccionario)
mi_diccionario.clear()  # Elimina todos los pares clave-valor del diccionario
print(mi_diccionario)

## Conjuntos (set)

Los conjuntos son colecciones no ordenadas de elementos únicos. A diferencia de las listas y tuplas, los conjuntos no permiten elementos duplicados y no mantienen un orden específico. Los conjuntos son mutables, lo que significa que podemos agregar o eliminar elementos después de su creación.

### Definición de conjuntos
Los conjuntos se definen utilizando llaves `{}` o la función `set()`. Por ejemplo:

### Acceso a elementos en un conjunto
Dado que los conjuntos son no ordenados, no podemos acceder a sus elementos mediante índices como en las listas o tuplas. En su lugar, podemos verificar la presencia de un elemento utilizando el operador `in`:

```python
mi_conjunto = {1, 2, 3, 4, 5}
print(3 in mi_conjunto)  # Devuelve True
print(6 in mi_conjunto)  # Devuelve False
```

### Modificación de conjuntos
Podemos agregar elementos a un conjunto utilizando el método `add()` y eliminar elementos utilizando el método `remove()` o `discard()`. La diferencia entre estos dos métodos es que `remove()` genera un error si el elemento no existe, mientras que `discard()` no lo hace.
```python
mi_conjunto = {1, 2, 3}
mi_conjunto.add(4)  # Agrega el elemento 4 al conjunto
mi_conjunto.remove(2)  # Elimina el elemento 2 del conjunto
print(mi_conjunto)  # Muestra {1, 3, 4}
```


## Algunas operaciones interesantes

Los tipos de dato estructurados tienen una serie de métodos propios que dependen de la definición (de su clase). Algunos métodos son comunes a varios tipos de datos estructurados, como listas, tuplas y cadenas. Nombramos por ejemplo index, count, min, max, etc. En diccionarios tenemos otros métodos importantes como items, values, keys, etc. Muchos los veremos en prácticas. 

Destacamos también la función `len()` devuelve la longitud de un tipo de dato estructurado. 

In [None]:
len(a)


1


0

```{important}
Las listas o las tuplas (mucho menos las cadenas) NO son matrices. Por tanto, no podemos operar con ellas como si lo fueran  (por ejemplo, no podemos hacer multiplicaciones de listas o tuplas). Si usamos el operador `*` con una lista,tupla o cadena, lo que haremos será repetir su contenido. Si usamos el operador `+`, lo que haremos será concatenar dos listas, tuplas o cadenas. Si usamos operadores matemáticos como `-`, `/`, `//`, o `**`, obtendremos un error.
Para trabajar con matrices, usaremos la librería `numpy`, que veremos más adelante.
```

In [None]:
a = [1, 2.0, "my list", 4]
print(a*2) # Repetición de la lista
a + [7, 8, 9] # Concatenación de listas
"cadena 1"+" cadena 2" # Concatenación de cadenas

# Para concatenar diccionarios, podemos usar el método update() 
dict1 = {'a': 1, 'b': 2}
dict2 = {'c': 3, 'd': 4}

dict1.update(dict2)
print(dict1)

[1, 'my list', 4, 1, 'my list', 4]


[1, 'my list', 4, 7, 8, 9]

Podemos utilizar los operadores de comparación (`==`, `!=`, `<`, `>`, `<=`, `>=`) para comparar cualquier tipo de dato estructurado. La comparación se realiza elemento por elemento, y el resultado es un valor booleano (`True` o `False`). 
Las operaciones de comparación funcionan de la siguiente manera:
- `==`: Devuelve `True` si todos los elementos son iguales en ambas estructuras.
- `!=`: Devuelve `True` si al menos un elemento es diferente entre las dos estructuras.
- `<`, `>`, `<=`, `>=`: 
  - En secuencias (listas, tuplas, rangos y cadenas): Compara las secuencias elemento por elemento, y **se detiene en la primera diferencia encontrada**.
    - Para números, usa la comparación numérica normal
    - Para cadenas, usa el orden lexicográfico
  - En mapas (diccionarios): Estas comparaciones no están definidas y generarán un error si se intentan usar.
  - En conjuntos (set): Estas comparaciones se utilizan para verificar las relaciones de subconjunto y superconjunto entre conjuntos.


In [33]:
print([1, 2, 3] == [1, 2, 3])  # True
print((1, 2) != (1, 3))      # True
print("abc" < "abd")        # True
print([1, 2, 5] <= [1, 2, 4]) # True
print([3, 4, 6] >= [1, 5, 1]) # True Primer elemento: 3 > 1, por lo que la comparación se detiene aquí y devuelve `True`. No importa el resto de elementos porque la primera comparación ya determinó el resultado
dict1 = {'a': 1, 'b': 2}
dict2 = {'c': 3, 'd': 4}
# Esto generará un error
#dict1 < dict2  # TypeError: unsupported operand type(s) for <: '
print(dict1 == dict2)  # False
set1 = {1, 2, 3}
set2 = {3, 4, 5}
print(set1 != set2)  # True
print(set1 <= {1, 2, 3, 4})  # True


True
True
True
False
True
False
True
True


### Operador de pertenencia (`in` y `not in`)
El operador `in` se utiliza para verificar si un elemento está presente en una estructura de datos estructurada, mientras que el operador `not in` verifica si un elemento no está presente. Estos operadores devuelven un valor booleano (`True` o `False`) según el resultado.


In [None]:
# Ejemplos con listas
mi_lista = [1, 2, 3, 4, 5]
print(3 in mi_lista)  # Devuelve True
print(6 not in mi_lista)  # Devuelve True

# Ejemplo con set
mi_conjunto = {1, 2, 3, 4, 5}
print(3 in mi_conjunto)  # Devuelve True
print(6 not in mi_conjunto)  # Devuelve True

### Mutabilidad e inmutabilidad: Operador de identidad (`is` y `is not`)

La mutabilidad e inmutabilidad de los tipos de datos estructurados afecta cómo se comportan ciertos operadores. Por ejemplo, la copia de objetos mutables puede llevar a resultados inesperados si no se comprende bien cómo funcionan las referencias en Python.

Por ejemplo, si tenemos una lista `l1`:
```python
l1 = [1, 2, 3]
```
Y hacemos una copia de la lista asignándola a otra variable `l2`:
```python
l2 = l1
```
Ambas variables `l1` y `l2` apuntan al mismo objeto en memoria. Si modificamos `l2`, también estaremos modificando `l1`:


In [None]:
l1 = [1, 2, 3]
l2 = l1
l2.append(4)
print(l1) 


Por tanto, al copiar una lista (o cualquier tipo de dato u objeto mutable) a otra variable, ambas variables apuntan al mismo objeto en memoria.  

En cambio, al copiar una tupla (o cualquier otro tipo de dato inmutable), ambas variables apuntan a objetos diferentes en memoria, y modificar una no afecta a la otra.

In [None]:
t1 = (0, -1, 5)
t2 = t1
t1=(1, 2, 3, 4)
print(t2)


Podemos comprobar si dos variables apuntan al mismo objeto en memoria utilizando el operador de identidad `is` y `is not`. Este operador devuelve `True` si ambas variables apuntan al mismo objeto, y `False` en caso contrario. Por ejemplo:

In [None]:
t3=t1
print(l1 is l2)  # Devuelve True, ambas variables apuntan al mismo objeto
print(t1 is t3)  # Devuelve False, las variables apuntan a objetos diferentes

```{important}
No confundir el operador de identidad `is` con el operador de igualdad `==`. El operador `==` compara los valores de los objetos, mientras que el operador `is` compara las identidades de los objetos en memoria.
```


In [None]:
print(t1==t3)  # Devuelve True, ambos objetos tienen el mismo valor