<a href="https://colab.research.google.com/github/DiegoSReco/intro_python_para_economistas/blob/main/script_python_2_2_Estructuras_Datos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **3. Estructuras de Datos**

Python ofrece un conjunto de flexibles de estructuras que permiten organizar, almacenar y manipular datos de manera efectiva, convirtiendo información aparentemente caótica en sistemas ordenados y manejables. En esta sección exploraremos estruturas enfocadas en el analisis de datos las cuales son: **listas, conjuntos, arreglos, tuplas, diccionarios y dataframes.**

**¿Por qué es importante entender el funcionamiento de cada uno de éstas?**

- Manipular grandes volúmenes de información
- Gestionar la memoria de forma efectiva
- Optimizar el rendimiento de nuestros modelos o programas
- Resolver problemas  de forma eficiente

## Listas (`list`)
### **¿Qué són las listas?**

Una secuencia mutable que puede contener elementos de diferentes tipos ya sea númericos, cadenas de texto, booleanos, fechas o la mezcla de ellos. Por éstas características las listas son estructuras de datos flexibles.

**Sintáxis**

Para definir una lista en Python usaremos dos corchetes y los elementos dentro se separan por comas:

  ```python
lista = [e_1, e_2, e_3,...,n]  
  ```
Por ejemplo:

In [1]:
# Definir lLista de tasas de desocupación segundo trimestre 2024 (Fuente: INEGI https://www.inegi.org.mx/app/saladeprensa/noticia/9251)
list_tasas_desc = [ 3.4, 2.7, 2.4, 2.0, 3.7, 2.1, 1.6, 2.5, 4.0,
                   2.8, 2.9, 1.0, 2.4, 2.2, 3.3, 1.7, 1.6, 2.2,
                   2.6, 1.2, 2.3, 2.7, 2.6, 2.6, 2.4, 3.6, 4.0,
                   3.4, 2.4, 2.0, 1.8, 2.9 ]

#Definir lista de estados
list_estados = ["Aguascalientes", "Baja California", "Baja California Sur", "Campeche",
                 "Coahuila de Zaragoza", "Colima", "Chiapas", "Chihuahua", "Ciudad de México",
                 "Durango", "Guanajuato", "Guerrero", "Hidalgo", "Jalisco", "México",
                 "Michoacán de Ocampo", "Morelos", "Nayarit", "Nuevo León", "Oaxaca",
                 "Puebla", "Querétaro", "Quintana Roo", "San Luis Potosí", "Sinaloa",
                 "Sonora", "Tabasco", "Tamaulipas", "Tlaxcala",
                 "Veracruz de Ignacio de la Llave", "Yucatán", "Zacatecas"]
#Imprimir contenido
print(  list_tasas_desc, "\n" , "¿Qué clase objeto es list_lenguajes?", type(list_estados))


[3.4, 2.7, 2.4, 2.0, 3.7, 2.1, 1.6, 2.5, 4.0, 2.8, 2.9, 1.0, 2.4, 2.2, 3.3, 1.7, 1.6, 2.2, 2.6, 1.2, 2.3, 2.7, 2.6, 2.6, 2.4, 3.6, 4.0, 3.4, 2.4, 2.0, 1.8, 2.9] 
 ¿Qué clase objeto es list_lenguajes? <class 'list'>


* Las listas pueden contener distintos tipos de variables:

In [2]:
#Definir lista
list_ags = ["Aguascalientes", 3.4, "Baja California", 2.7]
#Imprimir contenido

print(list_ags)

['Aguascalientes', 3.4, 'Baja California', 2.7]


* Incluso pueden contener listas por lo que podemos anidar listas en listas:


In [3]:
#Definir lita anidadad
list_estados_estados = [list_tasas_desc, list_estados]

print(list_estados_estados)

[[3.4, 2.7, 2.4, 2.0, 3.7, 2.1, 1.6, 2.5, 4.0, 2.8, 2.9, 1.0, 2.4, 2.2, 3.3, 1.7, 1.6, 2.2, 2.6, 1.2, 2.3, 2.7, 2.6, 2.6, 2.4, 3.6, 4.0, 3.4, 2.4, 2.0, 1.8, 2.9], ['Aguascalientes', 'Baja California', 'Baja California Sur', 'Campeche', 'Coahuila de Zaragoza', 'Colima', 'Chiapas', 'Chihuahua', 'Ciudad de México', 'Durango', 'Guanajuato', 'Guerrero', 'Hidalgo', 'Jalisco', 'México', 'Michoacán de Ocampo', 'Morelos', 'Nayarit', 'Nuevo León', 'Oaxaca', 'Puebla', 'Querétaro', 'Quintana Roo', 'San Luis Potosí', 'Sinaloa', 'Sonora', 'Tabasco', 'Tamaulipas', 'Tlaxcala', 'Veracruz de Ignacio de la Llave', 'Yucatán', 'Zacatecas']]


### **Manejo y operaciones en listas**

Por ser uno de los objetos más flexibles las listas permiten realizar una serie de acciones sobre sus elementos como: el ordenamiento, reemplazo, modificación, operaciones aritméticas, etc.

#### **Extracción de elementos  y modificación**

* El tamaño o número de elementos en una lista los podemos calcular con la función ```len()```

In [4]:
#Tamaño lista
n_tasas = len(list_estados)
n_estados = len(list_tasas_desc)

print(n_tasas)

32


##### **Extracción**

* Para la extracción de ciertos elementos de una lista usaremos la idexación:

  ```lista[i]```
  
  Ejemplo:

In [5]:
#Extraer primer elemento de la lista de tasas
e_1 = list_tasas_desc[0]

#Extraer último
e_n = list_tasas_desc[-1]

#Otra forma de calcular último elemento
e_n = list_tasas_desc[n_tasas - 1 ]

print(f"El primer elemento es {e_1}  y el último es {e_n}")

El primer elemento es 3.4  y el último es 2.9


* Es posible extraer un rango de elementos a partir de los índices separados por ```:``` :

In [8]:
#Extraer primeros 5 elementos
print(list_tasas_desc[0:5])

#Extraer primeros 5 elementos (otra opción)
print(list_tasas_desc[1:])

#Extraer ultimos 5 elementos  (otra opción)
print(list_tasas_desc[-5:])
print(list_tasas_desc[n_tasas - 5:])



[3.4, 2.7, 2.4, 2.0, 3.7]
[2.7, 2.4, 2.0, 3.7, 2.1, 1.6, 2.5, 4.0, 2.8, 2.9, 1.0, 2.4, 2.2, 3.3, 1.7, 1.6, 2.2, 2.6, 1.2, 2.3, 2.7, 2.6, 2.6, 2.4, 3.6, 4.0, 3.4, 2.4, 2.0, 1.8, 2.9]
[3.4, 2.4, 2.0, 1.8, 2.9]
[3.4, 2.4, 2.0, 1.8, 2.9]


##### **Modificación**


Otra de las características de las listas es la **mutabilidad**, es decir, podemos modificar el contenido de una lista que ya está creada. Por lo que es posible reemplazar, borrar y agregar elementos a una lista.

**Borrar elementos**

Para borrar elementos de una lista se puede utiliza dos métodos:

* Valor de elemento
   
    ```remove()```

In [10]:
#Lista de estados
print(list_estados)

#Aplicar remove para eliminar Aguascalientes
list_estados.remove("Aguascalientes")

print(list_estados)


['Aguascalientes', 'Baja California', 'Baja California Sur', 'Coahuila de Zaragoza', 'Colima', 'Chiapas', 'Chihuahua', 'Ciudad de México', 'Durango', 'Guanajuato', 'Guerrero', 'Hidalgo', 'Jalisco', 'México', 'Michoacán de Ocampo', 'Morelos', 'Nayarit', 'Nuevo León', 'Oaxaca', 'Puebla', 'Querétaro', 'Quintana Roo', 'San Luis Potosí', 'Sinaloa', 'Sonora', 'Tabasco', 'Tamaulipas', 'Tlaxcala', 'Veracruz de Ignacio de la Llave', 'Yucatán', 'Zacatecas']
['Baja California', 'Baja California Sur', 'Coahuila de Zaragoza', 'Colima', 'Chiapas', 'Chihuahua', 'Ciudad de México', 'Durango', 'Guanajuato', 'Guerrero', 'Hidalgo', 'Jalisco', 'México', 'Michoacán de Ocampo', 'Morelos', 'Nayarit', 'Nuevo León', 'Oaxaca', 'Puebla', 'Querétaro', 'Quintana Roo', 'San Luis Potosí', 'Sinaloa', 'Sonora', 'Tabasco', 'Tamaulipas', 'Tlaxcala', 'Veracruz de Ignacio de la Llave', 'Yucatán', 'Zacatecas']


 * Para hacerlo el índice utilizamos:
     
   ```del```

In [13]:
#Imprimir primero elemento
print(list_estados[0])

#Borrar primero elemento
del list_estados[-1]

#Imprimier nuevo primero elemento
print(list_estados[-1])

Baja California Sur
Veracruz de Ignacio de la Llave


**Reemplazar elementos**

Para reemplazar elementos utilizaremos los índices, es decir, por su posición en lista de un elemento.

> **Nota**: Para encontrar la posición de algún elemento en la lista usamos la función ```index()```. Con la siguiente sintáxis ```lista.index("Valor")```


In [15]:
#Encontrar Ciudad de México
posi_cdmx = list_estados.index("Ciudad de México")

print(posi_cdmx)

list_estados[posi_cdmx] = "CDMX"

#Imprimir lista modificada
print(list_estados)

5
['Baja California Sur', 'Coahuila de Zaragoza', 'Colima', 'Chiapas', 'Chihuahua', 'CDMX', 'Durango', 'Guanajuato', 'Guerrero', 'Hidalgo', 'Jalisco', 'México', 'Michoacán de Ocampo', 'Morelos', 'Nayarit', 'Nuevo León', 'Oaxaca', 'Puebla', 'Querétaro', 'Quintana Roo', 'San Luis Potosí', 'Sinaloa', 'Sonora', 'Tabasco', 'Tamaulipas', 'Tlaxcala', 'Veracruz de Ignacio de la Llave']


**Agregar elementos**

Agregar elementos a una lista es sencillo y se usa la funciones:

*  ``append()`` cuando se agrega un elemento al final de la lista


In [17]:
#Agregar al final
list_estados.append(44)

print(list_estados)

['Baja California Sur', 'Coahuila de Zaragoza', 'Colima', 'Chiapas', 'Chihuahua', 'CDMX', 'Durango', 'Guanajuato', 'Guerrero', 'Hidalgo', 'Jalisco', 'México', 'Michoacán de Ocampo', 'Morelos', 'Nayarit', 'Nuevo León', 'Oaxaca', 'Puebla', 'Querétaro', 'Quintana Roo', 'San Luis Potosí', 'Sinaloa', 'Sonora', 'Tabasco', 'Tamaulipas', 'Tlaxcala', 'Veracruz de Ignacio de la Llave', 'Aguascalientes', 44]


*  ``` insert()``` cuando se agrega element a alguna posición específica

In [19]:
#Agregar en posición específica
list_estados.insert(0,"CDMX")
print(list_estados)

['CDMX', 'Aguascalientes', 'Baja California Sur', 'Coahuila de Zaragoza', 'Colima', 'Chiapas', 'Chihuahua', 'CDMX', 'Durango', 'Guanajuato', 'Guerrero', 'Hidalgo', 'Jalisco', 'México', 'Michoacán de Ocampo', 'Morelos', 'Nayarit', 'Nuevo León', 'Oaxaca', 'Puebla', 'Querétaro', 'Quintana Roo', 'San Luis Potosí', 'Sinaloa', 'Sonora', 'Tabasco', 'Tamaulipas', 'Tlaxcala', 'Veracruz de Ignacio de la Llave', 'Aguascalientes', 44]


#### **Ordenamiento y otras operaciones**

Las listas también pueden ser ordenadas ya sea alfabéticamente si contienen valores strings, o por el valor del elemento sin son numéricos. Además podemos saber cuales son los valores más altos o más bajos contenidos en una lista.

##### **Ordenamiento**

Para ordenar una lista se utiliza la función ```sort()```:


In [21]:
#Ordernar lista de forma ascendente
list_tasas_desc.sort() # Ordena descendente
print(list_tasas_desc)

[1.0, 1.2, 1.6, 1.6, 1.7, 1.8, 2.0, 2.0, 2.1, 2.2, 2.2, 2.3, 2.4, 2.4, 2.4, 2.4, 2.5, 2.6, 2.6, 2.6, 2.7, 2.7, 2.8, 2.9, 2.9, 3.3, 3.4, 3.4, 3.6, 3.7, 4.0, 4.0]


In [22]:
#Ordernar lista de forma descendente
list_tasas_desc.sort(reverse = True ) # Ordena descendente
print(list_tasas_desc)

[4.0, 4.0, 3.7, 3.6, 3.4, 3.4, 3.3, 2.9, 2.9, 2.8, 2.7, 2.7, 2.6, 2.6, 2.6, 2.5, 2.4, 2.4, 2.4, 2.4, 2.3, 2.2, 2.2, 2.1, 2.0, 2.0, 1.8, 1.7, 1.6, 1.6, 1.2, 1.0]


##### **Obtener elementos máximos y mínimos**

Para saber cuales son los elementos de mayor valor en una lista ya sea númerico o alfabético utilizamos las funciones  ```min()``` y ```max()```:

In [24]:
#Computar valor mínimo
n_min = min(list_tasas_desc)
print(n_min)

#Computar valor máximo
n_max = max(list_tasas_desc)
print(n_max)

1.0
4.0


In [27]:
list_estados.remove(44)

In [28]:
#Computar valor mínimo
n_min = min(list_estados)
print(n_min)

#Computar valor máximo
n_max = max(list_estados)
print(n_max)

Aguascalientes
Veracruz de Ignacio de la Llave


##### **Otras Operaciones**

Además podemos realizar ciertas operaciones aritméticas con listas o sus elememntos.

**Suma de listas**

Las suma de listas es una concatenación de los elementos de las listas que sumemos.



In [29]:
#Suma de lista
suma_list = list_tasas_desc + list_estados

print(len(suma_list))

62


**Suma de los elementos de una lista**

Si tenemos un lista con valores numéricos podemos realizar la suma se sus elementos con la función ```sum()```

In [30]:
#Suma de las tasas de desocupación
sum_tasas_desocup = sum(list_tasas_desc)
#Imprimir
print(sum_tasas_desocup)

80.99999999999999


Es útil cuando queremos realizar ciertas operaciones que utilizan la suma, como podría ser un promedio.

Por ejemplo:

* ¿Cuáles el promedio de la tasa de desocupación en México para el segundo trimestre de 2024?

In [31]:
#Calcular promedio
promedio_tasas =  sum_tasas_desocup/len(list_estados)

print("El promedio es", promedio_tasas)

El promedio es 2.6999999999999997


**Verificación de elementos**

Un operador que podemos utilizar en listas es  ```in```, que sirva para verificar si existe un determinado elemento:

Por ejemplo:


In [34]:
#Aplicar operador in
print("Ciudad de México"  not in list_estados) #El resultado será un booleano (True)

print("CDMX" not in list_estados) #El resultado será un booleano (False)

True
False


## Tuplas (`tuple`)

### **¿Qués son las tuplas?**

Las tuplas son una una secuencia ordenada de elementos separados por comas. Al igual que las listas, las tuplas permiten la combinación de diferentes tipos de elementos en una misma, pero a diferencia de las listas,  las tuplas son **inmutables**. Por tanto, una vez creada una tupla no se puede modificar.

**Sintáxis**

Para definir un tupla en Python podemos hacerlo de dos formas:

1. Separando los elemento por comas:

```python
tuple_1 = e_1, e_2, e_3,...,n  

```
2. Separando los elemento por comas y encerrándolos en paréntesis:

```python
tuple_1 = (e_1, e_2, e_3,...,n  )
```


In [35]:
#Definir tupla
tuple_tasas =  3.4, 2.7, 2.4, 2.0, 3.7

print("Tipo de elemento", type(tuple_tasas))

Tipo de elemento <class 'tuple'>


### **Manejo y operaciones en tupla**

El manejo y operaciones con tuplas es más restrictivo dado su condición de inmutabilidad.


#### **Extracción de elementos  y modificación**

##### **Extracción**

La extracción de elementos en una tupla de realiza de la misma forma que en las listas, a partir de la posición del elemento.


In [None]:
#Definimos tamaño de la tupla
n_tasas  = len(tuple_tasas)

print(n_tasas)

5


In [None]:
#Extraer primer elemento de la tupla de tasas
e_1 = tuple_tasas[0]

#Extraer último
e_n = tuple_tasas[-1]

#Otra forma de calcular último elemento
e_n =  tuple_tasas[n_tasas - 1 ]

print(f"El primer elemento es {e_1}  y el último es {e_n}")

El primer elemento es 3.4  y el último es 3.7


##### **Modificación**
Dado su condición de inmutabilidad no podemos modificar tuplas, por lo tanto no podemos reemplazar elementos, agregar o borrar elementos. Lo que obtendremos será un error tipo  `TypeError`, en este caso el tipo de dato es incorrecto porque una tupla es inalterable.

Ejemplo:


In [36]:
#Reemplazar el primer elemento
tuple_tasas[0] = 5.4

TypeError: 'tuple' object does not support item assignment

#### **Otras operaciones**


##### **Obtener elementos máximos y mínimos**

Para saber cuales son los elementos de mayor valor en una lista ya sea númerico o alfabético utilizamos las funciones  ```min()``` y ```max()```:

In [None]:
#Computar valor mínimo
n_min = min(tuple_tasas)
print(n_min)

#Computar valor máximo
n_max = max(tuple_tasas)
print(n_max)

2.0
3.7


##### **Desempaquetado de tuplas**

Unas de las utilidades de las tuplas es que se pueden asignar sus elementos a variables, por eso es que muchos de los resultados o salidas en Python son tuplas.

Ejemplo:

In [39]:
#Definir tupla de coordenadas
coordenadas = (10, 20, 40)
#Asignar a variables
x, y, z = coordenadas
print(f"La coordenada x será {x} y la y {y}")

x
y

La coordenada x será 10 y la y 20


20

##### **¿En qué situaciones son útiles las tuplas?**

Las tuplas son especialmente útiles cuando:

* Se necesita garantizar que los datos no cambiarán
* Queremos representar colecciones de datos relacionados (como coordenadas)
* Buscamos mejor rendimiento que con listas
* Necesitamos usar la estructura como clave en un diccionario
* Trabajamos con valores de retorno múltiples en funciones

## Conjuntos (`set`)

### **¿Qué son los conjuntos?**
Un conjunto en Python es una colección desordenada de elemento únicos. Dado que un conjunto no está ordenado, sus elementos no tienen posición única por lo que no se puede acceder a los elementos de un conjunto pero si se puede agregar y eliminar elementos.

**Sintáxis**

Para definir un conjunto se utilizan corchetes  ```{}``` y utilizar la función  ```set() ``` de la siguienete forma:

*  `set_1 = set({e_3, e_2, e_1, ... e_n})`


In [40]:
#Definir set de estados
set_estados = set({"Aguascalientes", "Baja California", "Baja California Sur", "Campeche",
                 "Coahuila de Zaragoza", "Colima", "Chiapas", "Chihuahua", "Ciudad de México",
                 "Durango", "Guanajuato", "Guerrero", "Hidalgo", "Jalisco", "México",
                 "Michoacán de Ocampo", "Morelos", "Nayarit", "Nuevo León", "Oaxaca", "Oaxaca","Oaxaca","Oaxaca"
                 "Puebla", "Querétaro", "Quintana Roo", "San Luis Potosí", "Sinaloa",
                 "Sonora", "Tabasco", "Tamaulipas", "Tlaxcala",
                 "Veracruz de Ignacio de la Llave", "Yucatán", "Zacatecas"})

print("¿Qué tipo de elemento es set estados", type(set_estados))

¿Qué tipo de elemento es set estados <class 'set'>


### **Manejo y operaciones en conjuntos**

A pesar de que los elementos de un conjunto no están ordenados y no podemos acceder a ellos mediante una posición específica, los conjuntos son estructuras dinámicas que permiten modificaciones. Además, podemos realizar operaciones propias de la Teoría de Conjuntos, como la unión, intersección, diferencia y otras, para analizar y manipular datos de manera eficiente.

#### **Modificación de conjuntos**


**Tamaño  de conjunto**

* El tamaño o número de elementos en un conjunto los podemos calcular con la función ```len()```

In [41]:
#Tamaño de conjunto
len_set = len(set_estados)

print(len_set)

32


**Borrar elementos**

Para borrar elementos de una conjunto se utiliza la función `remove(valor)` y utiliza el valor a eliminar como argumento de la función.

In [None]:
#Eliminar Zacatecas
set_estados.remove('Zacatecas')

#Imprimir set
print(set_estados, len(set_estados))

{'Baja California', 'OaxacaPuebla', 'Tlaxcala', 'Sinaloa', 'Baja California Sur', 'Chiapas', 'Morelos', 'Guerrero', 'Coahuila de Zaragoza', 'Tamaulipas', 'Michoacán de Ocampo', 'Nuevo León', 'Veracruz de Ignacio de la Llave', 'San Luis Potosí', 'Hidalgo', 'Oaxaca', 'Nayarit', 'Yucatán', 'Colima', 'Jalisco', 'Campeche', 'Quintana Roo', 'México', 'Tabasco', 'Chihuahua', 'Durango', 'Querétaro', 'Aguascalientes', 'Sonora', 'Ciudad de México', 'Guanajuato'}


**Agregar elementos**

Para agregar elementos a un conjunto se puede utiliza dos métodos se utiliza la función `add(valor)` y utiliza el valor que se agregará como argumento de la función.

In [42]:
#Eliminar Zacatecas
set_estados.add('Zacatecas')

#Imprimir set y tamaño del set
print(set_estados)
print(len(set_estados))

{'Nuevo León', 'Colima', 'Baja California Sur', 'México', 'Morelos', 'Tabasco', 'Chiapas', 'Veracruz de Ignacio de la Llave', 'Oaxaca', 'Sonora', 'Campeche', 'OaxacaPuebla', 'Guanajuato', 'Baja California', 'Guerrero', 'Ciudad de México', 'Michoacán de Ocampo', 'Zacatecas', 'Aguascalientes', 'Yucatán', 'Coahuila de Zaragoza', 'Nayarit', 'Durango', 'Tamaulipas', 'Tlaxcala', 'Chihuahua', 'San Luis Potosí', 'Quintana Roo', 'Hidalgo', 'Querétaro', 'Jalisco', 'Sinaloa'}
32


#### **Operaciones de conjuntos**

Las operaciones de conjuntos son útiles para comparar y analizar datos, como encontrar similitudes o diferencias entre colecciones de elementos.



#### **Unión**

Permite combinar elementos de dos conjuntos sin duplicados y para definir esta operación en Python se utilizan dos métodos:

- Símbolo | :

  ```union = set_1 | set_2```

- Función union:
  
  ```union = set_1.union(set_2)```
   

Ejemplo:

In [43]:
#Definir set 1
set_top5_pib = set({'Ciudad de México', 'Estado de México', 'Nuevo León', 'Jalisco', 'Guanajuato'})
print(len(set_top5_pib))

#Definir set 2
set_top5_mayor_desocup = set({'Tabasco', 'Coahuila de Zaragoza', 'Ciudad de México', 'Sonora', 'Aguascalientes'})
print(len(set_top5_pib))

5
5


In [44]:
#Unión
#1
print(set_top5_pib | set_top5_mayor_desocup)

#2
set_union = set_top5_pib.union(set_top5_mayor_desocup)

print( "¿Cuántos elementos tiene el conjunto unión?", len(set_union))

{'Nuevo León', 'Estado de México', 'Tabasco', 'Aguascalientes', 'Sonora', 'Coahuila de Zaragoza', 'Guanajuato', 'Ciudad de México', 'Jalisco'}
¿Cuántos elementos tiene el conjunto unión? 9


##### **Intersección**

La intersección permite obtener elementos que coinciden entre dos conjuntos.

**Sintáxis**

Para definir la intersección se pueden utilizar dos métodos:

- Signo & :

  ```intersect = set_1 & set_2```

- Función intersection():
  
  ```intersect = set_1.union(set_2)```
   

Ejemplo:

In [45]:
#Unión
#1
print(set_top5_pib & set_top5_mayor_desocup)

#2
set_intersect = set_top5_pib.intersection(set_top5_mayor_desocup)

print( "¿Cuántos elementos tiene el conjunto intersección?", len(set_intersect))

{'Ciudad de México'}
¿Cuántos elementos tiene el conjunto intersección? 1


##### **Diferencia**

La operación diferencia permite conocer los elementos que no se encuentran en determinado conjunto.

**Sintáxis**

Para definir la diferencia de dos conjuntos se pueden utilizar dos métodos:

- Signo - :

  ```diff = set_1 - set_2```

- Función difference():
  
  ```diff = set_1.difference(set_2)```
   

Ejemplo:

In [48]:
#Diferencia
#1
print(set_top5_mayor_desocup - set_top5_pib )

#2
set_diff = set_top5_mayor_desocup.difference(set_top5_pib)

print( "¿Cuántos elementos no contiene en el conjunto 1 (top 5 mayor PIB)?", len(set_diff))

{'Tabasco', 'Aguascalientes', 'Sonora', 'Coahuila de Zaragoza'}
¿Cuántos elementos no contiene en el conjunto 1 (top 5 mayor PIB)? 4


##### **Subconjunto**

También podremos saber si un conjunto es subconjunto de otro más grande.

**Sintáxis**

Se pueden aplicar dos tipos de sintáxis para validar si un conjunto es subcounto de otro más grande.

- Operador <= :

  ```es_subconjunto = set_pequeño <= set_grande```

- Función difference():
  
  ```es_subconjunto = set_pequeño.issubset(set_grande)```
   

Ejemplo:

In [50]:
#Definir conjunto
set_top3_pib = set({'Ciudad de México', 'Estado de México', 'Nuevo León'})
print(len(set_top3_pib))

#Es subconjunto
#1
print(set_top3_pib  <= set_top5_pib )
#2
is_subset = set_top3_pib.issubset(set_top5_pib)

print( "¿El conjunto top 3 es subconjunto  del top 5?", is_subset)

3
True
¿El conjunto top 3 es subconjunto  del top 5? True


## Diccionarios (`dict`):


### **¿Qué son los diccionarios?**

Un diccionario en Python es un objeto con estructura de **clave-valor**, en el que los valores están indexados a la clave.

**Sintáxis**

Para definir un diccionario se utilizan `{}`  y se separan los pares de clave-valor por   `:`, y cada par debe ser separado por comas de la siguienete forma:

  ```Python
  dict_1  = {'clave_1': 'valor_1',
             'clave_2': 'valor_2',
             'clave_3': 'valor_3',
                     ...         ,
             'clave_n': 'valor_n'}

```
Ejemplo:

* Para definir un diccionario vacío sólo utilizamos `{}`:

In [53]:
#Definir  diccionario vacío
dict_vacío =  {}

print(type(dict_vacío))

<class 'dict'>


* Se define un diccionario de la siguiente forma:

In [54]:
#Definir diccionario de proyecciones de crecimient de la OCDE para el año 2024 (Fuente: https://web-archive.oecd.org/espanol/index.htm)

dict_growth_2024 = { "India": 6.8,
                     "Indonesia": 5.1,
                     "China": 4.9,
                     "Russia": 3.9,
                     "Türkiye": 3.5,
                     "Brazil": 3.2,
                     "Spain": 3.0,
                     "United States": 2.8,
                     "Korea": 2.3,
                     "México": 1.4,
                     "Canada": 1.1,
                     "Australia": 1.1,
                     "France": 1.1,
                     "Saudi Arabia": 1.0,
                     "South Africa": 1.0,
                     "United Kingdom": 0.9,
                     "Euro area": 0.8,
                     "Italy": 0.5,
                     "Germany": 0.0,
                     "Japan": -0.3,
                     "Argentina": -3.8 }
#Imprimir diccionario
print(dict_growth_2024)
#Imprimir tipo de clase que es dict_growth_2024
print(type(dict_growth_2024))

{'India': 6.8, 'Indonesia': 5.1, 'China': 4.9, 'Russia': 3.9, 'Türkiye': 3.5, 'Brazil': 3.2, 'Spain': 3.0, 'United States': 2.8, 'Korea': 2.3, 'México': 1.4, 'Canada': 1.1, 'Australia': 1.1, 'France': 1.1, 'Saudi Arabia': 1.0, 'South Africa': 1.0, 'United Kingdom': 0.9, 'Euro area': 0.8, 'Italy': 0.5, 'Germany': 0.0, 'Japan': -0.3, 'Argentina': -3.8}
<class 'dict'>


### **Manejo y operaciones en diccionarios**


**Tamaño de un diccionario**

Al igual que en las listas, tuplas conjuntos para saber el tamaño de un diccionario, en este caso el número de pares clave-valor que contiene se utiliza la función `len()`.

In [55]:
#Tamaño de un diccionario
print(len(dict_growth_2024))

21


#### **Acceso a elementos de un diccionario**

Como se mencionó los diccionarios contiene pares de claves y valores por lo que podemos tener acceso a estos elementos.

Para ello utilizaremos las funciones `key(), value(), items()` con la siguiente sintáxis:

   * Para acceder a las claves:
    
     `dict_1.key()`

     Ejemplo:



In [56]:
#Definir claves de diccionario
claves = dict_growth_2024.keys()

print(claves)
print(type(claves))


dict_keys(['India', 'Indonesia', 'China', 'Russia', 'Türkiye', 'Brazil', 'Spain', 'United States', 'Korea', 'México', 'Canada', 'Australia', 'France', 'Saudi Arabia', 'South Africa', 'United Kingdom', 'Euro area', 'Italy', 'Germany', 'Japan', 'Argentina'])
<class 'dict_keys'>


* Para acceder a los valores:
    
     `dict_1.values()`

     Ejemplo:

In [57]:
#Definir valores del diccionario
valores = dict_growth_2024.values()

print(valores)
print(type(valores))

dict_values([6.8, 5.1, 4.9, 3.9, 3.5, 3.2, 3.0, 2.8, 2.3, 1.4, 1.1, 1.1, 1.1, 1.0, 1.0, 0.9, 0.8, 0.5, 0.0, -0.3, -3.8])
<class 'dict_values'>


* Para acceder tanto a las claves como valores en forma de tuplas:
    
     `dict_1.items()`

     Ejemplo:

In [58]:
#Definir valores del diccionario
clave_valor = dict_growth_2024.items()

print(clave_valor)
print(type(clave_valor))

dict_items([('India', 6.8), ('Indonesia', 5.1), ('China', 4.9), ('Russia', 3.9), ('Türkiye', 3.5), ('Brazil', 3.2), ('Spain', 3.0), ('United States', 2.8), ('Korea', 2.3), ('México', 1.4), ('Canada', 1.1), ('Australia', 1.1), ('France', 1.1), ('Saudi Arabia', 1.0), ('South Africa', 1.0), ('United Kingdom', 0.9), ('Euro area', 0.8), ('Italy', 0.5), ('Germany', 0.0), ('Japan', -0.3), ('Argentina', -3.8)])
<class 'dict_items'>


#### **Extracción de valores específicos**

Como la listas, los valores de los diccionarios están indexados pero en este caso por las claves, por lo tanto podemos utilizar las claves para extraer a algún valor específico.

**Sintáxis**

Al igual que en las listas se utilizan corchetes cuadrados y como argumento las claves.

 `dict_1['clave']`

 Ejemplo:


In [61]:
#Extraer valores específicos
tasa_mex = dict_growth_2024['México']

tasa_argentina = dict_growth_2024['Argentina']

print(tasa_mex,"\n", tasa_argentina)

1.4 
 -3.8


También podemos utilizar la función `get()`:

In [64]:
#Extraer valor específico con función get
tasa_mex = dict_growth_2024.get('México')
tasa_argentina = dict_growth_2024.get('Argentina')

print(tasa_mex,"\n", tasa_argentina)

1.4 
 -3.8


#### **Reemplazo y eliminación de valores específicos**

Los diccionarios también son un objeto mutable por lo que podemos eliminar, agregar y reemplazar pares de claves y valores.


#####  **Reemplazo**

Para reemplazar o actualizar el valor de una clave en específico utilizamos lo siguiente.

**Sintáxis**

1. `del`

   ```Python  
    dict_1['clave'] = 'nuevo_valor'
   ```
Ejemplo:

In [68]:
#¿Cuál es la tasa de crecimiento proyectada para Argentina?
print(dict_growth_2024['Argentina'])

#Reemplazar el valor de Argentina
dict_growth_2024['Argentina'] = -2.9

#Comprobar si se modificó
print(dict_growth_2024)

-2.9
{'India': 6.8, 'Indonesia': 5.1, 'China': 4.9, 'Russia': 3.9, 'Türkiye': 3.5, 'Brazil': 3.2, 'Spain': 3.0, 'United States': 2.8, 'Korea': 2.3, 'México': 1.4, 'Canada': 1.1, 'Australia': 1.1, 'France': 1.1, 'Saudi Arabia': 1.0, 'South Africa': 1.0, 'United Kingdom': 0.9, 'Euro area': 0.8, 'Italy': 0.5, 'Germany': 0.0, 'Japan': -0.3, 'Argentina': -2.9}


#####  **Eliminación**

Existen diversas formas de eliminar elementos en una listas, las más comunes son las siguientes.

**Sintáxis**

1. `del`

   ```Python  
    del dict_1['clave']
   ```

1. `pop()`

    ```Python  
    dict_1.pop('clave')
    ```


 Ejemplo:

In [70]:
#Aplicar función del
del dict_growth_2024['México']

print(dict_growth_2024)

#Aplicar pop
dict_growth_2024.pop('China')

print(dict_growth_2024)

{'India': 6.8, 'Indonesia': 5.1, 'China': 4.9, 'Russia': 3.9, 'Türkiye': 3.5, 'Brazil': 3.2, 'Spain': 3.0, 'United States': 2.8, 'Korea': 2.3, 'Canada': 1.1, 'Australia': 1.1, 'France': 1.1, 'Saudi Arabia': 1.0, 'South Africa': 1.0, 'United Kingdom': 0.9, 'Euro area': 0.8, 'Italy': 0.5, 'Germany': 0.0, 'Japan': -0.3, 'Argentina': -2.9}
{'India': 6.8, 'Indonesia': 5.1, 'Russia': 3.9, 'Türkiye': 3.5, 'Brazil': 3.2, 'Spain': 3.0, 'United States': 2.8, 'Korea': 2.3, 'Canada': 1.1, 'Australia': 1.1, 'France': 1.1, 'Saudi Arabia': 1.0, 'South Africa': 1.0, 'United Kingdom': 0.9, 'Euro area': 0.8, 'Italy': 0.5, 'Germany': 0.0, 'Japan': -0.3, 'Argentina': -2.9}


#####  **Agregar elemento**

Para agregar elementos a las listas se utiliza la función `update()`.

**Sintáxis**
``` Python
dict_1.update(dict_2)
 ```

 Ejemplo:

In [72]:
#Definir nuevo diccionario
dict_nuevo = {'México': 4.1,
              'China' : 6.3 }

dict_growth_2024.update(dict_nuevo)

print(dict_growth_2024)

{'India': 6.8, 'Indonesia': 5.1, 'Russia': 3.9, 'Türkiye': 3.5, 'Brazil': 3.2, 'Spain': 3.0, 'United States': 2.8, 'Korea': 2.3, 'Canada': 1.1, 'Australia': 1.1, 'France': 1.1, 'Saudi Arabia': 1.0, 'South Africa': 1.0, 'United Kingdom': 0.9, 'Euro area': 0.8, 'Italy': 0.5, 'Germany': 0.0, 'Japan': -0.3, 'Argentina': -2.9, 'México': 4.1, 'China': 6.3}


#####  **Validar presencia de elementos**

Para veririficar la presencia de un elemento por su clave en un diccionario se utiliza el operador `in`.

**Sintáxis**
``` Python
'elemento_a_validar' in claves
 ```

 Ejemplo:

In [74]:
#Definir claves de un diccionario

claves = dict_growth_2024.keys()

#Verificar si encontramos una clave
print('Estados Unidos' in claves )

print('United States' in claves )



False
True


#####  **Copiar diccionarios**

Para hacer una copia de un diccionario se utiliza la función `copy()`

**Sintáxis**

``` Python
dict_copia = dict_1.copy()
 ```

 Ejemplo:

In [None]:
#Definir nuevo diccionario
dict_growth_2024_copy = dict_growth_2024.copy()

#### **Diccionarios con listas como valores**

Lo valores de los diccionarios también pueden ser listas que contengan una serie de valores del mismo tipo o bien de diferentes tipos de valores.

**Sintáxis**

Para definir un diccionario se utilizan `{}`  y se separan los pares de clave-valor por   `:`, y el valor en este caso será una lista que se define por los `[]`:

  ```Python
  dict_1  = {'clave_1': lista_1,
             'clave_2': lista_2,
             'clave_3': lista_3,
                     ...         ,
             'clave_n': lista_n}

```

Ejemplo:

* El diccionario de proyecciones de crecimiento de los países de la OCDE para el año 2024, ahora también tendrá las proyecciones para el año 2025.

In [75]:
#Definir diccionario de proyecciones de crecimient de la OCDE (Fuente: https://web-archive.oecd.org/espanol/index.htm)
dict_growth_2024_2025 = {
    'India': [6.8, 6.9],
    'Indonesia': [5.1, 5.2],
    'China': [4.9, 4.7],
    'Russia': [3.9, 1.1],
    'Türkiye': [3.5, 2.6],
    'G20': [3.3, 3.3],
    'Brazil': [3.2, 2.3],
    'Spain': [3.0, 2.3],
    'United States': [2.8, 2.4],
    'Korea': [2.3, 2.1],
    'Mexico': [1.4, 1.2],
    'Canada': [1.1, 2.0],
    'Australia': [1.1, 1.9],
    'France': [1.1, 0.9],
    'Saudi Arabia': [1.0, 3.6],
    'South Africa': [1.0, 1.5],
    'United Kingdom': [0.9, 1.7],
    'Euro area': [0.8, 1.3],
    'Italy': [0.5, 0.9],
    'Germany': [0.0, 0.7],
    'Japan': [-0.3, 1.5],
    'Argentina': [-3.8, 3.6] }

print(dict_growth_2024_2025)


{'India': [6.8, 6.9], 'Indonesia': [5.1, 5.2], 'China': [4.9, 4.7], 'Russia': [3.9, 1.1], 'Türkiye': [3.5, 2.6], 'G20': [3.3, 3.3], 'Brazil': [3.2, 2.3], 'Spain': [3.0, 2.3], 'United States': [2.8, 2.4], 'Korea': [2.3, 2.1], 'Mexico': [1.4, 1.2], 'Canada': [1.1, 2.0], 'Australia': [1.1, 1.9], 'France': [1.1, 0.9], 'Saudi Arabia': [1.0, 3.6], 'South Africa': [1.0, 1.5], 'United Kingdom': [0.9, 1.7], 'Euro area': [0.8, 1.3], 'Italy': [0.5, 0.9], 'Germany': [0.0, 0.7], 'Japan': [-0.3, 1.5], 'Argentina': [-3.8, 3.6]}


Cuando un diccionario contenga listas como valores se podrá aplicar todas las funciones y operaciones que vimos hasta el momento.

Ejemplo:

* Extraer claves y valores:

In [76]:
#Extraer claves
claves = dict_growth_2024_2025.keys()
print(claves)

#Extraer valores
valores_2024_2025 = dict_growth_2024_2025.values()

print(valores_2024_2025)


dict_keys(['India', 'Indonesia', 'China', 'Russia', 'Türkiye', 'G20', 'Brazil', 'Spain', 'United States', 'Korea', 'Mexico', 'Canada', 'Australia', 'France', 'Saudi Arabia', 'South Africa', 'United Kingdom', 'Euro area', 'Italy', 'Germany', 'Japan', 'Argentina'])
dict_values([[6.8, 6.9], [5.1, 5.2], [4.9, 4.7], [3.9, 1.1], [3.5, 2.6], [3.3, 3.3], [3.2, 2.3], [3.0, 2.3], [2.8, 2.4], [2.3, 2.1], [1.4, 1.2], [1.1, 2.0], [1.1, 1.9], [1.1, 0.9], [1.0, 3.6], [1.0, 1.5], [0.9, 1.7], [0.8, 1.3], [0.5, 0.9], [0.0, 0.7], [-0.3, 1.5], [-3.8, 3.6]])


* Extraer valores de determinada clave:

In [77]:
#Extraer tasas de Brasil
tasas_Brazil = dict_growth_2024_2025['Brazil']

print(f"Tipo de objeto {tasas_Brazil} es {type(tasas_Brazil)} ")

Tipo de objeto [3.2, 2.3] es <class 'list'> 


## Arreglos (`array` del módulo `array`):
   - Descripción: Una versión más compacta y eficiente de las listas, almacenando elementos del mismo tipo.
   - Ejemplo:
     ```python
     from array import array
     my_array = array("i", [1, 2, 3])
     ```


## Dataframes (`Dataframes`):
   - Descripción: Una colección de pares clave-valor, donde cada valor está asociado con una clave única.
   - Ejemplo:



``` python
    data = {
    'nombre': ['Ana', 'Juan', 'María'],
    'edad': [25, 30, 35],
    'ciudad': ['Madrid', 'Barcelona', 'Sevilla']
}

df = pd.DataFrame(data)
```


