# Curso Python

## Diccionarios y Conjuntos

### Diccionarios

Los diccionarios son estructuras de datos que almacenan hechos que querramos categorizar de alguna u otra manera, un diccionario sigue la misma estructura que los indices de las listas o las tuplas, solo que en vez de estar organizados por elementos, estan organizados por llaves (keys) que a su vez contienen otros elementos, las llaves pueden ser un conjunto de elementos sencillos o complejos (listas, tuplas, etc.)

In [48]:
diccionario = {'Key1':10, 'Key2':"Python", 'Key3':[1, 2, 3], 'Key4':(4, 5, 6), 'Key5':3.6 }
print(diccionario['Key1'])
print(diccionario['Key3'])

10
[1, 2, 3]


Creo que has de haber notado la primer diferencia con las listas o tuplas. Si bien un diccionario funciona bajo el mismo principio de acceder a un índice y consultar datos a través de la sintaxis de python, no utiliza números enteros para hacer referencia a cada una de sus llaves, cada llave tiene un nombre asignado con un string y para consultar cada llave tenemos que llamar entre corchetes [] a la llave en cuestión, también podemos ejecutar otras secuencias en cadena como por ejemplo consultar un elemento de una lista dentro de una llave específica de un diccionario:

In [49]:
print(diccionario['Key3'][2])

3


Ve como la lógica de funcionamiento es la misma, primero "desempaqueto" la llave que me interesa y luego de la lista "desempaqueto" el valor que quiero, recuerda que la sintaxis es la misma que con las tuplas, solo que en lugar de utilizar indices numéricos utilizas llaves.

Es importante recalcar que las llaves son valores indexados, es decir las llaves no pueden tener nombres repetidos, no hay dos llaves que se llamen igual. Sin embargo, los valores de cada llave pueden llevar valores repetidos, por ejemplo:

In [50]:
diccionario_2 = {'K1': 4, 'K2':4}
print(diccionario_2)

{'K1': 4, 'K2': 4}


Pon atención en como la celda de código no tiene problemas para dar una salida (output) con valores repetidos para cada llave individualmente. Ahora, los diccionarios no son inmutables, es decir que puedes agregarle valores siempre que sea necesario, para esto solo tenemos que llamar al diccionario que nos interesa, entre corchetes específicamos el nombre de la llave y con el operador = establecemos lo que queremos agregar, recuerda que siendo un diccionario puede almacenar datos simples o complejos sin ningún problema:

In [51]:
diccionario_2['K3'] = 2.5
print(diccionario_2)

{'K1': 4, 'K2': 4, 'K3': 2.5}


Algo interesante de los diccionarios es que podemos revisarlos generando booleanos (True/False) con el comando "in" de la siguiente manera:

In [52]:
verifica_K3 = 'K3' in diccionario_2
verifica_K4 = 'K4' in diccionario_2

print(verifica_K3)
print(verifica_K4)

True
False


Observa como las varieables creadas en la celda anterior son de tipo bool y al imprimirlas devuelven los valores True/False dependiendo de si existe o no la llave que consultamos, esto es especialmente util cuando se trabaja con bucles y otros procesos que veremos más adelante. Adicionalmente, podemos consultar todas las llaves del diccionario y todos los valores también con sus respectivos métodos:

In [53]:
print(diccionario_2.keys())
print(diccionario_2.values())

dict_keys(['K1', 'K2', 'K3'])
dict_values([4, 4, 2.5])


Por el momento eso sería lo importante de los diccionarios, hasta ahora deberías comprender como funcionan y puedes observar más funcionalidades de ellos utilizando el comando help como te enseñe en la lección anterior, solo recuerda que gran parte del conocimiento de programación es entender las secuencias lógicas y los principios de arquitectura o sintaxis, siempre queda en nosotros aprender más funciones, métodos, etc. es como ampliar tu vocabulario al aprender un idioma nuevo.

### Conjuntos

Los conjuntos son otro tipo de colección de datos como las listas, tuplas o diccionarios, eso significa que pueden almacenar diferentes tipos de datos admitidos por el lenguaje Python dentro de ellos mismos, pero tienen una particularidad y es que los conjuntos no están ordenados, no registran o guardan valores a posiciones de los datos como los diccionarios, listas o tuplas y están constituidos por elementos únicos.

In [54]:
print(diccionario_2)
conjunto = set(diccionario_2.values())
print (conjunto)

{'K1': 4, 'K2': 4, 'K3': 2.5}
{2.5, 4}


Observa que podemos convertir otras colecciones de datos en información legible para ser almacenada en conjuntos, en este caso lo que hice fue utilizar lo que aprendimos de los diccionarios para tomar los valores del diccionario_2 y armar un conjunto que almacene sus valores, esto es posible porque diccionario_2 tiene llaves y valores simples, si lo hacemos con diccionario nos lanzará error si hay tipos complejos como tuplas o listas, pero aun así podemos consultar los valores de las listas almacenadas en los diccionarios para crear conjuntos por ejemplo:

In [55]:
print(diccionario)
conjunto_2 = set(diccionario['Key4'])
print(conjunto_2)

{'Key1': 10, 'Key2': 'Python', 'Key3': [1, 2, 3], 'Key4': (4, 5, 6), 'Key5': 3.6}
{4, 5, 6}


Pon atención que en este caso, llamamos a la llave 4 del primer diccionario que creamos que se trata de una lista. Como no hay datos repetidos, el conjunto se crea con cada uno de esos valores, si por ejemplo la lista tuviera otra lista dentro, tendríamos que seguir la lógica del desempaquetado hasta llegar a referenciar lo que necesitemos, recuerda que no puedes referenciar una lista o tupla bajo esta premisa si se encuentra en una coleccion de datos de cualquier tipo, debido que al tener otra colección de datos dentro es una referencia ambigua y no tiene lógica, sin embargo puedes desempaquetar las tuplas y listas dentro de cualquier colección y traducirlo todo a una sola lista común utilizando comandos como append o extend o simplemente definiendo una nueva variable, por ejemplo:

In [58]:
lista_diccionario = []
lista_diccionario.extend(diccionario.values())
lista_conjunto = []
lista_conjunto.extend(lista_diccionario)
lista_conjunto.extend(lista_diccionario[2])
lista_conjunto.extend(lista_diccionario[3])
del(lista_conjunto[2], lista_conjunto[2])
print(lista_conjunto)

conjunto_3 = set(lista_conjunto)
print(conjunto_3)

[10, 'Python', 3.6, 1, 2, 3, 4, 5, 6]
{1, 2, 3.6, 3, 4, 5, 6, 10, 'Python'}


Ese sería un ejemplo muy elemental de como podrías realizar un desempaquetado de la información en una lista.

Bien, como pudiste observar ahora tengo todos los datos almacenados en el diccionario clasificados en un conjunto a pesar de que estaban dentro de listas o tuplas. Los conjuntos también tienen campo para operaciones especiales, por ejemplo podemos crear un nuevo conjunto con los valores en común entre dos conjuntos, si recuerdas esto en matemáticas se hace con el operador "&", observa:

In [60]:
conjunto_4 = conjunto_3 & conjunto_2
print(conjunto_4)

{4, 5, 6}


En este caso la celda de código nos está regresando únicamente los valores en los que ambos conjuntos coinciden, no olvides que todo este tipo de conceptos son abstracciones matemáticas, puedes hacer un diagrama de venn con ambos conjuntos y te darás cuenta que ambos tienen en común esos valores. También existe el comando "union" que es utilizado para unir dos conjuntos en uno solo:

In [61]:
conjunto_5 = conjunto_3.union(conjunto)
print(conjunto_5)

{1, 2, 3.6, 3, 4, 5, 6, 2.5, 10, 'Python'}


En este caso con la función union almacenamos el resultado de la union de conjunto_3 y conjunto en otro conjunto llamado conjunto_5, finalmente si queremos confirmar si un conjunto es un subconjunto de otro, podemos utilizar la función issubset para asegurarnos:

In [62]:
conjunto_3.issubset(conjunto_4)

False

En este caso podemos observar que el conjunto_3 no es un subconjunto del conjunto_4, trata de repetir las celdas de los conjuntos utilizando diagramas de venn, de tal manera que puedas visualizar la información y como la hemos segmentado a nuestra conveniencia en conjuntos a partir de colecciones de datos, estos conceptos son especialmente útiles para conceptos como el análisis de datos o limpieza de datos, no te olvides que siempre puedes consultar más información en python nativamente con el comando help()