# Conjuntos y Diccionarios
<div style="text-align: right">Autor: Luis A. Muñoz - 2024 </div>

Ideas clave:

* Los conjuntos son contenedores de datos en Python que no admiten valores duplicados.
* Un conjunto tiene el formato {val1, val2, ...}
* Los valores en un conjunto (set) se agregan con el método add y si el valor a añadir ya se encuentra en el conjunto, este se descarta
* Los conjuntos soportan operaciones de intersección, union, diferencia y diferencia simétrica.
* Un diccionario es un tipo de datos de Python que convierte un dato en otro
* Funciona como un formulario de datos: los campos a llenar se llaman llaves (keys) y los datos con que se llenan los campos con valores (values)
* Un diccionario tiene el formato {key1: value1, key2: value2, ....}
* Un diccionario utiliza las llaves como índices para acceder a los valores

Informacion:
* https://recursospython.com/guias-y-manuales/conjuntos-sets/
* https://recursospython.com/guias-y-manuales/diccionarios/
---

# Conjuntos: `set`
<img src="https://miro.medium.com/proxy/0*_Pc2_6NV9IUgTQ9m.png" alt="Drawing" style="width: 400px;"/>

Un conjunto `set` es una colección no ordenada de objetos únicos. Los conjuntos son ampliamente utilizados en lógica y matemática, y desde el lenguaje podemos sacar provecho de sus propiedades para crear código más eficiente y legible en menos tiempo.

Para crear un conjunto se utiliza la siguiente sintáxis:

In [1]:
s = {1, 2, 3, 4, 5, 6, 7, 8, 9}
print(type(s))
print(s)

<class 'set'>
{1, 2, 3, 4, 5, 6, 7, 8, 9}


La idea más importante a recordar respecto a un conjunto es que no puede contener elementos repetidos y de esto se encarga directamente el contenedor de datos:

In [2]:
s = {1, 2, 3, 4, 5, 5, 5, 6, 7, 8, 8, 8, 9}
print(s)

{1, 2, 3, 4, 5, 6, 7, 8, 9}


Como se observa, los elementos repetidos se descartan del conjunto y solo estan presentes una sola vez. Esto tiene sentido si considera la noción matematica de un conjunto: una colección de elementos únicos y cuyo orden es irrelevante. Esto es que este es un conjunto válido:

In [3]:
pares = {4, 2, 16, 24, 102}
print(pares)

{16, 2, 4, 102, 24}


Note que la impresión de los valores no tiene un orden específico ya que su orden es irrelvante; esto quiere decir que no existe algo como "el primer elemento", o "el último elemento" o "el n-ésimo elemento". Lo que a su veces significa que los elementos de un conjunto no están indexados ("*not suscriptable*"):

In [4]:
pares[0]

TypeError: 'set' object is not subscriptable

Estas características pueden ayudar a resolver algunos problemas. Por ejemplo, descartar un número si es que tiene dígitos repetidos:

In [5]:
# Pruebe con diferentes valores de num (como str)
num = '1293'

# Lista por comprehension de cada caracter del str num que luego se convierte en un set
numeros = set([n for n in num])      # ['1', '2', '3', '3']

# Si el numero de elementos del str num es igual al numero de elementos del set
# quiere decir que todos los caracteres son diferentes
if len(num) == len(numeros):
    print("Todos los digitos son diferentes")
else:
    print("Hay digitos repetidos")

Todos los digitos son diferentes


Los métodos disponibles en un conjunto se pueden observar en el directorio de un `set`:

In [6]:
dir(set)

['__and__',
 '__class__',
 '__class_getitem__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__iand__',
 '__init__',
 '__init_subclass__',
 '__ior__',
 '__isub__',
 '__iter__',
 '__ixor__',
 '__le__',
 '__len__',
 '__lt__',
 '__ne__',
 '__new__',
 '__or__',
 '__rand__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__ror__',
 '__rsub__',
 '__rxor__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__sub__',
 '__subclasshook__',
 '__xor__',
 'add',
 'clear',
 'copy',
 'difference',
 'difference_update',
 'discard',
 'intersection',
 'intersection_update',
 'isdisjoint',
 'issubset',
 'issuperset',
 'pop',
 'remove',
 'symmetric_difference',
 'symmetric_difference_update',
 'union',
 'update']

De este listado, los métodos para la manipulación de los elementos son:
    
    - add()          Agrega un elemento al conjunto
    - remove()       Elimina un elemento de un conjunto y si el elemento
                     no existe genera una excepción
    - discard()      Equivalente a remove(), pero en caso el elemento a eliminar
                     no exista, esta operación se descarta.
    - pop()          Extrae un elemento aleatorio del conjunto
    
Un detalle a considerar es la forma de inicializar un conjunto vacio: __hay que utilizar la instrucción `set()` y no `{}`.__

In [7]:
# Conjunto vacio
s = set()

# Se agregan elementos al conjunto
s.add(0)
s.add(1)
s.add(3)
s.add(10)
s.add(7)
print(s)

# Se descartan elementos de un conjunto
s.discard(3)
s.discard(20)    # Esto no genera una excepcion
print(s)

# Se extrae un valor aleatorio
val = s.pop()
print("\nValor extraido aleatorio:", val)
print(s)

val = s.pop()
print("\nValor extraido aleatorio:", val)
print(s)

{0, 1, 3, 7, 10}
{0, 1, 7, 10}

Valor extraido aleatorio: 0
{1, 7, 10}

Valor extraido aleatorio: 1
{7, 10}


Los conjuntos soportan las siguientes operaciones:
    
    * &      Interseccion
    * |      Union
    * -      Diferencia
    * ^      Diferencia simétrica
    
![](https://aprendepython.es/_images/venn.png)

In [8]:
pares = {0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20}
mult_3 = {0, 3, 6, 9, 12, 15, 18, 21}
mult_5 = {0, 5, 10, 15, 20, 25}

print(pares & mult_3)    # Equivalente al método: pares.intersection(mult_3)
print(mult_5 | mult_3)   # Equivalente al método: mult_3.union(mult_5)
print(pares - mult_3)    # Equivalente al método: pares.difference(mult_3)
print(mult_3 ^ mult_5)   # Equivalente al método: mult_3.symetric_difference(mult_5)

{0, 18, 12, 6}
{0, 3, 5, 6, 9, 10, 12, 15, 18, 20, 21, 25}
{2, 4, 8, 10, 14, 16, 20}
{3, 5, 6, 9, 10, 12, 18, 20, 21, 25}


Un conjunto es un "iterable", esto es que puede ser parte de un lazo for y lo que itere serán sus elementos:

In [9]:
for element in {1, 2, 3, 3, 4, 5, 5}:
    print(element)

1
2
3
4
5


# Diccionarios: dict
![](https://cs.stanford.edu/people/nick/py/img/python-dict2.png)

Un diccionario es una colección no ordenada de objetos. Es por eso que para identificar un valor cualquiera dentro de él, especificamos una llave (a diferencia de las listas y tuplas, cuyos elementos se identifican por su posición). Las llaves suelen ser números enteros o cadenas, aunque cualquier otro objeto inmutable puede actuar como una llave (en realidad, cualquier objeto "hasheable"). Los valores, por el contrario, pueden ser de cualquier tipo, incluso otros diccionarios.

Un diccionario vacío se puede expresar de dos formas: `dict()` o `{}` y tiene el formato `(key: value)`:

In [10]:
d = {"Python": 1991, "C": 1972, "Java": 1996}

print(type(d))
print(d)
print("Num de elementos:", len(d))

<class 'dict'>
{'Python': 1991, 'C': 1972, 'Java': 1996}
Num de elementos: 3


Como se puede observar, cada par `llave:valor` se considera un elemento, pero estos no tienen índices:

In [11]:
d[0]

KeyError: 0

En un diccionario el elemento que se utiliza para especificar un elemento es la llave:

In [12]:
d['Python']

1991

Y se puede utilizar el operador `=` para asignarle un valor o agregar un nuevo elemento: 

In [13]:
d['Python'] = 2001
d['C++'] = 1983

print(d)

{'Python': 2001, 'C': 1972, 'Java': 1996, 'C++': 1983}


Como las llaves son empleadas en lugar de los índices, estas no pueden ser duplicadas, a diferencia de los valores que si pueden ser repetidos:

In [14]:
d["JavaScript"] = 1995
d["PHP"] = 1995

print(d)

{'Python': 2001, 'C': 1972, 'Java': 1996, 'C++': 1983, 'JavaScript': 1995, 'PHP': 1995}


Cuando se considera el uso de un diccionario como parte de un código de programación, se debe pensar en un diccionario como un formulario. Considere el siguiente diccionario:

In [15]:
# El diccionario 'persona' almacena cada dato de una persona en llaves
persona = {'nombre': 'Elvio',
           'apellido': 'Lado',
           'edad': 20,
           'telefono': '976-765-262',
           'direccion': 'Av. Separadora Industrial 2134, Ate'}

print(persona)

# Observe en esta línea como el diccionario aclara el código pues en lugar de usar un índice
# en 'persona' se usa el nombre de la llave y se puede entender que primero se imprime el nombre
# y luego el apellido.
print(persona['nombre'] + ' ' + persona['apellido'])

{'nombre': 'Elvio', 'apellido': 'Lado', 'edad': 20, 'telefono': '976-765-262', 'direccion': 'Av. Separadora Industrial 2134, Ate'}
Elvio Lado


¿Como se cambiaría el teléfono de la persona en el diccionario?

In [16]:
persona['telefono'] = '987-363-999'
print(persona)

{'nombre': 'Elvio', 'apellido': 'Lado', 'edad': 20, 'telefono': '987-363-999', 'direccion': 'Av. Separadora Industrial 2134, Ate'}


¿Y cómo se agregaría el email de esta persona en el diccionario?

In [17]:
persona['email'] = 'elado@mail.com'
print(persona)

{'nombre': 'Elvio', 'apellido': 'Lado', 'edad': 20, 'telefono': '987-363-999', 'direccion': 'Av. Separadora Industrial 2134, Ate', 'email': 'elado@mail.com'}


## Diccionario como un iterable
Un diccionario también es un iterable, pero que retorna: ¿las llaves, los valores, ambos?

In [18]:
meses = {1: 'ene', 2: 'feb', 3: 'mar',
         4: 'abr', 5: 'may', 6: 'jun',
         7: 'jul', 8: 'ago', 9: 'set',
         10: 'oct', 11: 'nov', 12: 'dic'}


for data in meses:
    print(data)

1
2
3
4
5
6
7
8
9
10
11
12


Las llaves. Esto tiene sentido ya que se pueden obtener los valores a partir de las llaves, y no se pueden obtener las llaves a partir los valores (ya que estos últimos pueden ser duplicados). En caso se requiera otra respuesta, se puede llamar a los siguientes métodos:

    * dict.keys()      Retorna una lista con las llaves de un diccionario
    * dict.values()    Retorna una lista con los valores de un diccionario
    * dict.items()     Retorna una lista de tuplas con los pares (llave, valor)

In [19]:
print("Método keys()")
for data in meses.keys():
    print(data)
else:
    print()

print("Método values()")
for data in meses.values():
    print(data)
else:
    print()

print("Método items()")
for data in meses.items():
    print(data)

Método keys()
1
2
3
4
5
6
7
8
9
10
11
12

Método values()
ene
feb
mar
abr
may
jun
jul
ago
set
oct
nov
dic

Método items()
(1, 'ene')
(2, 'feb')
(3, 'mar')
(4, 'abr')
(5, 'may')
(6, 'jun')
(7, 'jul')
(8, 'ago')
(9, 'set')
(10, 'oct')
(11, 'nov')
(12, 'dic')


## Métodos en un diccionario
Adicionalmente a los métodos anteriores, también se tienen los siguientes métodos:

In [20]:
dir(dict)

['__class__',
 '__class_getitem__',
 '__contains__',
 '__delattr__',
 '__delitem__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__ior__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__ne__',
 '__new__',
 '__or__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__reversed__',
 '__ror__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'clear',
 'copy',
 'fromkeys',
 'get',
 'items',
 'keys',
 'pop',
 'popitem',
 'setdefault',
 'update',
 'values']

Los siguientes métodos realizan las siguientes acciones:    
    
    * clear()         Elimina todos los elementos de un diccionario
    * copy()          Copia los elementos de un diccionario en otro, equivalente a las listas
    * fromkeys()      Crea un dict a partir de los elementos de una lista que servirán como llaves
                      y con valores = None
    * get()           Retorna un valor de una llave. Equivalente a dict[key], 
                      pero no genera una excepcion si la llave no existe
    * pop()           Extrae el valor de una diccionario a partir de una llave.
    * popitem()       Extrae el último par (llave, valor) insertado
    * setdefault()    Crea un diccionario a partir de una llave y un valor por defecto. 
                      En caso la llave ya existe la operacion se descarta
    * update()        Actualiza los elementos de un diccionadio a partir de otro
    
Creemos un diccionario `numeros` y saquemos un valor con `pop()`:

In [21]:
numeros = {1: 'uno', 2: 'dos', 3: 'tres', 4: 'cuatro', 5: 'cinco', 6: 'seis', 7: 'siete', 8: 'ocho', 9: 'nueve'}

val = numeros.pop(9)
print(val)
print(numeros)

nueve
{1: 'uno', 2: 'dos', 3: 'tres', 4: 'cuatro', 5: 'cinco', 6: 'seis', 7: 'siete', 8: 'ocho'}


Si utilizamos la sintaxis `dict[key]` para obtener el valor de una llave, tendrémos una excepción porque esta llave no existe:

In [22]:
# Esto genera un excepción porque la llave 9 ya no existe
numeros[9]

KeyError: 9

Es preferible utilizar el método `get()` para obtener el valor de una llave:

In [23]:
# Esto no genera una excepcion
numeros.get(9)

# E incusive puede devolver algo en caso esta llave no exista
numeros.get(9, "No existe")

'No existe'

Se puede combinar la función `zip` con dos listas para crear un diccionario a partir de valores predefinidos en listas:

In [27]:
meses_n = ['ene', 'feb', 'mar', 'abr', 'may', 'jun', 
          'jul', 'ago', 'set', 'oct', 'nov', 'dic']
meses_d = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]

meses = dict(zip(meses_d, meses_n))
print(meses)

{1: 'ene', 2: 'feb', 3: 'mar', 4: 'abr', 5: 'may', 6: 'jun', 7: 'jul', 8: 'ago', 9: 'set', 10: 'oct', 11: 'nov', 12: 'dic'}


También se pueden crear diccionarios por comprehensión, en este caso un diccionario que relacione grados Centigrados a grados Fahrenheit:

In [32]:
C_to_F = {C:round(9/5 * C + 32, 1) for C in range(20, 31)}
print(C_to_F)

{20: 68.0, 21: 69.8, 22: 71.6, 23: 73.4, 24: 75.2, 25: 77.0, 26: 78.8, 27: 80.6, 28: 82.4, 29: 84.2, 30: 86.0}


Por último, el operador `in` también se puede utilizar para verificar si una llave esta presente en un diccionario:

In [None]:
print(3 in meses)        # Esta llave esta en el diccionario
print('ene' in meses)    # Este valor esta en el diccionario, pero 'in' no busca valores

## Listas en un diccionario
Se pueden incluír listas como valores de un diccionario. Considere el siguiente código:

In [33]:
leng_prog = {'juan': ['Python'],
             'maria': ['C', 'C++'],
             'elvio': ['HTML', 'JavaScript', 'PHP'],
             'clodoaldo': ['Assembler', 'Haskell'],
             'rosa': ['Python', 'VisualBasic']
             }

# El lazo for extrae los pares (llave, valor) con el metodo items()
for nombre, lenguajes in leng_prog.items():
    print("Lenguajes favoritos de", nombre.capitalize() +  ":")
    for idx, lenguaje in enumerate(lenguajes):
        print("  {}: {}".format(idx+1, lenguaje))
    else:
        print()

Lenguajes favoritos de Juan:
  1: Python

Lenguajes favoritos de Maria:
  1: C
  2: C++

Lenguajes favoritos de Elvio:
  1: HTML
  2: JavaScript
  3: PHP

Lenguajes favoritos de Clodoaldo:
  1: Assembler
  2: Haskell

Lenguajes favoritos de Rosa:
  1: Python
  2: VisualBasic



## Diccionarios en listas
Se puede tener un diccionario como elemento de una lista (o varios). Considere el siguiente código:

In [34]:
# alumnos[0]['apellido']
alumnos = [{'nombre': 'Elvio',
            'apellido': 'Lado',
            'codigo': 'A8383783',
            'email': 'elado@yahoo.com',
           },
           {'nombre': 'Maria',
            'apellido': 'Jimenez',
            'codigo': 'A8309806',
            'email': 'mjimenez@mail.com',
           },
          ]

# Se extraen los elementos de alumnos, donde cada elemento es un diccionario
for idx, alumno in enumerate(alumnos):
    print("ALUMNO", idx+1)
    # Se extraen los pares (llave,valor) de los diccionarios
    for k, v in alumno.items():
        print("  {}: {}".format(k.capitalize(), v))
    else:
        print()

ALUMNO 1
  Nombre: Elvio
  Apellido: Lado
  Codigo: A8383783
  Email: elado@yahoo.com

ALUMNO 2
  Nombre: Maria
  Apellido: Jimenez
  Codigo: A8309806
  Email: mjimenez@mail.com



## Dicionarios en un diccionario
Se puede tener un diccionario donde los elementos serán diccionarios a la vez.

In [35]:
alumnos = {'elazo': 
                {'nombre': 'Elvio',
                'apellido': 'Lado',
                'codigo': 'A8383783',
                'email': 'elado@yahoo.com',
                'telefono': {'movil': '987-345-222',
                             'fijo': '245-3783',
                            }
                },
           'mjimenez': {'nombre': 'Maria',
                'apellido': 'Jimenez',
                'codigo': 'A8309806',
                'email': 'mjimenez@mail.com',
                'telefono': {'movil': '918-727-272',
                            }
               },
          }

# Se extraen las llaves (nombre de usuario) y los valores (diccionarios internos)
for username, user_info in alumnos.items():
    print("\n* Nombre de usuario: {}".format(username))
    print("  * Nombres: {}, {}".format(user_info['apellido'], user_info['nombre']))
    print("  * Codigo: {}".format(user_info['codigo']))
    print("  * Email: {}".format(user_info['email']))
    print("  * Telefono:")
    # Se extraen los pares (llave,valor) de los diccionarios internos
    for tipo_telef, num_telef in user_info['telefono'].items():
        print("    - {}: {}".format(tipo_telef.capitalize(), num_telef))


* Nombre de usuario: elazo
  * Nombres: Lado, Elvio
  * Codigo: A8383783
  * Email: elado@yahoo.com
  * Telefono:
    - Movil: 987-345-222
    - Fijo: 245-3783

* Nombre de usuario: mjimenez
  * Nombres: Jimenez, Maria
  * Codigo: A8309806
  * Email: mjimenez@mail.com
  * Telefono:
    - Movil: 918-727-272
