# Diccionarios

## Conceptos básicos

In [1]:
# definir un diccionario básico
d = {
    'key1':1
    ,'key2':2
    ,'key3':3
}

In [2]:
# accesar los values
d['key1']

1

In [3]:
# accesar los values usando get
print(d.get('key1'))

1


In [4]:
# get() vs accesar normalmente
# si intentamos accesar normalmente a un key que no existe obtenemos error
d['key4']

KeyError: 'key4'

In [5]:
# mientras que si accesamos un key que no existe, obtenemos un NoneType como resultado
print(d.get('key4'))

None


In [6]:
# modificar los values
d['key2'] = 3
d

{'key1': 1, 'key2': 3, 'key3': 3}

In [7]:
# modificar los keys
print('no se puede')

no se puede


## Métodos de diccionarios

### iterables

In [8]:
# iterar sobre los keys de un diccionario
for key in d.keys():
    print(key)

key1
key2
key3


In [9]:
# iterar sobre los values de un diccionario
for value in d.values():
    print(value)

1
3
3


In [10]:
# iterar sobre los elementos de un diccionario
for key, value in d.items():
    print(f'{key} - {value}')

key1 - 1
key2 - 3
key3 - 3


### Modificando el objeto

In [11]:
# eliminar key:val pairs de un diccionario utilizando pop
d.pop('key3')
d

{'key1': 1, 'key2': 3}

In [12]:
# limpiar todos los keys de un diccionario
d2 = {'a':1,'b':2,'c':3}
d2.clear()
d2

{}

In [13]:
# actualizando el diccionario y uniéndolo con otro
d3 = {'v1':1, 'v2':2, 'v3':3, 'a':8}
print(f'd2 antes de agregar keys de d3: \n{d2}')
d2.update(d3)
print(f'd2 despues de aplicar update con los key:val de d3: \n{d2}')

d2 antes de agregar keys de d3: 
{}
d2 despues de aplicar update con los key:val de d3: 
{'v1': 1, 'v2': 2, 'v3': 3, 'a': 8}


### Creando un nuevo diccionario a partir de otro diccionario u otras variables

In [14]:
# copiando un diccionario sin usar la libreria copy
d2 = {'a':1,'b':2,'c':3}
d3 = {}
print(f'd2 --> {d2}')
print(f'd3 antes de copiar --> {d3}')
d3 = d2.copy()
print(f'd3 despues de copiar --> {d3}')

d2 --> {'a': 1, 'b': 2, 'c': 3}
d3 antes de copiar --> {}
d3 despues de copiar --> {'a': 1, 'b': 2, 'c': 3}


In [15]:
# creando un diccionario desde un iterable para asignarle los keys
keys = [f'key{x}' for x in range(5)]
d4 = {}.fromkeys(keys)
# genera el diccionario con todos los values como NoneType
d4

{'key0': None, 'key1': None, 'key2': None, 'key3': None, 'key4': None}

### el keyword del en python y su efecto en diccionarios

In [16]:
# eliminar key:val pairs de un diccionario utilizando del
del d['key2']
d

{'key1': 1}

In [17]:
# Cuidado con del, porque del elimina cualquier variable en la consola de python
del d
d

NameError: name 'd' is not defined

## Dictionary comprehension

In [18]:
# crear diccionarios utilizando dictionary comprehension
keys = ['a','b','c']
values = [x for x in range(3)]

# creando el dict
d = {key:value for key,value in zip(keys, values)}
d

{'a': 0, 'b': 1, 'c': 2}

## Nested dictionaries

In [19]:
# nested dictionaries
keys = ['a1','b1','b2'] 
values = [x for x in range(4,7)]
for key in d.keys():
    d[key] = {key2:value2 for key2,value2 in zip(keys, values)}

d

{'a': {'a1': 4, 'b1': 5, 'b2': 6},
 'b': {'a1': 4, 'b1': 5, 'b2': 6},
 'c': {'a1': 4, 'b1': 5, 'b2': 6}}

In [20]:
# accesar nested dicts
d['a']['b1']

5

In [21]:
# iterar sobre nested dicts
# ejemplo
nested_dict = {
    'primer_nivel_0':{
        'segundo_nivel_0':{
            'tercer_nivel_0':0,
            'tercer_nivel_1':1,
            'tercer_nivel_2':2,
        },
        'segundo_nivel_1':{
            'tercer_nivel_0':0,
            'tercer_nivel_1':1,
            'tercer_nivel_2':2,
        },
        'segundo_nivel_2':{
            'tercer_nivel_0':0,
            'tercer_nivel_1':1,
            'tercer_nivel_2':2,
        }
    }
}

In [22]:
for lvl1 in nested_dict.keys():
    print(f'> {lvl1}')
    for lvl2 in nested_dict[lvl1].keys():
        print(f'>>>>>> {lvl2}')
        for lvl3 in nested_dict[lvl1][lvl2].keys():
            print(f'>>>>>>>>>>> {lvl3}')

> primer_nivel_0
>>>>>> segundo_nivel_0
>>>>>>>>>>> tercer_nivel_0
>>>>>>>>>>> tercer_nivel_1
>>>>>>>>>>> tercer_nivel_2
>>>>>> segundo_nivel_1
>>>>>>>>>>> tercer_nivel_0
>>>>>>>>>>> tercer_nivel_1
>>>>>>>>>>> tercer_nivel_2
>>>>>> segundo_nivel_2
>>>>>>>>>>> tercer_nivel_0
>>>>>>>>>>> tercer_nivel_1
>>>>>>>>>>> tercer_nivel_2


### breve referencia a pandas

#### En pandas, la estructura de datos de DataFrame es (de una manera básica) de la siguiente forma:

In [23]:
basically_a_dataframe = {
    'columna1': {
        0:'valor0',
        1:'valor1',
        2:'valor2',
        3:'valor3'
    },
    'columna2': {
        0:'valor0',
        1:'valor1',
        2:'valor2',
        3:'valor3'
    },
    'columna3': {
        0:'valor0',
        1:'valor1',
        2:'valor2',
        3:'valor3'
    },
}

#### ¿O sea que un dataframe es un json de dos niveles?

### Mas o menos sí, es su propio objeto, pero podemos convertirlo desde diccionario de la siguiente manera

In [24]:
# De hecho, podemos comprobar que este objeto que creamos se convierte directamente a un dataframe sin muchos adornos
import pandas as pd
pd.DataFrame(basically_a_dataframe)

Unnamed: 0,columna1,columna2,columna3
0,valor0,valor0,valor0
1,valor1,valor1,valor1
2,valor2,valor2,valor2
3,valor3,valor3,valor3


## Funciones relacionadas

In [25]:
# la función "dict()"
key_val_tuples = ((a,b) for a,b in zip(keys,values))
print(dict(key_val_tuples))

{'a1': 4, 'b1': 5, 'b2': 6}


In [26]:
# len() retorna la longitud de un diccionario
print(d2)
print(f'longitud de d2 --> {len(d2)}')

{'a': 1, 'b': 2, 'c': 3}
longitud de d2 --> 3


## Usos útiles de diccionarios

In [27]:
# generating random data
import numpy as np
randoms = [np.random.randint(10) for x in range(10)]
randoms2 = []
while len(randoms2) < len(randoms):
    randint = np.random.randint(20)
    if randint not in randoms:
        randoms2.append(randint)

In [28]:
# iterar sobre data para nombrar keys apropiados a los values a utilizar
# útiles al almacenar data de modelos, etc
# Usando fstrings
random_num_dict = {}
for r1,r2 in zip(randoms,randoms2):
    label = f'param_{r1}_{r2}'
    random_num_dict[label] = [r1,r2]
random_num_dict

{'param_8_10': [8, 10],
 'param_7_6': [7, 6],
 'param_9_0': [9, 0],
 'param_4_15': [4, 15],
 'param_4_19': [4, 19],
 'param_2_10': [2, 10],
 'param_4_11': [4, 11],
 'param_4_13': [4, 13],
 'param_5_19': [5, 19],
 'param_3_13': [3, 13]}

## Unpacking

### La siguiente convención para una función definida:
### funcion(param1, param2, **kwargs)
### utiliza unpacking para asignar parámetros a una función

In [29]:
# Unpacking para unir diccionarios
# actualizando el diccionario y uniéndolo con otro
d3 = {'v1':1, 'v2':2, 'v3':3, 'a':8}
d2 = {'a':1,'b':2,'c':3}
print(f'd2 antes de agregar keys de d3: \n{d2}')
d2 = {**d2, **d3}
print(f'd2 despues de aplicar update con los key:val de d3: \n{d2}')

d2 antes de agregar keys de d3: 
{'a': 1, 'b': 2, 'c': 3}
d2 despues de aplicar update con los key:val de d3: 
{'a': 8, 'b': 2, 'c': 3, 'v1': 1, 'v2': 2, 'v3': 3}


##### NOTA: A partir de la próxima versión de python (3.8.5) se utilizará la convención siguiente d2 = {d2} | {d3} a diferencia de d2 = {**d2, **d3} para unir diccionarios, de la misma manera que se hace con conjuntos

In [30]:
# Unpacking para asignar parámetros a una función de manera dinámica
# definimos una función
def multiply_4_numbers(num1, num2, num3, num4):
    return np.prod([num1,num2,num3,num4])

# probamos
sample_function(1,2,3,4)

NameError: name 'sample_function' is not defined

In [31]:
# utilizando unpacking
params = {
    'num1':1
    ,'num2':2
    ,'num3':3
    ,'num4':4
}

# probamos
multiply_4_numbers(**params)

24

In [32]:
# esta función se presta para hacer un diccionario aún más rápido y corto usando un dictionary comprehension y luego unpacking
params = {f'num{x}':x for x in range(1,5)}

# probnamos
multiply_4_numbers(**params)

24

In [33]:
# Y si definimos la función usando unpacking?
def multiply_any_amount_of_numbers(**numbers):
    return np.prod([x for x in numbers.values()])

multiply_any_amount_of_numbers(**{
    'num1':1
    ,'num2':2
    ,'num3':3
    ,'num4':4
})

24

In [34]:
# ok no es el mejor ejemplo del mundo, pero ustedes entienden la idea
def actually_doing_this_function_right(list_of_numbers):
    return np.prod(list_of_numbers)

example = [1,2,3,4]
actually_doing_this_function_right(example)

24

## Muy chulo, pero dame un ejemplo práctico de qué hacer con todo esto

In [35]:
# Mi ejemplo favorito es tener lo que se hace en un loop como subproducto de un proceso como una variable