# Asignación de claves a varios valores en un diccionario

1.6

- Problema

        Desea crear un diccionario que asigne claves a más de un valor (un llamado “Multidict”).
- Solución

        Un diccionario es una asignación en la que cada clave se asigna a un valor único.   
        Si quieres asignar claves a múltiples valores, necesita almacenar los múltiples   
        valores en otro contenedor como una lista o conjunto.   
        Por ejemplo, puede crear diccionarios como este:

In [2]:
d = {
'a' : [1, 2, 3],
'b' : [4, 5]
}
e = {
'a' : {1, 2, 3},
'b' : {4, 5}
}

In [3]:
d

{'a': [1, 2, 3], 'b': [4, 5]}

In [4]:
e

{'a': {1, 2, 3}, 'b': {4, 5}}

La elección de utilizar o no listas o conjuntos depende del uso previsto.  
Use una lista si desea conservar el orden de inserción de los elementos.  
Utilice un conjunto si desea eliminar duplicados (y no les importa el orden).  
Para construir fácilmente dichos diccionarios, puede usar defaultdict en las colecciones módulo.   
Una característica de defaultdict es que inicializa automáticamente el primer valor para
simplemente puede concentrarse en agregar elementos.    
Por ejemplo:

In [5]:
from collections import defaultdict

In [6]:
d = defaultdict(list)
d['a'].append(1)
d['a'].append(2)
d['b'].append(4)

In [7]:
d

defaultdict(list, {'a': [1, 2], 'b': [4]})

In [8]:
s = defaultdict(set)
s['a'].add(1)
s['a'].add(2)
s['b'].add(4)
s['a'].add(1)
s['a'].add(2)
s['b'].add(4)

In [9]:
s

defaultdict(set, {'a': {1, 2}, 'b': {4}})

Una precaución con defaultdict es que creará automáticamente entradas de diccionario para
claves a las que se accede más adelante (incluso si no se encuentran actualmente en el diccionario).   
Si no desea este comportamiento, puede usar setdefault () en un diccionario ordinario. por
ejemplo:

In [10]:
e = {} # Un diccionario normal
e.setdefault('a', []).append(1)
e.setdefault('a', []).append(2)
e.setdefault('b', []).append(4)
# Sin embargo, muchos programadores encuentran que setdefault () es un poco antinatural, 
# sin mencionar el hecho de que siempre crea una nueva instancia del valor inicial en cada invocación.
# (la lista vacía [] en el ejemplo).

In [11]:
e

{'a': [1, 2], 'b': [4]}

In [12]:

d = {}
for key, value in e.items():
    if key not in d:
        d[key] = []
    d[key].append(value)
d

{'a': [[1, 2]], 'b': [[4]]}

In [13]:
d = defaultdict(list)
for key, value in e.items():
    d[key].append(value)
d

defaultdict(list, {'a': [[1, 2]], 'b': [[4]]})

# Mantener los diccionarios en orden

1.7

- Problema

        Quiere crear un diccionario y también quiere controlar el orden de los elementos cuando
        iterando o serializando.
- Solución

        Para controlar el orden de los elementos en un diccionario, puede utilizar un OrderedDict del
        módulo de collections . Conserva exactamente el orden de inserción original de los datos cuando iterando.   

Por ejemplo:

In [14]:
from collections import OrderedDict

In [15]:
d = OrderedDict()
d['foo'] = 1
d['bar'] = 2
d['spam'] = 3
d['grok'] = 4

In [16]:
d

OrderedDict([('foo', 1), ('bar', 2), ('spam', 3), ('grok', 4)])

In [17]:
for key in d:
    print(key, d[key])

foo 1
bar 2
spam 3
grok 4


Un OrderedDict puede resultar especialmente útil cuando desee crear un mapeo que es posible que desee serializar o codificar posteriormente en un formato diferente.  
Por ejemplo, si quieres para controlar con precisión el orden de los campos que aparecen en una codificación JSON,   
primero construyendo el Los datos en un OrderedDict 

In [18]:
import json
json.dumps(d)

'{"foo": 1, "bar": 2, "spam": 3, "grok": 4}'

> *Nota*:

> Un OrderedDict mantiene internamente una lista doblemente enlazada que ordena las claves según al pedido de inserción. Cuando se inserta un nuevo elemento por primera vez, se coloca al final de esta lista. 
La reasignación posterior de una clave existente no cambia el orden.
Tenga en cuenta que el tamaño de un OrderedDict es más del doble que un dictado normal.
importante debido a la lista adicional vinculada que se crea. Por lo tanto, si va a crear un
estructura que involucra una gran cantidad de instancias de OrderedDict (por ejemplo, leer 100,000 líneas
de un archivo CSV en una lista de instancias de OrderedDict), necesitaría estudiar los requisitos de su aplicación para > determinar si los beneficios de usar un OrderedDict
superó la sobrecarga de memoria adicional.

# Calcular con diccionarios

1.8

- Problema

        Quiere realizar varios cálculos (por ejemplo, valor mínimo, valor máximo, clasificación etc.) 
        en un diccionario de datos.

- Solución
        
        Considere un diccionario que correlacione los nombres de las acciones con los precios:

In [19]:
precios = {
            'ACME': 45.23,
            'AAPL': 612.78,
            'IBM' : 205.55,
            'HPQ' : 37.20,
            'FB'  : 10.75
}

In [20]:
max(zip(precios.values(),precios.keys()))

(612.78, 'AAPL')

In [21]:
min(zip(precios.values(),precios.keys()))

(10.75, 'FB')

In [22]:
precios_ordenados=sorted(zip(precios.values(),precios.keys()))

In [23]:
precios_ordenados

[(10.75, 'FB'),
 (37.2, 'HPQ'),
 (45.23, 'ACME'),
 (205.55, 'IBM'),
 (612.78, 'AAPL')]

In [24]:
{x[1]:x[0] for x in sorted(zip(precios.values(),precios.keys()))}

{'FB': 10.75, 'HPQ': 37.2, 'ACME': 45.23, 'IBM': 205.55, 'AAPL': 612.78}

In [37]:
prices_and_names = zip(precios.values(), precios.keys())
print(min(prices_and_names))
# OK
print(max(prices_and_names))
# ValueError: max() arg is an empty sequence

(10.75, 'FB')


ValueError: max() arg is an empty sequence

In [25]:
prices = { 'AAA' : 45.23, 'ZZZ': 45.23 }
print(min(zip(prices.values(), prices.keys())))
print()
print(max(zip(prices.values(), prices.keys())))


(45.23, 'AAA')

(45.23, 'ZZZ')


# Encontrar puntos en común en dos diccionarios

1.9

- Problema

        Tiene dos diccionarios y quiere saber qué pueden tener en común (el mismo claves, mismos valores, etc.).

- Solución

        Considere dos diccionarios:

In [27]:
a = {'x' : 1 ,'y' : 2 ,'z' : 3}
b = {'w' : 10,'x' : 11,'y' : 2}
display(a)
display(b)

{'x': 1, 'y': 2, 'z': 3}

{'w': 10, 'x': 11, 'y': 2}

Para averiguar qué tienen en común los dos diccionarios, simplemente realice un conjunto común
operaciones utilizando los métodos keys () o items ().   
Por ejemplo:

In [28]:
# Buscar keys en comun
print(a.keys() & b.keys())
# { 'x', 'y' }
# Buscar keys en  a que no estan en  b
print(a.keys() - b.keys())
# { 'z' }
# buscar (key,value) pares en comun
print(a.items() & b.items()) # { ('y', 2) }

{'y', 'x'}
{'z'}
{('y', 2)}


In [29]:
union=(a.items() | b.items())

In [30]:
type(union)

set

In [31]:
union

{('w', 10), ('x', 1), ('x', 11), ('y', 2), ('z', 3)}

In [32]:
print(a)
print(b)
c = { key : a[key] for key in a.keys() - {'z',"w"} }
c

{'x': 1, 'y': 2, 'z': 3}
{'w': 10, 'x': 11, 'y': 2}


{'y': 2, 'x': 1}

___

# Encontrar numeros impares que no son primos usando conjuntos por comprensión

In [2]:
%%time
# Generar números impares del 1 al 100
impares = {x for x in range(1, 101, 2)}

# Función para verificar si un número es primo
def es_primo(n):
    if n < 2:
        return False
    for i in range(2, int(n**0.5) + 1):
        if n % i == 0:
            return False
    return True

# Obtener primos en el rango
primos = {x for x in range(1, 101) if es_primo(x)}

# Imprimir impares que no son primos
print("Los impares que no son primos en un rango de 1 a 100:\n", *(impares - primos))

Los impares que no son primos en un rango de 1 a 100:
 1 9 15 21 25 27 33 35 39 45 49 51 55 57 63 65 69 75 77 81 85 87 91 93 95 99
CPU times: user 255 µs, sys: 0 ns, total: 255 µs
Wall time: 243 µs


# 
___

# Eliminar duplicados de una secuencia mientras mantiene el orden

1.10



- Problema

        Desea eliminar los valores duplicados en una secuencia, pero conserva el orden de los  
        elementos restantes.

- Solución

        Si los valores de la secuencia son hash, el problema se puede resolver fácilmente usando un conjunto y un generador.   

Por ejemplo:

In [5]:
def unicos_con_orden(items): 
    def _unicos(items):
        seen = set()              # Conjunto para almacenar elementos ya vistos
        for item in items:        # iteremos sobre los elementos de la secuencia
            if item not in seen:  # Si el elemento no está en el conjunto...
                yield item        # Lo devuelve (lo "produce" como generador)
                seen.add(item)    # Y lo agrega al conjunto para futuras comparaciones
    return list(_unicos(items))   # Convierte el generador en una lista y la devuelve


lista=[1235,1,356,1,1235,25,-2,356]
print(lista)
print()
print(set(lista))
print()
print(unicos_con_orden(lista))

[1235, 1, 356, 1, 1235, 25, -2, 356]

{1, 356, 1235, 25, -2}

[1235, 1, 356, 25, -2]


In [6]:
a = [1, 5, 2, 1, 9, 1, 5, 10]
unicos_con_orden(a)

[1, 5, 2, 9, 10]

Esto solo funciona si los elementos de la secuencia son hash. Si estas tratando de eliminar
duplicados en una secuencia de tipos no codificables (como dicionarios), puede hacer un ligero
cambio, de la siguiente manera:

In [36]:
def unicos_con_orden2(items, key=None):
    def _unicos(items):
        seen = set()
        for item in items:
            val = item if key is None else key(item)
            if val not in seen:
                yield item
                seen.add(val)
    return list(_unicos(items))

a = [ {'x':1, 'y':2}, {'x':1, 'y':3}, {'x':1, 'y':2}, {'x':2, 'y':4}]
print(a)
unicos_con_orden2(a, key = lambda d: (d['x'],d['y']))

In [7]:
def unicos_con_orden2(items, key=None):
    def _unicos(items):
        seen = set()   # Conjunto para almacenar valores ya vistos
        for item in items:
            # Si hay una función `key`, se usa su resultado como identificador
            val = item if key is None else key(item)  
            if val not in seen:     # Si el identificador no ha sido visto antes...
                yield item          # Se devuelve el elemento original
                seen.add(val)       # Se agrega el identificador al conjunto de vistos
    return list(_unicos(items))     # Convierte el generador en una lista y la retorna


In [8]:
a = [ {'x':1, 'y':2}, {'x':1, 'y':3}, {'x':1, 'y':2}, {'x':2, 'y':4}]
print(a)
unicos_con_orden2(a, key = lambda d: (d['x'],d['y']))

[{'x': 1, 'y': 2}, {'x': 1, 'y': 3}, {'x': 1, 'y': 2}, {'x': 2, 'y': 4}]


[{'x': 1, 'y': 2}, {'x': 1, 'y': 3}, {'x': 2, 'y': 4}]

# Nombrar Slice

1.11

- Problema

        Su programa se ha convertido en un desorden ilegible de índices de rebanada codificados y desea limpiarlo.

- Solución

        Suponga que tiene algún código que está extrayendo campos específicos de un registro de
cadena con campos fijos (por ejemplo, de un archivo plano o similar formato):

In [136]:
record = '....................100          .......513.25..........'
cost = int(record[20:23]) * float(record[40:46])
cost

51325.0

In [137]:
SHARES = slice(20,23)
PRICE  = slice(40,46)
print(SHARES)
print(PRICE)

slice(20, 23, None)
slice(40, 46, None)


In [139]:
print(record[SHARES])
print(record[PRICE])

100
513.25


In [140]:
print(int(record[SHARES]) * float(record[PRICE]))

51325.0


In [142]:
items = [0, 1, 2, 3, 4, 5, 6]
a     = slice(2, 4)
items[a]

[2, 3]

In [143]:
items[a] = [10,11]
items

[0, 1, 10, 11, 4, 5, 6]

In [144]:
del items[a]
items

[0, 1, 4, 5, 6]

# Determinación de los elementos que ocurren con más frecuencia en una secuencia

1.12


- Problema

        Tiene una secuencia de elementos y le gustaría determinar los que ocurren con más frecuencia elementos de la secuencia.

- Solución

        La clase collections.Counter está diseñada para tal problema. Incluso viene con
        un práctico método most_common () que le dará la respuesta.
        Para ilustrarlo, supongamos que tiene una lista de palabras y desea averiguar qué palabras ocurren con mayor frecuencia. 

Así es como lo haría:

In [145]:
from collections import Counter

In [175]:
texto="""
Problema
        Tiene una secuencia de elementos y le gustaría determinar los que ocurren con más frecuencia
        elementos de la secuencia.
- Solución
        La clase collections.Counter está diseñada para tal problema. Incluso viene con
        un práctico método most_common () que le dará la respuesta.
        Para ilustrarlo, supongamos que tiene una lista de palabras y desea averiguar qué palabras
        ocurren con mayor frecuencia. 
""".split()

In [176]:
palabras = Counter(texto)
top_4 = palabras.most_common(4)
print(top_4)

[('de', 3), ('que', 3), ('con', 3), ('una', 2)]


In [177]:
palabras["lista"]

1

In [178]:
palabras["elementos"]

2

In [179]:
palabras["()"]

1

In [180]:
masPalabras = """
Como entrada, los objetos Counter se pueden alimentar con cualquier secuencia de elementos de entrada hash. 
Por devajo , un contador es un diccionario que asigna los elementos al número de ocurrencias. por ejemplo:""".split()
for palabra in masPalabras:
    palabras[palabra] += 1


In [181]:
palabras.most_common(4)

[('de', 6), ('elementos', 4), ('que', 4), ('con', 4)]

In [182]:
otras = "O, alternativamente, puede usar el método update () :".split()
palabras.update(otras)

In [183]:
palabras["()"]

2

In [187]:
combinando = """
Una característica poco conocida de las instancias de Counter es que se pueden combinar fácilmente usando
varias operaciones matemáticas. 
Por ejemplo :""".split()


In [188]:
combinado2="""
No hace falta decir que los objetos Counter son una herramienta tremendamente útil para casi cualquier tipo de
problema en el que es necesario tabular y contar datos. Deberías preferir esto al Soluciones escritas 
manualmente que involucran diccionarios.""".split()

In [197]:
a = Counter(combinando)
b = Counter(combinado2)
c = a + b
print( c)

Counter({'que': 4, 'de': 3, 'Counter': 2, 'es': 2, 'Una': 1, 'característica': 1, 'poco': 1, 'conocida': 1, 'las': 1, 'instancias': 1, 'se': 1, 'pueden': 1, 'combinar': 1, 'fácilmente': 1, 'usando': 1, 'varias': 1, 'operaciones': 1, 'matemáticas.': 1, 'Por': 1, 'ejemplo': 1, ':': 1, 'No': 1, 'hace': 1, 'falta': 1, 'decir': 1, 'los': 1, 'objetos': 1, 'son': 1, 'una': 1, 'herramienta': 1, 'tremendamente': 1, 'útil': 1, 'para': 1, 'casi': 1, 'cualquier': 1, 'tipo': 1, 'problema': 1, 'en': 1, 'el': 1, 'necesario': 1, 'tabular': 1, 'y': 1, 'contar': 1, 'datos.': 1, 'Deberías': 1, 'preferir': 1, 'esto': 1, 'al': 1, 'Soluciones': 1, 'escritas': 1, 'manualmente': 1, 'involucran': 1, 'diccionarios.': 1})


In [201]:
print(a["de"])
print(b["de"])
c["de"]

2
1


3

In [193]:
d = a - b 
print(d)

Counter({'Una': 1, 'característica': 1, 'poco': 1, 'conocida': 1, 'de': 1, 'las': 1, 'instancias': 1, 'se': 1, 'pueden': 1, 'combinar': 1, 'fácilmente': 1, 'usando': 1, 'varias': 1, 'operaciones': 1, 'matemáticas.': 1, 'Por': 1, 'ejemplo': 1, ':': 1})


In [202]:
print(a["de"])
print(b["de"])
d["de"]

2
1


1