# Diccionarios

## Programación para Analítica de Datos
## Mtra. Gisel Hernández Chávez

### Contenido principal
+ Diccionarios como iterable de tipo mapping, mutable y no ordenado
+ Creación de un diccionario
+ Operaciones con diccionarios
+ Iteraciones en un diccionario
+ Conversión a lista de tuplas
+ Diccionarios por comprensión
+ Ejemplos y ejercicios


## Creación de un diccionario

In [12]:
d = {}

d1 = dict()
d, d1

({}, {})

In [13]:
d2 = {1:('primero',1.0),2:'segundo',3:'tercero'}
d2

{1: ('primero', 1.0), 2: 'segundo', 3: 'tercero'}

## Elementos, llaves y valores

In [14]:
d2.items()

dict_items([(1, ('primero', 1.0)), (2, 'segundo'), (3, 'tercero')])

In [15]:
list(d2.items())

[(1, ('primero', 1.0)), (2, 'segundo'), (3, 'tercero')]

In [16]:
list(d2.keys())

[1, 2, 3]

In [17]:
list(d2.values())

[('primero', 1.0), 'segundo', 'tercero']

In [18]:
D = {"list":"Liste", "dictionary":"Wörterbuch", "function":"Funktion"} 
list(D.items())

[('list', 'Liste'), ('dictionary', 'Wörterbuch'), ('function', 'Funktion')]

## Eliminación de elementos

In [19]:
directorio = {'Raúl':'555−1111', 'Yanira':'555−3333','José Antonio':'555−2222' } 
directorio

{'Raúl': '555−1111', 'Yanira': '555−3333', 'José Antonio': '555−2222'}

La función del levanta un error si no encuentra la llave por lo que debe usarse solo si la llave está presente, haciendo primero prueba de membresía.

In [20]:
del directorio['Cristóbal']

KeyError: 'Cristóbal'

In [None]:
if 'Chris' in directorio: 
    del directorio['Chris'] 
directorio

{'Raúl': '555−1111', 'Yanira': '555−3333', 'José Antonio': '555−2222'}

También puede emprearse en un bloque try-except

In [None]:
nombre = 'Chris'
try:
    del directorio[nombre] 
except KeyError:
    print('No puede eliminar a {} porque no está en el diccionario'.format(nombre))

No puede eliminar a Chris porque no está en el diccionario


In [None]:
1nombre = 'ana'

SyntaxError: invalid syntax (999911455.py, line 1)

In [None]:
if 4 < 5:
a = 8


## Adición de elementos en el diccionario

In [21]:
directorio['Rosita'] = 555-1234
directorio

{'Raúl': '555−1111',
 'Yanira': '555−3333',
 'José Antonio': '555−2222',
 'Rosita': -679}

Observe que se guardó como valor para la llave 'Rosita' el resultado de una resta.

Si volvemos a adicionar con la misma llave, se borra el valor anterior

In [22]:
directorio['Rosita'] = '555-1234'
directorio

{'Raúl': '555−1111',
 'Yanira': '555−3333',
 'José Antonio': '555−2222',
 'Rosita': '555-1234'}

In [23]:
if 'Rosita' in directorio: 
    directorio['Rosita'] = '555-56789' 
else:
    directorio['Rosita'] = '555-9999'
directorio

{'Raúl': '555−1111',
 'Yanira': '555−3333',
 'José Antonio': '555−2222',
 'Rosita': '555-56789'}

## Tamaño de un diccionario

In [24]:
len(directorio)

4

## Pruebas de membresía

In [25]:
'Bárbara' in directorio, 'Bárbara' not in directorio, 'Yanira' in directorio, 'Yanira' not in directorio

(False, True, True, False)

In [26]:
conjunto =set()
conjunto.add('a')
conjunto

{'a'}

In [27]:
conjunto.add('b')
conjunto

{'a', 'b'}

In [28]:
for i in conjunto:
    print(i)

a
b


In [29]:
for i in range(8): print(i)

0
1
2
3
4
5
6
7


In [None]:
for i,j in enumerate([33,55,66]):
    print(i,j)

In [None]:
directorio

## Iteración de elementos en diccionario sin adiciones ni eliminaciones

In [30]:
for j in directorio:    # la j “recibe” las llaves
    print(j, directorio[j])

Raúl 555−1111
Yanira 555−3333
José Antonio 555−2222
Rosita 555-56789


In [31]:
for valor in directorio.values():
    print(valor)

555−1111
555−3333
555−2222
555-56789


In [32]:
for k in directorio.keys():
    print(k)

Raúl
Yanira
José Antonio
Rosita


In [33]:
for i,j in directorio.items():
    print(i,j)

Raúl 555−1111
Yanira 555−3333
José Antonio 555−2222
Rosita 555-56789


![image.png](attachment:image.png)

## Copia superficial de un diccionario (quedan enlaces a colecciones anidadas; no es una copia profunda)

In [34]:
traduccion ={'es':'is','fue':'was','son':'are','fueron':'were'}

In [35]:
traduccion.keys()

dict_keys(['es', 'fue', 'son', 'fueron'])

In [36]:
copia_traduc = traduccion.copy()
copia_traduc

{'es': 'is', 'fue': 'was', 'son': 'are', 'fueron': 'were'}

## Copia profunda con deepcopy()

In [37]:
import copy
dic_anidaciones = {'ser':[{'es':['is','c\'est'],'fue':['was','il a été'],'son':['are','ils sont'],'fueron':['were','étaient']}]}

In [38]:
dic_anida_sup = copy.copy(dic_anidaciones)
dic_anida_prof = copy.deepcopy(dic_anidaciones)

In [39]:
dic_anida_sup['ser']

[{'es': ['is', "c'est"],
  'fue': ['was', 'il a été'],
  'son': ['are', 'ils sont'],
  'fueron': ['were', 'étaient']}]

In [41]:
dic_anida_sup['ser'][0]

{'es': ['is', "c'est"],
 'fue': ['was', 'il a été'],
 'son': ['are', 'ils sont'],
 'fueron': ['were', 'étaient']}

In [None]:
dic_anida_sup['ser'][0]['fue']

['was', 'il a été']

In [None]:
dic_anida_sup['ser'][0]['fue'] = [i.upper() for i in ['was', 'il a été']]
dic_anida_sup['ser'][0]['fue'] 

['WAS', 'IL A ÉTÉ']

In [None]:
dic_anidaciones['ser'][0]['fue']  # Lo que demuestra que esta copia fue superficial

['WAS', 'IL A ÉTÉ']

## Limpiar contenido del diccionario

In [None]:
traduccion.clear()
traduccion,copia_traduc

({}, {'es': 'is', 'fue': 'was', 'son': 'are', 'fueron': 'were'})

## Retornar valor con get()

In [None]:
traduccion ={'es':'is','fue':'was','son':'are','fueron':'were'}
traduccion.get('fue')

'was'

In [None]:
palabra ='será'
print('La traducción de {}: {}'.format(palabra,traduccion.get(palabra,'No está en el diccionario')))

La traducción de será: No está en el diccionario


## Actualizar con update()

El método update () actualiza el diccionario con los elementos de otro objeto de diccionario o de un iterable de pares clave / valor (generalmente tuplas)

In [None]:
otra_traduccion = {'será':'will be','serán':'will be'}

In [None]:
traduccion.update()
traduccion

{'es': 'is', 'fue': 'was', 'son': 'are', 'fueron': 'were'}

In [None]:
otra_traduccion = {'será':'will be','serán':'will be'}

traduccion.update(otra_traduccion)
traduccion

{'es': 'is',
 'fue': 'was',
 'son': 'are',
 'fueron': 'were',
 'será': 'will be',
 'serán': 'will be'}

In [None]:
traduccion.update(soy = 'am', somos = 'are')
traduccion

{'es': 'is',
 'fue': 'was',
 'son': 'are',
 'fueron': 'were',
 'será': 'will be',
 'serán': 'will be',
 'soy': 'am',
 'somos': 'are'}

## Eliminar y retornar con pop() y popitem()

### pop() retorna el valor asociado a la llave, si la encuentra y elimina el par llave: valor

In [42]:
# Usando prueba de membresía antes de hacer el pop()
# Solución Paulo
if 'es' in traduccion:
    traduccion2 = traduccion.pop('es')
    print(traduccion, traduccion2)
else:
    print('No se puede eliminar ya que no existe ese elemento en el diccionario')


{'fue': 'was', 'son': 'are', 'fueron': 'were'} is


In [None]:
# Usar bloque try except
# Solución Santiago
try:
    traduccion2 = traduccion.pop('es')
    print(traduccion, traduccion2)
except KeyError:
    print(f'No se puede aplicar pop porque ya no se encuentra')

{'fue': 'was', 'son': 'are', 'fueron': 'were', 'será': 'will be', 'serán': 'will be', 'soy': 'am', 'somos': 'are'} is


In [None]:
traduccion, traduccion2

({'fue': 'was',
  'son': 'are',
  'fueron': 'were',
  'será': 'will be',
  'serán': 'will be',
  'soy': 'am',
  'somos': 'are'},
 'is')

In [None]:
traduccion2 = traduccion.pop('es')
traduccion, traduccion2

KeyError: 'es'

In [None]:
traduccion ={'es':'is','fue':'was','son':'are','fueron':'were'}
traduccion.get('fue')

'was'

### popitem() retorna un par llave: valor y lo elimina 

+ ¡AGUAS CON USAR for PARA ELIMINAR! Cambia el tamaño del diccionario

In [43]:
print(traduccion.popitem())

('fueron', 'were')


In [None]:
traduccion

{'es': 'is', 'fue': 'was', 'son': 'are'}

In [None]:
for i in traduccion:
    traduccion3 = traduccion3.update(traduccion.popitem())
traduccion, traduccion3

NameError: name 'traduccion3' is not defined

In [None]:
d = traduccion.popitem()
d, type(d)

(('son', 'are'), tuple)

In [None]:
traduccion3 = dict()
traduccion3

{}

In [None]:
traduccion

{'es': 'is', 'fue': 'was'}

In [None]:
traduccion ={'es':'is','fue':'was','son':'are','fueron':'were'}
traduccion3 = dict()
while len(traduccion) != 0:
    eliminado = traduccion.popitem()
    eliminado = {eliminado[0]:eliminado[1]}
    traduccion3.update(eliminado)
traduccion, traduccion3

({}, {'fueron': 'were', 'son': 'are', 'fue': 'was', 'es': 'is'})

In [None]:
for i in traduccion:
    traduccion3 = traduccion.popitem()
traduccion, traduccion3

({}, {'fueron': 'were', 'son': 'are', 'fue': 'was', 'es': 'is'})

## ¿La i de adentro del for es la misma i del for?

In [None]:
iterable1 = range(5)
for i in iterable1:
    i =5

### La iteración con while es correcta y comprensible si quiero detener la iteración cuando el iterable esté vacío

* Tenga cuidado con el while, no sea que genere un ciclo infinito

In [None]:
while traduccion:
    traduccion3 = traduccion.popitem()
traduccion, traduccion3

({}, {'fueron': 'were', 'son': 'are', 'fue': 'was', 'es': 'is'})

## Convertir diccionario a lista de tuplas y viceversa

In [None]:
D = {"list":"Liste", "dictionary":"Wörterbuch", "function":("Funktion", "función")} 
D.values()

dict_values(['Liste', 'Wörterbuch', ('Funktion', 'función')])

In [None]:
# Podemos convertirlo a lista de tuplas de dos elementos, pero note que toma solo pares 
list(D.items())
[('list', 'Liste'), ('dictionary', 'Wörterbuch'), ('function', 'Funktion')]

[('list', 'Liste'), ('dictionary', 'Wörterbuch'), ('function', 'Funktion')]

## Diccionarios por comprensión

Esta es la plantilla general que puede seguir para la comprensión de diccionarios en Python:

dict_variable = {clave: valor para (clave, valor) en dictionary.items ()}

Esto puede servir como la plantilla básica y más simple. Puede volverse cada vez más complejo a medida que le agregan condiciones.

In [None]:
# Ejemplo en el que se agrega IVA del 16% al valor de un diccionario

In [None]:
dic_precios = {'cel':5000.00, 'compu':18000.00}

In [None]:
dic_tot = {k:v*1.16 for (k,v) in dic_precios.items()}
dic_tot

{'cel': 5800.0, 'compu': 20880.0}

In [None]:
# Puede usar una o más condiciones
# Recuerde que las declaraciones if consecutivas funcionan como si tuvieran cláusulas y entre ellas.

dict1 = {1:1,2:2,3:3,4:4,5:5,6:6}
dict1_doubleCond = {k:v for (k,v) in dict1.items() if v>2 if v%2 == 0}
print(dict1_doubleCond)

{4: 4, 6: 6}


In [None]:
# También puede usar cláusulas else

dict2 = {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5, 'f':6}

# Identify odd and even entries
dict1_tripleCond = {k:('par' if v%2==0 else 'impar') for (k,v) in dict2.items()}

print(dict1_tripleCond)

{'a': 'impar', 'b': 'par', 'c': 'impar', 'd': 'par', 'e': 'impar', 'f': 'par'}



## Ejercicios de tarea
1) A continuación se muestra una tupla que describe un álbum:

 (
 "El lado oscuro de la luna",
 "Pink Floyd",
 1973,
 (
 "Hablame",
 "Respirar",
 "En la carrera",
 "Hora",
 "El gran concierto en el cielo",
 "Dinero",
 "Nosotros y ellos",
 "Cualquier color que te guste",
 "Daño cerebral",
 "Eclipse"
 )
 )
Dentro de la tupla tenemos el nombre del álbum, el artista (en este caso, la banda), el año de lanzamiento y luego otra tupla que contiene la lista de pistas.

    a. Convierta esta tupla en un diccionario con clave de los tres primeros elementos y como valor la tupla de pistas.
    b. Cree otro diccionario con tres elementos, cada uno de los cuales tendrá álbum, artista y año de lanzamiento como clave y en los tres casos el valor es la tupla de pistas. 
        + Luego, para cada clave y valor, debe imprimir el nombre de la clave y luego el valor junto a ella.
        + Elimine el elemento con clave año de lanzamiento del diccionario que creó. Una vez que haya hecho esto, agregue una nueva clave al diccionario para almacenar la fecha completa de lanzamiento, que fue el 1 de marzo de 1973.
        + Intente recuperar uno de los valores que eliminó del diccionario. Esto debería darle un KeyError. Una vez que haya intentado esto, repita el paso utilizando el método get para evitar que se genere la excepción.

2) Usando un diccionario por comprensión cree otro diccionario a partir del diccionario "directorio" visto en clase concatenando en la llave los apellidos de las personas que están en una lista.

3) Cree un diccionario donde la clave sea un número divisible por 2 en un rango de 0 a 10 y su valor sea el cuadrado del número.

4) Dada la tupla:

a_tuple = ((1, "a"), (2, "b"))

    a. Cree un diccionario donde la llave sean los números
    b. Cree otro diccionario donde la llave sean las cadenas usando un diccionario por comprensión.


In [None]:
tu =tuple(i for i in (1,2,3))
tu

(1, 2, 3)

In [None]:
tupla_album = (
 "El lado oscuro de la luna",
 "Pink Floyd",
 1973,
 (
 "Hablame",
 "Respirar",
 "En la carrera",
 "Hora",
 "El gran concierto en el cielo",
 "Dinero",
 "Nosotros y ellos",
 "Cualquier color que te guste",
 "Daño cerebral",
 "Eclipse"
 )
 )


In [None]:
dict_album = {tupla_album[0:3]: tupla_album[3]}
dict_album

{('El lado oscuro de la luna', 'Pink Floyd', 1973): ('Hablame',
  'Respirar',
  'En la carrera',
  'Hora',
  'El gran concierto en el cielo',
  'Dinero',
  'Nosotros y ellos',
  'Cualquier color que te guste',
  'Daño cerebral',
  'Eclipse')}

## Ejercicio aplicando Teorema de Bayes

En la provincia de Soria, el negocio de acceso a Internet se reparte entre dos operadores, Timofónica y Robafone y dos únicas marcas de routers, Xisco y Nuaweii. En Soria, la cuota de mercado de Timofónica es del 60% y de Robafone el resto. El 70% de los usuarios dispone de router Xisco y el 30% de ambas marcas. Además se sabe que la probabilidad de corte de acceso es 0.1 para usuarios de Timofónica, 0.15 para Robafone y 0.05 para routers Xisco.

¿Cuál es la probabilidad de que a un usuario se le corte el Internet?

Primero vamos a definir un diccionario pr con las probabilidades que nos da el enunciado. Tenemos varias probabilidades relacionadas con un usuario: operador, router, fallos condicionados, ...

In [None]:
pr = dict()
pr["Timofónica"] = 0.6
pr["Robafone"] = 0.4
pr["Xisco"] = 0.7
pr["Xisco Y Nuaweii"] = 0.3
pr["Corte | Timofónica"] = 0.1
pr["Corte | Robafone"] = 0.15
pr["Corte | Xisco"] = 0.05

In [None]:
pr

{'Timofónica': 0.6,
 'Robafone': 0.4,
 'Xisco': 0.7,
 'Xisco Y Nuaweii': 0.3,
 'Corte | Timofónica': 0.1,
 'Corte | Robafone': 0.15,
 'Corte | Xisco': 0.05}

Para calcular la probabilidad de corte de un usuario hay que sumar la probabilidad de ser usuario de una compañía y tener un corte y de ser de otra compañía y tener un corte.

In [None]:
pr["Corte"] =  pr["Corte | Timofónica"] * pr["Timofónica"] + pr["Corte | Robafone"] * pr["Robafone"]
pr["Corte"]

0.12

En este caso Pr{Corte} = 0.12, o lo que es lo mismo, la probabilidad de que un usuario cualquiera de Soria tenga un corte es del 12%.

Si se sabe que un usuario tiene la línea cortada, ¿cuál es la probabilidad de que tenga router Xisco en casa?
En este caso se pide Pr{Xisco|Corte}. Según el teorema de Bayes, esto es:

In [None]:
pr["Xisco | Corte"] = pr["Xisco"] * pr["Corte | Xisco"] / pr["Corte"]
round(pr["Xisco | Corte"],4)

0.2917

Que da una probabilidad de 0,29. Es decir, si el usuario tiene un corte, la probabilidad de que en su casa tenga un router Xisco es del 29%.

¿Cuál es la probabilidad de que se produzca un corte a un usuario que no tiene un router Xisco?

En este caso se pide Pr{Corte | Nuaweii}. Y tenemos un pequeño problema y es que no sabemos la probabilidad de que un usuario tenga en su casa Nuaweii. Con un poco de manipulación matemática podemos obtener una expresión que no depende de Pr{Nuaweii}.

Pr{'Corte|Nuaweii'} = Pr{'Corte ∩ Nuaweii'} / Pr{'Nuaweii'}
Pr{'Corte|Nuaweii'} = Pr{'Corte∩(Ω−Xisco)'} / 1 − Pr{'Xisco'}
Pr{'Corte|Nuaweii'} = Pr{'Corte−Corte∩Xisco'} / 1 − Pr{'Xisco'}
Pr{'Corte|Nuaweii'} = Pr{'Corte'} − Pr{'Corte∩Xisco'} / 1 − Pr{'Xisco'}

Se emplea la definición de probabilidad conjunta, que es la probabilidad de ocurrencia de dos o más eventos.

De la expresión P(B|A)=P(A∩B)/P(A) se puede despejar P(A∩B)=P(A)P(B|A), expresión llamada Ley de multiplicación de probabilidades.

P(A∩B) recibe el nombre de probabilidad conjunta y corresponde a la probabilidad de que se presenten resultados comunes a los eventos A y B.

En Python:

In [None]:
pr["Corte | Nuaweii"] = (pr["Corte"] - pr["Xisco"]*pr["Corte | Xisco"])/(1-pr["Xisco"])
round(pr["Corte | Nuaweii"],4) 

0.2833

## Extra, extra

+ Se define una clase Luchador
+ alist es una lista de dos objetos de la clase Luchador
+ Se convierte a tupla usando lista por comprensión
+ Se convierte a tupla usando expresión generadora

In [None]:
class Luchador:

    # Inicializador / Atributos de instancia
    def __init__(self, nombre, edad):
        self.nombre = nombre
        self.edad = edad


In [None]:
alist = [Luchador('Santo',33), Luchador('Blur Demon',45)]

In [None]:
type(alist)

list

In [None]:
tupla = tuple([(elemento.nombre, elemento.edad) for elemento in alist])
tupla

(('Santo', 33), ('Blur Demon', 45))

In [None]:
tupla = tuple((elemento.nombre, elemento.edad) for elemento in alist)
tupla

(('Santo', 33), ('Blur Demon', 45))