# Estructura de datos: Diccionarios
- Los diccionarios en Python son una estructura de datos que permite almacenar su contenido en forma de clave y valor.
- Son dinámicos: se pueden añadir o eliminar elementos.
- Son indexados a través de la clave.
- Son anidados: un diccionario puede contener a otro diccionario en su campo valor.




### Definición de diccionarios

In [None]:
datos1 = {'nombre' : 'Juan', 'edad' : 22, 'calficaciones':[10,8,9]}

In [None]:
datos1

### Otra manera de definir diccionarios

In [None]:
datos2 = dict(nombre='Pedro', edad=28)

In [None]:
datos2

### Diccionarios anidados

In [None]:
datos3 = {'nombre' : 'Juan', 'edad' : 22, 'calificaciones': {'matematicas': 10, 'español': 8, 'biología': 9}}

In [None]:
datos3

# Combinar datos

In [None]:
registro = {1:datos1,2:datos2}

In [None]:
registro

# Acceder a los datos

In [None]:
datos3 = {'nombre' : 'Juan', 'edad' : 22, 'calificaciones': {'matematicas': 10, 'español': 8, 'biología': 9}}
datos3['calificaciones']['español']

# Asignar valores

In [None]:
datos3 = {'nombre' : 'Juan', 'edad' : 22, 'calificaciones': {'matematicas': 10, 'español': 8, 'biología': 9}}
print(datos3)

datos3['nombre']= 'Juan Carlos' 
print(datos3)

# Eliminar datos

In [None]:
datos3 = {'nombre' : 'Juan', 'edad' : 22, 'calificaciones': {'matematicas': 10, 'español': 8, 'biología': 9}}
print(datos3)

del datos3['edad']
print(datos3)

# Recuperar valores

In [None]:
datos3 = {'nombre' : 'Juan', 'edad' : 22, 'calificaciones': {'matematicas': 10, 'español': 8, 'biología': 9}}
nombre = datos3['nombre']
print(nombre)

nombre = datos3.get('nombre')
print(nombre)


# Membresia

In [None]:
registro = { 'María': { 'edad' : 22, 'calificaciones': {'matematicas': 10, 'español': 8, 'biología': 9}}, 
             'Juan':  { 'edad' : 28, 'calificaciones': {'matematicas': 9, 'español': 9, 'biología': 9}}, 
             'Pedro': { 'edad' : 28, 'calificaciones': {'matematicas': 9, 'español': 9, 'biología': 9}}, 
             }

'María' in registro

In [None]:
nombre = 'María'
if nombre in registro:
    print("Existe el registro de {nombre}")


In [None]:
registro['Pedro']

# Conteo

In [None]:

s = "Hola mundo hola todos"
dat={}
for c in s:
    if c in dat:
        dat[c] = dat[c] + 1
    else:
        dat[c] = 1            

In [None]:
print(dat)

# Tipo de dato: Counter
- Counter es una subclase de dict que está especialmente diseñada para contar objetos hash en Python.
- Es un diccionario que asigna objetos como claves y un contador como valores

In [None]:
from collections import Counter
cnt =  Counter(s)
cnt

In [None]:
from collections import Counter
caracteres =  Counter()
for c in s:
       caracteres[c] +=1

caracteres

In [None]:
from collections import Counter

inventario = Counter(
    manzanas=10,
    naranjas=15,
    papas=0,
    jitomates=5
)

In [None]:
inventario

In [None]:
print(list(inventario.keys()))
print(list(inventario.values()))

In [None]:
import matplotlib.pyplot as plt

k=list(caracteres.keys())
v=list(caracteres.values())
print(k,v)
x_pos = [i for i, _ in enumerate(k)]
plt.xticks(x_pos, k)
plt.bar(x_pos, v, align='center')


In [None]:
caracteres.update("ooooooooo sssssss")
caracteres

In [None]:
# los 3 mas comunes en la colección
caracteres.most_common(3)

In [None]:
# iterar en la coleccion de datos 
for i in caracteres.items():
    print(i)

# Estructura de datos: set
- Los elementos de un set son único,  no puede haber elementos duplicados.
- Los set son desordenados, no mantienen el orden de cuando son declarados.
- Sus elementos deben ser inmutables.

In [None]:
A = set(['aaa', '1', 'b', 3, '4', 'c', 'a','a','a'])
B = set(['aa', '1', 'bb', 3, '5', 'c', 'a'])

In [None]:
A

In [None]:
B

In [None]:
AA = set("anita lava la tina")

In [None]:
AA

In [None]:
A.union(B)

In [None]:
A.intersection(B)

# Tuplas
- Permite almacenar datos similar  a las listas, los elementos son inmutables (no pueden cambiar).
- No pueden ser modificadas una vez declaradas

In [64]:
tupla = (1, 2, 3)
tupla2 = 5, 6, 7

print(type(tupla)) #<class 'tuple'>
print(type(tupla2)) #<class 'tuple'>
print(tupla)       #(1, 2, 3)
print(tupla2)       #(1, 2, 3)


<class 'tuple'>
<class 'tuple'>
(1, 2, 3)
(5, 6, 7)


In [66]:
# Inmutables

#tupla[0] = 5 # Error! TypeError

tupla[0] = 5 

TypeError: 'tuple' object does not support item assignment

In [68]:
# Se puede iterar

tupla = (1, 2, 3)
for t in tupla:
    print(t) #1, 2, 3

1
2
3


In [75]:
# Asignar elementos a N variables
l = (10, 20, 30)
x, y, z = l
print(x, y, z) 

10 20 30


# Gutenberg project
http://www.gutenberg.org

# Lectura de archivos

In [None]:
k = 0
f = open("celestina.txt", 'r', encoding='utf8')
text = f.readlines()
print(text)
f.close()
        


In [None]:
# primeras 10 lineas
text[:10]



In [None]:
# Cadena vacía se evalua como False
x =""
bool(x)

In [None]:
for i in text[:10]:
    d = i.strip()
    if d:
        print(d)

In [None]:
# split()
"Hola mundo, saludos".split()

In [None]:
# startswith()
"Hola mundo, saludos".startswith('Hol')

In [None]:
# lower()
"Hola MUNDO, Saludos".lower()

In [None]:
# upper()
"Hola MUNDO, Saludos".upper()

In [None]:
# replace
"Hola MUNDO, Saludos".replace("MUNDO", "Juan")

# Ejercicios en clase
- Definir una función que calcule  el coeficiente de similitud de Jaccard para dos cadenas proporcionadas
- Definir una función que calcule  el coeficiente  de similitud de Dice para dos cadenas proporcionadas
- Definir una función que grafique los símbolos dentro de un archivo proporcionado por el usuario, por ejemplo,  el libro la Celestina.txt 


# Coeficiente de Jaccard 
# $J(A,B) = \frac{|A \cap B|}{|A \cup  B|}$


# Coeficiente de Dice 
# $$D(A,B) =  \frac{ 2 \times |A \cap B|}{|A| + |B|}$$

In [62]:
# ejemplo de cadenaspor comparar
a="casuchas"
b="casitas"