# Conf 6 DICCIONARIOS. ARCHIVOS JSON

Los elementos de una lista pueden ser accedidos y modificados (por eso se dice que las listas son mutables), posicionalmente a través de un **índice**

Si `l` es una variable cuyo valor es una lista `l[k]` denota el elemento en la posición `k`. `k `tiene que ser un valor entre `0 `y la cantidad de elementos de la lista `len(l)-1`. Aunque usualmente los elementos de una lista son de un mismo tipo, loa valores de una lista pueden ser de cualquier tipo.

Una característica importante de las listas es que independientemente del valor de k el acceso al elemento l[k] siempre demora un tiempo fijo. Esto permite predecir el tiempo que. en dependencia de la cantidad n de elementos en la lista, puede demorar el procesamiento que se haga con los mismos.

Al igual que las listas los **diccionarios** son estructuras de datos formadas por varios datos. Los diccionarios pueden verse como colecciones de pares de datos que suelen denominarse _llave_ (_key_) y _valor_ (_value_). Si `d` tiene como valor un diccionario entonces los valores en el diccionario puedes ser accedidos en la forma `d`[_llave_] que denotará al valor asociado a esa _llave_. El siguiente ejemplo nos ilustra un diccionario de contactos donde cada llave (en este caso una cadena con el nombre de la persona) tiene asociado un valor (en este ejemplo un entero con su número de teléfono)

`contactos = { "juan":55053344, "maría":78332526, "casa":79326573 }`

En este caso `contactos["maría"]` nos daría el valor `78332526`

El diccionario no pone restricciones sobre qué se usa como _llave_ y sobre cuál es su `valor asociado`. Depende de lo que usted quiera representar con el diccionario. En este ejemplo las llaves siempre son `string` que expresan el *nombre de in contact*o y los valores son enteros que expresan _números de teléfono_

La operación print escribe un diccionario en un formato predefinido pero usted puede acceder a sus componentes y escribirlo como le convenga como puede verse ejecutando el código a continuación


### 6.1 Operaciones sobre diccionarios

In [2]:
contactos = { "juan":55053344, "maría":78332526, "casa":79326573 }
print(contactos)

#Accediendo al telefono de maría
print(f'El teléfono de {"maría"} es {contactos["maría"]}')

#Cambiando el teléfono de casa
contactos["casa"] = 78324031
print(contactos)

#Añadiendo un nuevo contacto es similar a cambiar, si la llave no existe crea la entrada
contactos["pepe (carpintero)"] = 56062230
print(contactos)

#Escribiendo todos mis contactos
print(contactos.keys())
for s in contactos.keys():
    print(s)

#Escribiendo todos los pares contacto teléfono
print(contactos.items())
for x in contactos.items():
    print(x)

x = contactos["maría"]
print(x)


{'juan': 55053344, 'maría': 78332526, 'casa': 79326573}
El teléfono de maría es 78332526
{'juan': 55053344, 'maría': 78332526, 'casa': 78324031}
{'juan': 55053344, 'maría': 78332526, 'casa': 78324031, 'pepe (carpintero)': 56062230}
dict_keys(['juan', 'maría', 'casa', 'pepe (carpintero)'])
juan
maría
casa
pepe (carpintero)
dict_items([('juan', 55053344), ('maría', 78332526), ('casa', 78324031), ('pepe (carpintero)', 56062230)])
('juan', 55053344)
('maría', 78332526)
('casa', 78324031)
('pepe (carpintero)', 56062230)
78332526


## 6.2 Un diccionario para representar todos los datos de una entidad
_Un diccionario es una estructura ideal para representar las diferentes características de una entidad_ (un **objeto**  que es como lo llamaremos mas adelante).

Por ejemplo los datos de un _contacto_ se pueden representar con un diccionario

`{ "nombre":"Juana Pérez Pérez", "telefonos":[55053344, 78304266], "direccion":"12 #333 e/21 y 19, Plaza", "email":"juanapp@gmail.com", "fecha_nac": "8/10/2000"}`

No hay restricción sobre cuál puede ser el tipo del valor que se use como _llave_ (key) y el tipo del _valor_ (value) asociado a la llave. Es usual que se use como llave una cadena (string) porque nos ayuda a identificar un rasgo, una caraterística, una cualidad, como en el ejemplo anterior. Note en este ejemplo como el valor asociado a la llave `teléfonos` es una _lista de enteros_ con números de teléfono porque un contacto puede tener más de un teléfono

Los datos de un film se pueden representar con un diccionario, por ejemplo

`{
    "titulo": "El padrino I",

    "pais": ["Estados Unidos"],

    "fecha": 1972,

    "director": "Francis Ford Coppola",

    "genero": ["Crimen", "Drama"],

    "actores_principales": ["Marlon Brando", "Al Pacino", "James Caan"],

    "imdb": 9.2
}`

Los pares llave-valor que hay en un diccionario `d` pueden ser accedidos a través de `d.items()` Python los representa como una estructura conocida como **tuplos** con la notación (_llave_, _valor_). Parecido a la notación utilizada para las listas peo con paréntesis `(` y `)` en lugar de corchetes `[` y `]`. Los tuplos se estudiarán con más detalle más adelante


In [4]:
# juana = { "nombre":"Juana Pérez Pérez", "telefonos":[55053344, 78304266], "direccion":"12 #333 e/21 y 19, Plaza", "email":"juanapp@gmail.com", "fecha_nac": "8/10/2000"}
# print(juana)
# print()

mi_favorito = \
{
    "titulo"  : "El padrino I",
    "pais"    : ["Estados Unidos"],
    "fecha"   : 1972,
    "director": "Francis Ford Coppola",
    "genero"  : ["Crimen", "Drama"],
    "actores" : ["Marlon Brando", "Al Pacino", "James Caan"],
    "imdb"    : 9.2
}
print(mi_favorito)
print()

#Note al ejecutar el print anterior que Python escribe todos los pares llave-valor de forma consecutiva
#Una forma más legible de escribir esto puede ser

print("{")
for llave, valor in mi_favorito.items(): #el valor de un tuplo item del diccionario es desagregado en las variables llave y valor
    print(f"  {llave}: {valor}")
print("}")
print()

print(mi_favorito.keys())
print(mi_favorito.values())
print(mi_favorito.items())


{'titulo': 'El padrino I', 'pais': ['Estados Unidos'], 'fecha': 1972, 'director': 'Francis Ford Coppola', 'genero': ['Crimen', 'Drama'], 'actores': ['Marlon Brando', 'Al Pacino', 'James Caan'], 'imdb': 9.2}

{
  titulo: El padrino I
  pais: ['Estados Unidos']
  fecha: 1972
  director: Francis Ford Coppola
  genero: ['Crimen', 'Drama']
  actores: ['Marlon Brando', 'Al Pacino', 'James Caan']
  imdb: 9.2
}

dict_keys(['titulo', 'pais', 'fecha', 'director', 'genero', 'actores', 'imdb'])
dict_values(['El padrino I', ['Estados Unidos'], 1972, 'Francis Ford Coppola', ['Crimen', 'Drama'], ['Marlon Brando', 'Al Pacino', 'James Caan'], 9.2])
dict_items([('titulo', 'El padrino I'), ('pais', ['Estados Unidos']), ('fecha', 1972), ('director', 'Francis Ford Coppola'), ('genero', ['Crimen', 'Drama']), ('actores', ['Marlon Brando', 'Al Pacino', 'James Caan']), ('imdb', 9.2)])


## 6.3 Archivos JSON

Un archivo JSON es un formato de texto ligero para el intercambio de datos, es fácil e intuitivo de leer y escribir para los humanos, y a la vez sencillo de analizar e interpretar por los programas. En nuestro caso por un código Python.

JSON son las siglas de "JavaScript Object Notation" (Notación de Objetos de JavaScript). Aunque proviene de la notación literal de objetos en JavaScript, JSON es independiente del lenguaje de programación y es muy utilizado en las aplicaciones de Python para leer y escribir datos estructurados.

Un archivo JSON se puede escribir con cualquier aplicación que produzca texto, como el simple Bloq de Notas (NotePad). En forma similar a Python una lista de enteros se puede expresar por un _texto_ que empieza con `[` seguido de _textos_ separados por un _delimitador_ (usaremos coma `, `por defecto) hasta terminar con un `]`

Para leer el archivo .json la aplicación Python solo tiene que indicar la _ruta_ donde se encuentra el archivo en el sistema y descargarlo con la operación `load`

Usted tiene ahora en sus manos de escribir con comodidad sus datos de prueba sin tener que estarlos escribiendo explícitamente dentro del código Python

### 6.3.1 Lectura de una lista de enteros

El código a continuación lee un archivo `enteros.json` que acompaña a este proyecto contiene una lista de enteros. Pruebe a visualizarla con su Notepad

In [None]:
import json
#
# Abrir un archivo JSON.
with open("C:\\Users\\Administrador\\Desktop\\CD\\repos\\CD 1er año\\IP\\Conf\\enteros for conf6.json", "r") as f: #Indicar la ruta donde se encuentra el archivo

# Otra opción
# with open("enteros.json", "r") as f:
#     #Por defecto si no se indica la ruta Python sobreentiende que está en la misma carpeta que el proyecto
#     # Escribir la lista en formato JSON dentro del archivo

    lista = json.load(f)
    print(lista)
    print()

[123, 456, 789, 4, 56, 78, 990, 238, 567, 345, 12, 6, 789, 234, 456, 678, 901, 234, 567, 890, 345, 123, 456, 678, 123, 456, 789, 234, 567, 234, 678, 90, 123, 456, 789, 23, 456, 678, 910, 234, 567, 12, 45, 789, 234, 567, 89, 123, 456, 789, 234, 567, 89, 123, 456, 789, 234, 56, 78, 90, 34, 56, 78, 90, 345, 123, 456, 789, 234, 567, 890, 234, 567, 890, 345, 123, 456, 789, 234, 56, 78, 90, 34, 56, 78, 90, 34, 56, 78, 90, 123, 456, 789, 234, 567, 901, 234, 567, 890, 345, 123, 456, 789, 847, 309, 932, 144, 553, 78, 432, 590, 682, 210, 34, 928, 675, 109, 255, 764, 364, 488, 919, 152, 41, 880, 773, 228, 503, 611, 124, 367, 315, 776, 621, 431, 654, 91, 660, 997, 823, 289, 554, 119, 378, 651, 456, 796, 682, 206, 554, 901, 253, 270, 590, 834, 61, 367, 518, 799, 253, 69, 487, 757, 874, 117, 39, 518, 624, 935, 111, 353, 993, 795, 426, 729, 510, 180, 825, 425, 721, 680, 157, 308, 415, 390, 785, 661, 621, 39, 234, 987, 120, 437, 684, 466, 895, 213, 578, 389, 244, 831, 515, 709, 948, 134, 567, 890, 234

### 6.3.2 Lectura de una lista de diccionarios

El ejemplo a continuación lee un archivo json que contiene una lista de diccionarios.

Un dicionario se escribe en un texto json con una notación muy similar a la que se escribe en código Python.

El archivo `MKM_Films.json` contiene una lista de diccionarios donde todos los diccionarios son similares y representan los datos de diferentes films. La lista es leida hacia la variable `films` que luego mandamos a escribir

`print` escribe por defecto todos los valores de la lista seguidos y separados por coma, a su vez como cada elemento de la lista es un diccionario escribe seguidos todos los pares _llave-valor_ del diccionario.

Como Ud puede comprobar que esto no es muy legible. Pero tenemos en nuestras manos la forma de hacerlo a nuestro gusto como nos muestra el segundo trozo de código

In [2]:
import json
with open("MKM_Films for conf6.json", "r") as f:
    films = json.load(f)

#Diferentes acciones con films. Ir descomentando y probando

#print("MKM_Films tal y como lo escribe print")
#print(films)
#print()

#print("MKM_FILMS. Llave y valor en cada linea")
#for film in films:
#    for llave, valor in film.items():
#        print(f"{llave}: {valor}")
#    print("-----------------\n")

print("MKM_FILMS Ordenados por título")
for film in sorted(films, key=lambda x: x['titulo']): # sorted ordena, lambda es la abreviatura de def por cada elemento cojes el titulo
    for llave, valor in film.items():
        print(f"{llave}: {valor}")
    print("-----------------\n")

# print("MKM_FILMS Ordenados por mejor evaluacion")
# for film in sorted(films, key=lambda x: x['imdb'], reverse=True): # sorted ordena de menor a mayor con reverse=True cambia de mayor a menor
#     for llave, valor in film.items():
#         print(f"{llave}: {valor}")
#     print("-----------------\n")

MKM_FILMS Ordenados por título
titulo: 12 Years a Slave
pais: ['Reino Unido', 'Estados Unidos']
fecha: 2013
director: Steve McQueen
genero: ['BiografÃ\xada', 'Drama', 'Historia']
actores_principales: ['Chiwetel Ejiofor', 'Michael Fassbender', "Lupita Nyong'o"]
imdb: 8.1
-----------------

titulo: 15:17 Tren a Paris
pais: ['Estados Unidos']
fecha: 2018
director: Clint Eastwood
genero: ['Drama', 'Biografia', 'Thriller']
actores_principales: ['Spencer Stone', 'Anthony Sadler', 'Aleksandr Kher']
imdb: 6.3
-----------------

titulo: Amelie
pais: ['Francia', 'Alemania']
fecha: 2001
director: Jean-Pierre Jeunet
genero: ['Comedia', 'Romance']
actores_principales: ['Audrey Tautou', 'Mathieu Kassovitz', 'Rufus']
imdb: 8.3
-----------------

titulo: American History X
pais: ['Estados Unidos']
fecha: 1998
director: Tony Kaye
genero: ['Crimen', 'Drama']
actores_principales: ['Edward Norton', 'Edward Furlong', "Beverly D'Angelo"]
imdb: 8.5
-----------------

titulo: Argo
pais: ['Estados Unidos', 'Re

### 6.3.3 Accediendo a las componentes de un diccionario

El código a continuación nos muestra cómo podemos hacer consultas a los datos. En este caso queremos listar solo los films que son de género crimen o thriller. Note que el ciclo más externo la variable `film` recorre todos los valores de la lista `films ` luego a su vez para cada `film` se hace `film["genero"]` que es a su vez una lista de `string` con todos los géneros de ese `film` por eso se puede hacer una operación como `"Thriller"` `in film` para preguntar por todos las películas que tienen `"Thriller"` como género

In [None]:
with open("MKM_Films for conf6.json", "r") as f:
    films = json.load(f)
print("Films de Crimen o Thriller\n")
for film in films:
    if "Thiller" in film["genero"] or "Crimen" in film["genero"]:
        print(f'{film["titulo"]}')
        print(f'{film["genero"]}')
        print("-----------------\n")


Films de Crimen o Thriller

El padrino I
['Crimen', 'Drama']
-----------------

Pulp Fiction
['Crimen', 'Drama']
-----------------

Ciudad de Dios
['Crimen', 'Drama']
-----------------

La naranja mecanica
['Crimen', 'Drama', 'Ciencia ficcion']
-----------------

La milla verde
['Crimen', 'Drama', 'Fantasia']
-----------------

Joker
['Crimen', 'Drama', 'Thriller']
-----------------

American History X
['Crimen', 'Drama']
-----------------

El gran hotel Budapest
['Aventura', 'Comedia', 'Crimen']
-----------------

El lobo de Wall Street
['Biografia', 'Comedia', 'Crimen']
-----------------

El gran Lebowski
['Comedia', 'Crimen']
-----------------

Los odiosos ocho
['Crimen', 'Drama', 'Misterio']
-----------------

Los infiltrados
['Crimen', 'Drama', 'Thriller']
-----------------

Taxi Driver
['Crimen', 'Drama']
-----------------

Heat
['Crimen', 'Thriller', 'Accion']
-----------------

El Padrino II
['Crimen', 'Drama']
-----------------

El precio del poder (Scarface)
['Crimen', 'Drama

## 6.4 EJERCICIOS PARA CP

1. Escriba un diccionario en que las llaves sean string (el nombre de un contacto) y los valores sean a su vez diccionarios con todos los datos del contacto
2. Escriba un código que dadas dos listas `llaves` y `valores` cree un diccionario tomando como llave un valor de la primera lista (`llaves`) y como valor asociado a la llave el valor en la posición correspondiente en la segunda lista (`valores`).

     Si la lista `llaves` tuviese el valor `["chocolate", "fresa", "vainilla"] `y la lista `valores` fuera `["preferido", "paso", "si no hay otro"]` debemos obtener el diccionario

    `{"chocolate":"preferido", "fresa":"paso", "vainilla":"si no hay otro"}`

     Si la `llaves` tuviese mas elementos que la lista `valores` entonces se le debe asociar el valor `None` a las llaves por exceso. Por ejemplo si fuese `["chocolate", "fresa", "vainilla", "almendra"]` y `["preferido", "paso", "si no hay otro"] `el resultado debería ser entonces

     `{"chocolate":"preferido", "fresa":"paso", "vainilla":"sino hay otro", "almendra":None}`

      Pero si hay más valores que llaves forme el diccionario hasta donde lleguen las llaves y escriba algún mensaje advirtiendo lo sucedido.

3. Decida y programe qué hacer si en la lista `llaves` se repitiese alguna llave
4. Dada una lista de diccionarios escriba un código que produzca una lista con iguales diccionarios pero ordenadas por el valor de una determinada llave
5. Para una variable `parrafo` cuyo valor es texto (string) produzca un diccionario que cuente la cantidad de veces que se usa cada vocal
