<h1>Procesamiento de Datos a Gran Escala</h1>

# Cuaderno 05 — Diccionarios (Dictionaries) en Python

**Pontificia Universidad Javeriana** 


**Fecha**:9/02/2026


**Autor**: Juan David Ordoñez 


**Codigo estudiante**:20523791

## Descripción del cuaderno
En este cuaderno se estudia el tipo de dato **diccionario (`dict`)** en Python, que permite almacenar datos como pares **llave → valor**.  
Se practican operaciones esenciales: crear diccionarios, acceder a valores mediante llaves, obtener llaves y valores con `keys()` y `values()`, agregar y eliminar entradas, y validar existencia de una llave con `in`.  
Al final se incluye un **cuestionario** y un **ejercicio integrador final** como evidencia.

## Objetivo general
Usar diccionarios para organizar y consultar información mediante pares llave–valor, aplicando operaciones básicas de acceso, actualización y verificación.

## Objetivos específicos
- Comprender qué es un diccionario y su estructura llave–valor.
- Acceder a valores usando llaves y entender el error `KeyError`.
- Obtener llaves y valores con `keys()` y `values()`.
- Agregar y eliminar entradas del diccionario.
- Verificar si una llave existe usando `in`.
- Resolver un caso integrador que combine todas las operaciones vistas.


<h2>Diccionarios en Python</h2>

<p><strong>¡Bienvenido!</strong> En este cuaderno aprenderás lo relacionado con los diccionarios en el Lenguaje de Programación Python. Al final de este laboratorio, conocerás las operaciones básicas con diccionarios en Python, incluyendo qué son, y las operaciones que puedes hacer con ellos.</p>

<h2>Tabla de Contenido</h2>
<div class="alert alert-block alert-info" style="margin-top: 20px">
    <ul>
        <li>
            <a href="#dic">Diccionarios</a>
            <ul>
                <li><a href="content">¿Qué son los diccionarios?</a></li>
                <li><a href="key">Llaves</a></li>
            </ul>
        </li>
        <li>
            <a href="#quiz">Cuestionario sobre Diccionarios</a>
        </li>
    </ul>
    <p>
        Tiempo Estimado: <strong>20 min</strong>
    </p>
</div>

<hr>

<h2 id="Dic">Diccionarios</h2>

<h3 id="content">¿Qué son los diccionarios?</h3>

Un **diccionario (`dict`)** almacena información como pares:

**llave → valor**

- La **llave** identifica el valor (como si fuera un “índice con nombre”).
- Las llaves deben ser **inmutables** (por ejemplo: `str`, `int`, `tuple`).
- Los diccionarios son **mutables**: se pueden actualizar, agregar o eliminar entradas.
- Se usan mucho para representar datos tipo “registro” o “tabla” (columna llave, columna valor).

Un diccionario esta conformado por llaves y valores. Un diccionario puede compararse a una lista. En vez de índices numéricos como los de las listas, los diccionarios tienen llaves. Estas llaves son usadas para acceder a los valores dentro de los diccionarios.

<img src="https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/PY0101EN/Chapter%202/Images/DictsList.png" width="650" />

Un ejemplo de Diccionario <code>Dict</code>:

## Creación de diccionarios
Un diccionario se define con llaves `{}` y elementos separados por comas:

`{"llave": valor, "otra_llave": valor2, ...}`

También puede usar llaves que no sean string (por ejemplo, una tupla), siempre que sean inmutables.


In [1]:
# Crear el diccionario

Dict = {"key1": 1, "key2": "2", "key3": [3, 3, 3], "key4": (4, 4, 4), ('key5'): 5, (0, 1): 6}
Dict

{'key1': 1,
 'key2': '2',
 'key3': [3, 3, 3],
 'key4': (4, 4, 4),
 'key5': 5,
 (0, 1): 6}

Las llaves pueden ser cadenas:

In [2]:
# Acceder a un valor mediante una llave

Dict["key1"]

1

Una llave puede ser cualquier tipo de objeto inmutable, pudiendo ser una tupla:

In [3]:
# Acceder a un valor mediante una llave

Dict[(0, 1)]

6

Cada llave esta separada de su respectivo valor mediante dos puntos "<code>:</code>". Las comas separan los elementos y todo el diccionario esta encerrado usando llaves. Un diccionario vacío se representa escribiendo solo dos llaves, de esta forma "<code>{}</code>".

In [4]:
# Crear un ejemplo de diccionario

release_year_dict = {"Thriller": "1982", "Back in Black": "1980", \
                    "The Dark Side of the Moon": "1973", "The Bodyguard": "1992", \
                    "Bat Out of Hell": "1977", "Their Greatest Hits (1971-1975)": "1976", \
                    "Saturday Night Fever": "1977", "Rumours": "1977"}
release_year_dict

{'Thriller': '1982',
 'Back in Black': '1980',
 'The Dark Side of the Moon': '1973',
 'The Bodyguard': '1992',
 'Bat Out of Hell': '1977',
 'Their Greatest Hits (1971-1975)': '1976',
 'Saturday Night Fever': '1977',
 'Rumours': '1977'}

Resumiendo, al igual que una lista, un diccionario guarda una secuencia de elementos. Cada uno es representado por una llave y su valor correspondiente. Los diccionarios se crean mediante dos llaves y estas contendrán las llaves y valores separados por una coma. A cada llave solo puede corresponderle un valor, sin embargo, múltiples llaves pueden tener el mismo. Las llaves solo pueden ser cadenas, números o tuplas, pero los valores pueden ser de cualquier tipo.

Es de ayuda visualizar un diccionario como una tabla, como se muestra en la imagen. La primera columna representa las llaves, la segunda los valores.

<img src="https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/PY0101EN/Chapter%202/Images/DictsStructure.png" width="650" />

## Llaves

## Acceso por llaves y obtención de llaves/valores
- Para obtener un valor: `diccionario["llave"]`
- Para ver todas las llaves: `diccionario.keys()`
- Para ver todos los valores: `diccionario.values()`


Los valores se pueden obtener mediante nombres:

In [5]:
# Obtener el valor de las llaves

release_year_dict['Thriller'] 

'1982'

Esto corresponde a:

<img src="https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/PY0101EN/Chapter%202/Images/DictsKeyOne.png" width="500" />

De igual forma <b>The Bodyguard</b>

In [6]:
# Obtener el valor mediante la llave

release_year_dict['The Bodyguard'] 

'1992'

<img src="https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/PY0101EN/Chapter%202/Images/DictsKeyTwo.png" width="500" />

Ahora vamos a recuperar las llaves del diccionario mediante el método <code>release_year_dict()</code>:

In [7]:
# Obtener todas las llaves del diccionario

release_year_dict.keys() 

dict_keys(['Thriller', 'Back in Black', 'The Dark Side of the Moon', 'The Bodyguard', 'Bat Out of Hell', 'Their Greatest Hits (1971-1975)', 'Saturday Night Fever', 'Rumours'])

Se puede obtener los valores mediante el método <code>values()</code>:

In [8]:
# Obtener todos los valores del diccionario

release_year_dict.values() 

dict_values(['1982', '1980', '1973', '1992', '1977', '1976', '1977', '1977'])

## Operaciones básicas (modificar y verificar)
En esta sección se practica:
- Agregar o actualizar una entrada: `dicc["nueva_llave"] = valor`
- Eliminar una entrada por llave: `del dicc["llave"]`
- Verificar si una llave existe: `"llave" in dicc`

Estas operaciones son típicas al trabajar con datos: “actualizar catálogo”, “eliminar registro”, “validar si existe”.


Podemos agregar una entrada:

In [9]:
# Agregar un valor con su llave en el diccionario

release_year_dict['Graduation'] = '2007'
release_year_dict

{'Thriller': '1982',
 'Back in Black': '1980',
 'The Dark Side of the Moon': '1973',
 'The Bodyguard': '1992',
 'Bat Out of Hell': '1977',
 'Their Greatest Hits (1971-1975)': '1976',
 'Saturday Night Fever': '1977',
 'Rumours': '1977',
 'Graduation': '2007'}

Tambien podemos borrar entradas:

In [10]:
# Borrar entradas mediante la llave

del(release_year_dict['Thriller'])
del(release_year_dict['Graduation'])
release_year_dict

{'Back in Black': '1980',
 'The Dark Side of the Moon': '1973',
 'The Bodyguard': '1992',
 'Bat Out of Hell': '1977',
 'Their Greatest Hits (1971-1975)': '1976',
 'Saturday Night Fever': '1977',
 'Rumours': '1977'}

Podemos verificar si existe un elemento en el diccionario:

In [11]:
# Verificar si existe la llave en el diccionario

'The Bodyguard' in release_year_dict

True

<h2 id="quiz">Cuestionario sobre Diccionarios</h2>

Este quiz evalúa operaciones clave con diccionarios:
1) Obtener **llaves** con `keys()`
2) Obtener **valores** con `values()`
3) Crear un diccionario con datos dados
4) Acceder a un valor mediante su llave
5) Volver a consultar llaves y valores del diccionario creado

Además, se incluyen alternativas de solución y recomendaciones de buenas prácticas (nombres de variables y tipos numéricos).

<b>Necesitarás este diccionario para las siguientes dos preguntas:</b>

In [12]:
# Pregunta - Diccionario de ejemplo

soundtrack_dic = {"The Bodyguard":"1992", "Saturday Night Fever":"1977"}
soundtrack_dic 

{'The Bodyguard': '1992', 'Saturday Night Fever': '1977'}

a) En el diccionario <code>soundtrack_dict</code>. ¿Cuáles son las llaves?

In [None]:
# Escribe abajo tu código y presiona Shift+Enter para ejecutarlo
soundtrack_dic.keys()

# Opción 2: convertir a lista
#list(soundtrack_dic.keys())

dict_keys(['The Bodyguard', 'Saturday Night Fever'])

Haz doble click __aquí__ para ver la solución.

<!-- Your answer is below:
soundtrack_dic.keys() # The Keys "The Bodyguard" and "Saturday Night Fever" 
-->

b) En el diccionario <code>soundtrack_dict</code>. ¿Cuáles son los valores?

In [14]:
# Escribe abajo tu código y presiona Shift+Enter para ejecutarlo
soundtrack_dic.values()

dict_values(['1992', '1977'])

Haz doble click __aquí__ para ver la solución.

<!-- Your answer is below:
soundtrack_dic.values() # The values are "1992" and "1977"
-->

<b>Necesitarás este diccionario para las siguientes preguntas:</b>

Los discos <b>Back in Black</b>, <b>The Bodyguard</b> y <b>Thriller</b> poseen el siguiente record de ventas en millones, 50, 50 y 65 respectivamente:

a) Crea un diccionario <code>album_sales_dict</code> donde las llaves sean el nombre del disco y los valores la cantidad de ventas en millones.

In [None]:
# Escribe abajo tu código y presiona Shift+Enter para ejecutarlo

album_sales_dict = {"Back in Black": 50, "Thriller": 65, "The Bodyguard": 50} 
album_sales_dict

# Opción 2: con dict() y pares
#album_sales_dict = dict([("Back in Black", 50), ("Thriller", 65), ("The Bodyguard", 50)])


{'Back in Black': 50, 'Thriller': 65, 'The Bodyguard': 50}

Haz doble click __aquí__ para ver la solución.

<!-- Your answer is below:
album_sales_dict = {"The Bodyguard":50, "Back in Black":50, "Thriller":65}
-->

b) Usa el diccionario para encontrar las ventas totales de <b>Thriller</b>:

In [2]:
# Escribe abajo tu código y presiona Shift+Enter para ejecutarlo

album_sales_dict['Thriller']

65

Double-click __here__ for the solution.

<!-- Your answer is below:
album_sales_dict["Thriller"]
-->

c) Encuentra los nombres de los discos dentro del diccionario mediante el método <code>keys</code>:

In [21]:
# Escribe abajo tu código y presiona Shift+Enter para ejecutarlo

album_sales_dict.keys()

dict_keys(['Back in Black', 'Thriller', 'The Bodyguard'])

Haz doble click __aquí__ para ver la solución.

<!-- Your answer is below:
album_sales_dict.keys()
-->

d) Encuentra los records de ventas dentro del diccionario mediante el método <code>values</code>:

In [22]:
# Escribe abajo tu código y presiona Shift+Enter para ejecutarlo

album_sales_dict.values()

dict_values(['50', '65', '50'])

Haz doble click __aquí__ para ver la solución.

<!-- Your answer is below:
album_sales_dict.values()
-->

## Ejercicio integrador final (evidencia)

Construye un “mini-reporte” usando diccionarios, aplicando TODO lo visto:

Debe incluir:
- Crear diccionarios (con llaves string y al menos una llave tipo tupla)
- Consultar valores por llave y con `get()`
- Obtener llaves y valores con `keys()` y `values()`
- Agregar/actualizar entradas
- Eliminar una entrada con `del`
- Verificar existencia de una llave con `in`
- Calcular una métrica simple (ej: suma o máximo) usando los valores del diccionario



In [3]:
# 1) Diccionario base (años como int para poder operar)
release_year_dict = {
    "Thriller": 1982,
    "Back in Black": 1980,
    "The Dark Side of the Moon": 1973,
    "The Bodyguard": 1992
}

# 2) Agregar/actualizar
release_year_dict["Graduation"] = 2007

# 3) Verificación de llave
has_bodyguard = "The Bodyguard" in release_year_dict

# 4) Acceso seguro
year_unknown = release_year_dict.get("No Existe", -1)

# 5) Eliminar
del release_year_dict["Thriller"]

# 6) Llave tipo tupla (ejemplo)
extra_info = {
    ("album", "country"): "USA",
    ("album", "format"): "CD"
}

# 7) Segundo diccionario (ventas numéricas)
album_sales_dict = {"Back in Black": 50, "Thriller": 65, "The Bodyguard": 50}

total_sales = sum(album_sales_dict.values())
best_album = max(album_sales_dict, key=album_sales_dict.get)

reporte = {
    "keys_release": list(release_year_dict.keys()),
    "values_release": list(release_year_dict.values()),
    "has_bodyguard": has_bodyguard,
    "year_unknown": year_unknown,
    "extra_country": extra_info[("album", "country")],
    "total_sales": total_sales,
    "best_album": best_album
}


reporte


{'keys_release': ['Back in Black',
  'The Dark Side of the Moon',
  'The Bodyguard',
  'Graduation'],
 'values_release': [1980, 1973, 1992, 2007],
 'has_bodyguard': True,
 'year_unknown': -1,
 'extra_country': 'USA',
 'total_sales': 165,
 'best_album': 'Thriller'}

## Conclusiones
- Comprendí que un **diccionario (`dict`)** guarda datos como pares **llave → valor**, lo cual facilita organizar información y consultarla por un identificador.
- Practiqué el acceso a valores mediante llaves y reconocí que `dicc["llave"]` puede generar `KeyError` si la llave no existe, por lo que `get()` es útil para accesos seguros.
- Usé `keys()` y `values()` para obtener colecciones de llaves y valores, que sirven para recorrer o analizar el contenido del diccionario.
- Apliqué operaciones de **actualización**, **agregado** y **eliminación** de entradas, confirmando que los diccionarios son estructuras mutables.
- Verifiqué pertenencia con `in` y reforcé que las llaves deben ser **inmutables** (por ejemplo, strings o tuplas).
- El ejercicio integrador final me permitió unir todos los conceptos en un flujo único.
