# Sesión 1, Parte 2

En esta sesión repasaremos conceptos que nos permitirán trabajar un poco mejor con Python y desempolvar conocimientos. Es un picoteo muy "pinceleado" de todo el mundo intermedio/avanzado de Python, pero que nos permitirán trabajar con estructuras de datos de forma más _inteligente_.

<p>
<font size='1'>Material adaptado del material creado por &copy; 2015 Karim Pichara - Christian Pieringer, todos los derechos reservados; y posteriormente modificado por Equipos Docentes IIC2233 UC.</font>
<br>

# Tabla de contenidos

1. **Funciones**
    1. [Funciones _built-in_](#funciones)
        1. [`input`](#input)
        2. [`int`, `str`, `float`](#int-str-float)
        3. [`print`](#print)
        4. [`max`, `min`](#max-min)
        5. [`sum`](#sum)
        6. [`abs`, entre otras](#abs-entre-otras)
    2. [Funciones definidas por el programador](#funciones-definidas-por-el-programador)
2. **Estructuras de datos**
    1. [Estructuras de datos e iterables](#estructuras-de-datos-e-iterables)
        1. [Estructuras de datos _built-in_ en Python](#estructuras-de-datos-built-in-en-python)
    2. [Estructuras de datos secuenciales](#estructuras-de-datos-secuenciales-e-iterables)
        1. [Listas](#listas)
        2. [Tuplas](#tuplas)
    3. [Estructuras de datos no secuenciales](#estructuras-de-datos-no-secuenciales)
        1. [Diccionarios](#diccionarios)
        2. [Sets](#sets)

# Funciones

## Funciones _built-in_

Las funciones permiten encapsular código que resuelve una tarea específica. Para ello, puede o no necesitar información adicional (_argumentos_), y dar o no un _valor de retorno_. Existen funciones que vienen con Python y se denominan *built-in functions*. Pueden ver en la [documentación oficial](https://docs.python.org/3.5/library/functions.html) una lista con todas ellas, sin embargo ahora presentaremos algunas de utilidad. Por ejemplo:

### `input()`

La función `input()` congela el programa a la espera de que el usuario ingrese algún texto. Esta función responde entregando como valor de retorno lo ingresado por el usuario como _str_. Si se le entregan un argumento (_str_), se mostrará en consola el texto argumento antes de congelar el programa.

### `int()`, `str()`, `float()`

Estas tres funciones cambian el tipo de dato al deseado. Reciben el _argumento_ a ser convertido, y lo retornan en el tipo de dato objetivo.

### `print()`

Esta función recibe una cantidad indeterminada de argumentos, convierte todos a _str_, los concatena usando como delimitador un espacio (`" "`), y el texto resultante lo envía  ala consola.

##### Ejemplo 1:

Haga un código breve que pida un nombre y una edad al usuario, y muestre en consola un mensaje que indique el nombre de la persona, la edad actual, y su edad en cinco años más.

In [None]:
print("Comienza el programa")
nombre = input("Ingrese un nombre: ") #Notar que el campo para ingresar texto se genera en la parte superior de la ventana
edad = int(input("Ingrese una edad: "))
edad_en_5_años = edad + 5
print("La persona ingresada",nombre,"tiene",edad,"años y en cinco años tendrá",edad_en_5_años)

Comienza el programa
La persona ingresada Alicia tiene 35 años y en cinco años ctendrá 40


### `max()`, `min()`

Estas funciones reciben una cantidad indeterminada de argumentos y retornan, respectivamente, el máximo y mínimo valor de entre todos ellos. Puede también recibir un conjunto de valores en una estructura de datos (lo veremos o veremos en la segunda parte de hoy).

### `sum()`

Esta función recibe una estructura de datos iterable (lo veremos en un rato), y retorna la suma de sus elementos.

### `abs()`, entre otras

Puedes revisar la documentación de funciones built-in,  para ver más funciones, pero esta última recibe un número y retorna el valor absoluto del número.

##### Ejemplo 2:

Programe un código que reciba tres valores numéricos del usuario, y calcule el máximo y mínimo entre ellos.

In [None]:
n1 = int(input("Número 1: "))
n2 = int(input("Número 2: "))
n3 = int(input("Número 3: "))

print("Máximo:", max(n1, n2, n3))
print("Mínimo:", min(n1, n2, n3))

Máximo: 60
Mínimo: 40


## Funciones definidas por el programador

Aparte de las *built-in functions*, podemos definir nuestras propias funciones para utilizarlas en nuestros programas. Para crear una nueva función utilizamos la _keyword_ `def`, entregamos parámetros y podemos opcionalmente utilizar la _keyword_ `return` para retornar un valor.

```Python
def nombre_funcion(parametro_1, parametro_2, ..., parametro_n):
    bloque_de_codigo_de_la_funcion
    ...
    bloque_de_codigo_de_la_funcion
    return valor_de_retorno1, valor_de_retorno2...
```

In [None]:
def sumar(n1, n2):
    suma = n1 + n2
    return suma

Para utilizar la función debemos llamarla, y de retornar un valor debemos (podemos) almacenar este en una variable.
```python
salida = nombre_funcion(entrada_1, entrada_2, ..., entrada_n)
```
Las funciones pueden recibir 0 o más parámetros y retornar 0 o más valores. Lo habitual es retornar 1 valor. Cuando se alcanza el primer `return`, la función termina.

In [None]:
s = sumar(10,20)
print(s)

t = sumar("Hola ", "mundo!")
print(t)

30
Hola mundo!


# Estructuras de datos e iterables
<a id="estructuras-de-datos-e-iterables"></a>

En los modelos tradicionales de programación, estamos permanentemente manipulando datos. Es por esto que para facilitar esta manipulación, se han creado construcciones que permiten **agrupar y manipular** eficientemente conjuntos de datos.

En Ciencia de la Computación, estas construcciones se conocen como **estructuras de datos** y consisten de una manera de agrupar datos relacionados, junto con un conjunto de **operaciones para accederlos y modificarlos de manera eficiente**. La mayoría de los lenguajes de programación incluyen soporte para algunas estructuras de datos predefinidas (*built-in*) y también permiten definir estructuras nuevas.

A diferencia de las variables simples o "primitivas" como los enteros, o los reales, las estructuras de datos involucran un mayor nivel de *abstracción*. Ahora estudiaremos el modelo conceptual de algunas estructuras de datos típicas utilizadas en ciencia de la computación, así como también su implementación en Python. 

La decisión de "qué estructura de datos utilizar" dependerá tanto del contexto de la aplicación en que se desea usar, como también de su diseño y *eficiencia* esperada. La idea es aprender que la elección adecuada de una estructura de datos para cada situación es crucial para desarrollar un *software* eficiente.

<a id="estructuras-de-datos-built-in-en-python"></a>
## Estructuras de datos *built-in* en Python

Python posee varias estructuras de datos ya implementadas (*built-in*) para el manejo eficiente de datos. A continuación estudiaremos las más básicas de ellas.

Veremos estructuras **secuenciales**, que **mantienen un orden entre sus elementos**:
* **lista** (*list*)
* **tuplas** (*tuples*)

y también veremos estructuras que **no mantienen un orden establecido**, pero que tienen mejores propiedades para otras acciones:

* **diccionarios** (*dictionaries*)
* **conjuntos** (*sets*)

## Estructuras de datos secuenciales (e iterables)

En esta sección estudiaremos estructuras basadas en un **ordenamiento secuencial** de los elementos, según como son ingresados en la estructura. Todas las estructuras de este tipo se caracterizan porque soportan **indexación de los elementos** de la forma `secuencia[índice]`, donde el `índice` **empieza en 0** y llega hasta el **largo de la secuencia - 1**. 

![](img/indices_secuencia.png)

Comencemos con `list`.

<a id="listas"></a>
### Listas

Las **listas** (`list`) se utilizan para manejar datos de forma **ordenada** y **mutable**. Los contenidos pueden ser accedidos utilizando el índice correspondiente al orden en que se encuentran en la lista. El *orden* de los elementos de una lista, y *los elementos mismos* pueden cambiar mediante métodos que manipulan la lista.

Las listas también pueden ser heterogéneas, lo que significa que pueden contener objetos pertenecientes a clases o tipos de datos distintos, incluyendo otras listas. Si bien no existe ninguna restricción de Python sobre los tipos de datos de las listas, estas tienen una relación estrecha con los **arreglos** disponibles en otros lenguajes de programación, por lo que, dado que los arreglos suelen tener estas restricciones, es más común ver listas con tipos de datos homogéneos que heterogéneos.

En una lista, los elementos que se agregan usando `append` se ponen al final de la lista.

Podemos crear listas de las siguientes maneras:

In [1]:
# Creamos una lista vacía y agregamos elementos incrementalmente.
# En este caso agregamos dos tuplas al final de la lista.
lista = list()                # También puede ser con lista=[]
lista.append(2015)   # Aquí estamos agregando UN elemento, que es un entero
lista.append(2016)   # Luego de esto, la lista contiene 2 elementos que son enteros
print(lista)
print(len(lista))

# También es posible agregar los objetos explícitamente al definirla por primera vez
lista = [1, 'string', 20.5, [False,True]]
lista.append('último elemento')
print(lista)

# Extraemos un el elemento usando el índice respectivo
print(lista[1])
print(len(lista))

[2015, 2016]
2
[1, 'string', 20.5, [False, True], 'último elemento']
string
5


A veces es necesario insertar elementos nuevos en posiciones específicas en una lista. Para ello, podemos usar el método `insert(posición, elemento)`.

In [2]:
bandas = ['Radiohead', 'City and Colour', 'toe', 'Young the Giant', 'Portugal. The Man', 'Twenty One Pilots']

print(bandas)
bandas.insert(2, 'Of Monsters and Men')
print(bandas)

['Radiohead', 'City and Colour', 'toe', 'Young the Giant', 'Portugal. The Man', 'Twenty One Pilots']
['Radiohead', 'City and Colour', 'Of Monsters and Men', 'toe', 'Young the Giant', 'Portugal. The Man', 'Twenty One Pilots']


#### Listas por comprensión

Desde el punto de vista de la lógica, la definición de comprensión es:  "Conjunto de caracteres que forman un concepto". Así mismo, las listas por comprensión se pueden ver como listas formadas por un conjunto de objetos que cumplen con un concepto o condición en particular. En Python, podemos crear **listas por comprensión**. Esta es una forma más práctica para crear listas en pocas líneas de código.

Por ejemplo, ya tenemos la lista `bandas`, pero ahora queremos construir una lista con el largo de cada uno de los elementos. Una forma de hacerlo sería la siguiente:

In [None]:
largo_de_bandas = []

for nombre in bandas:
    largo_de_bandas.append(len(nombre))

print(largo_de_bandas)

[9, 15, 19, 3, 15, 17, 17]


Usando **listas por comprensión**, podemos definir lo mismo de forma más clara y concisa siguiendo la siguiente sintaxis:

`nueva_lista = [expresión for elemento in lista]`

In [None]:
largo_de_bandas = [len(nombre) for nombre in bandas]

print(largo_de_bandas)

[9, 15, 19, 3, 15, 17, 17]


La sentencia `if` se puede usar dentro de una lista por comprensión para construir la lista incluyendo solamente los elementos que cumplan una cierta condición. En el siguiente ejemplo guardaremos **los nombres de las bandas** que tengan un **largo menor a 10 caracteres**. La sintaxis al usar un `if` en **listas por comprensión** es la siguiente:

`nueva_lista = [expresión for elemento in lista if condición]`

In [3]:
bandas_con_nombre_corto = [nombre for nombre in bandas if len(nombre) < 10]

print(bandas_con_nombre_corto)

['Radiohead', 'toe']


El código anterior es equivalente a hacer lo siguiente:

In [4]:
bandas_con_nombre_corto = []
for nombre in bandas:
    if len(nombre) < 10:
        bandas_con_nombre_corto.append(nombre)

print(bandas_con_nombre_corto)

['Radiohead', 'toe']


#### *Slicing* de listas

Es posible tomar secciones de la lista usando la notación de ***slicing***. En esta notación, los índices indican *desde dónde* y *hasta dónde* deseamos recuperar datos de la lista. La sintaxis de la notación de *slicing* es:

`secuencia[inicio:término:pasos]`

Por defecto, el número de pasos es 1. La siguiente figura muestra un ejemplo de cómo se deben considerar los índices al usar la notación de *slicing*. 

![](data/indices_slicing.png)

Forma general de hacer *slicing* en Python:

- `a[start:end]`: retorna los elementos desde `start` hasta `end - 1`.

- `a[start:]`: retorna los elementos desde `start` hasta el final del arreglo.

- `a[:end]`: retorna los elementos desde el principio hasta `end - 1`.

- `a[:]`: crea una copia (*shallow*) del arreglo completo. Es decir, el arreglo retornado está en una nueva dirección de memoria, pero los elementos que están en este nuevo arreglo, hacen referencia a la dirección de memoria de los elementos del arreglo inicial.

- `a[start:end:step]`: retorna los elementos desde `start` hasta no pasar `end`, en pasos de a `step`.

- `a[-1]`: retorna el último elemento en el arreglo.

- `a[-n:]`: retorna los últimos `n` elementos en el arreglo.

- `a[:-n]`: retorna todos los elementos del arreglo menos los últimos `n` elementos.

Podemos extraer un elemento específico desde una lista mediante indexación. Es posible recuperar una porción completa de la lista utilizando la notación de *slicing*.

In [None]:
# Tomando una tajada particular, en este caso desde la posición 2 hasta la anterior a 6
numeros = [6, 7, 2, 4, 10, 20, 25]
print(numeros[2:6])

# tomando una sección desde la posición 2 hasta el final de la lista
print(numeros[2:])

# tomando una sección desde el principio hasta la posición anterior a 5
print(numeros[:5:])

# lo mismo anterior, pero saltando 2 posiciones a la vez
print(numeros[:5:2])

# invirtiendo una lista
print(numeros[::-1])

[2, 4, 10, 20]
[2, 4, 10, 20, 25]
[6, 7, 2, 4, 10]
[6, 2, 10]
[25, 20, 10, 4, 2, 7, 6]


Las listas pueden ser ordenadas utilizando el método `sort()`. Esto ordena las listas en sí mismas (*in-place*) y no devuelve nada, es decir, el resultado no es asignable a una nueva lista.

In [None]:
numeros = [6, 7, 2, 4, 10, 20, 25]
print(numeros)

# Ordenamos en sentido ascendente.
# Observar como a no recibe ninguna asignación después de que la lista numeros es ordenada
a = numeros.sort() 
print(a)
print(numeros)

# Ordenamos en sentido descendente
numeros.sort(reverse=True)
print(numeros)

[6, 7, 2, 4, 10, 20, 25]
None
[2, 4, 6, 7, 10, 20, 25]
[25, 20, 10, 7, 6, 4, 2]


Las listas han sido optimizadas para ser una estructura flexible y fácil de manejar. También se pueden recorrer con la notación de `for`

In [None]:
piezas = [["Alfil", 2], ["Peón", 8], ["Rey", 1], ["Reina", 1], ["Caballo", 2], ["Torre", 2]]

# Por cada iteración en el ciclo, la variable pieza recibe un elemento de la lista,
# de acuerdo al orden de la lista
for pieza in piezas:
    # El modificador ":8" permite que el texto ocupe al menos 8 espacios en la línea
    print(f'tipo de pieza: {pieza[0]:8} - cantidad: {pieza[1]}')

tipo de pieza: Alfil    - cantidad: 2
tipo de pieza: Peón     - cantidad: 8
tipo de pieza: Rey      - cantidad: 1
tipo de pieza: Reina    - cantidad: 1
tipo de pieza: Caballo  - cantidad: 2
tipo de pieza: Torre    - cantidad: 2


En este ejemplo, cada elemento de la lista `piezas` es una lista que contiene 2 elementos: primero el tipo de pieza como `str`, y luego la cantidad de ellas como `int`.

### Tuplas

Las **tuplas** (`tuple`) se utilizan para manejar datos de forma **ordenada** e **inmutable**, es decir, no se pueden cambiar los valores que contiene. Para acceder a algún elemento de una tupla, es necesario usar índices correlativos al orden en que los valores fueron agregados.

Las tuplas pueden ser heterogéneas, y de hecho es su uso más común, lo que significa que pueden contener objetos pertenecientes a clases o tipos de datos distintos, incluyendo otras tuplas. Una tupla se puede crear de las siguientes maneras:

In [6]:
# Usando tuple() sin ingresar elementos, se crea una tupla vacía.
a = tuple()

# Declarando explícitamente los elementos de la tupla,
# ingresándolos entre paréntesis.
b = (0, 1, 2)

# Cuando creamos una tupla de tamaño 1, debemos incluir una coma al final.
c = (0, )

# Pueden ser creadas con objetos de distinto tipo.
# Al momento de la creación se pueden omitir los paréntesis.
d = 0, 'uno'

print(type(a), a)
print(type(b), b, b[0], b[1])
print(type(c), c)
print(type(d), d, d[0], d[1])

<class 'tuple'> ()
<class 'tuple'> (0, 1, 2) 0 1
<class 'tuple'> (0,)
<class 'tuple'> (0, 'uno') 0 uno


Las tuplas son estructuras de datos **inmutables**. Esto significa que **no es posible agregar o eliminar elementos**, o bien cambiar el contenido de la tupla una vez que ésta fue creada.

En el siguiente ejemplo, la posición 2 de la tupla `a` contiene originalmente un `float`. Si intentamos reemplazar el contenido de esta posición por un *string* (o cualquier otro valor), se genera un *error de tipo* (`TypeError`), debido a que los objetos de la clase `tuple` *no permiten asignación*.

In [None]:
a = ('Chile', 2, 4.15, 'Agosto')
a[2] = 'semestre'

TypeError: 'tuple' object does not support item assignment

Sin embargo, sí es posible modificar algún valor contenido *dentro* de un elemento de la tupla, siempre que el tipo de datos lo permita. En el siguiente caso **no** estamos modificando el objeto `tuple`, sino un valor interno (la posición 0) de la lista que está en la posición 3 de la tupla `meses`.

In [None]:
meses = (2023, "semestre", 2, ['Ago', 'Sep', 'Oct', 'Nov', 'Dic'])

meses[3][0] = 'Ene'
print(meses)

(2023, 'semestre', 2, ['Ene', 'Sep', 'Oct', 'Nov', 'Dic'])


#### Desempaquetamiento de elementos

Las tuplas pueden ser **desempaquetadas** en variables individuales. En el siguiente ejemplo creamos una función llamada `calcular_geometria()`, que recibe como entrada los lados de un cuadrilátero y retorna algunas medidas geométricas. Cuando las funciones retornan más de un valor, lo hacen empaquetando todos los valores en una tupla. Esto es simplemente un [truco](https://en.wikipedia.org/wiki/Syntactic_sugar) de Python, replicable en otros lenguajes, para aparentar que se entregan múltiples valores de retorno.

In [None]:
def calcular_geometria(a, b):
    area = a * b
    perimetro = (2 * a) + (2 * b)
    punto_medio_a = a / 2
    punto_medio_b = b / 2
    # Los paréntesis son opcionales, ya que estamos creando una tupla
    return (area, perimetro, punto_medio_a, punto_medio_b)


# Obtenemos una tupla con los datos provenientes de la función.
data = calcular_geometria(20.0, 10.0)
print(f"1: {data}")

# El tipo de dato obtenido es 'tuple'
print(type(data))

# Obtenemos un valor desde la tupla directamente usando su índice
p = data[1]
print(f"2: {p}")

# Desempaquetamos en variables independientes
# los valores contenidos en una tupla
a, p, mpa, mpb = data
print(f"3: {a}, {p}, {mpa}, {mpb}")

# Las funciones devuelven el conjunto de valores
# como una tupla. Se puede desempaquetar directamente
# en variables individuales como en el caso anterior.
a, p, mpa, mpb = calcular_geometria(20.0, 10.0)
print(f"4: {a}, {p}, {mpa}, {mpb}")

1: (200.0, 60.0, 10.0, 5.0)
<class 'tuple'>
2: 60.0
3: 200.0, 60.0, 10.0, 5.0
4: 200.0, 60.0, 10.0, 5.0


#### *Slicing* de tuplas

Es posible tomar secciones de la tupla usando la notación de ***slicing***. En esta notación, los índices indican *desde dónde* y *hasta dónde* deseamos recuperar datos de la tupla. La sintaxis de la notación de *slicing* es:

`secuencia[inicio:término:pasos]`

Por defecto, el número de pasos es 1. La siguiente figura muestra un ejemplo de cómo se deben considerar los índices al usar la notación de *slicing*. 

![](img/indices_slicing.png)

Forma general de hacer *slicing* en Python:

- `a[start:end]`: retorna los elementos desde `start` hasta `end - 1`.

- `a[start:]`: retorna los elementos desde `start` hasta el final del arreglo.

- `a[:end]`: retorna los elementos desde el principio hasta `end - 1`.

- `a[:]`: crea una copia (*shallow*) del arreglo completo. Es decir, el arreglo retornado está en una nueva dirección de memoria, pero los elementos que están en este nuevo arreglo, hacen referencia a la dirección de memoria de los elementos del arreglo inicial.

- `a[start:end:step]`: retorna los elementos desde `start` hasta no pasar `end`, en pasos de a `step`.

- `a[-1]`: retorna el último elemento en el arreglo.

- `a[-n:]`: retorna los últimos `n` elementos en el arreglo.

- `a[:-n]`: retorna todos los elementos del arreglo menos los últimos `n` elementos.

Veamos algunos ejemplos de *slicing* aplicado a tuplas.

In [None]:
# Usando los valores asignados en a, podemos obtener los valores de una sección de la tupla.
data = (400, 20, 1, 4, 10, 11, 12, 500)
print(f'data: {data}')

# 1. Recuperamos los elementos que están entre los índices 1 y 3
a = data[1:3]
print(f'1. data[1:3]: {a}')

# 2. Recuperamos desde el índice 3 en adelante
a = data[3:]
print(f'2. data[3:]: {a}')

# 3. Recuperamos los valores hasta el índice 5
a = data[:5]
print(f'3. data[:5]: {a}')

# 4. Recuperamos desde el índice 2 en adelante respecto del slice en pasos de a dos
a = data[2::2]
print(f'4. data[2::2]: {a}')

# 5. Recuperamos entre los índices 1 y 4, en pasos de a dos
a = data[1:6:2]
print(f'5. data[1:6:2]: {a}')

# 6. Una secuencia puede ser fácilmente invertida
a = data[::-1]
print(f'6. data[::-1]: {a}')

data: (400, 20, 1, 4, 10, 11, 12, 500)
1. data[1:3]: (20, 1)
2. data[3:]: (4, 10, 11, 12, 500)
3. data[:5]: (400, 20, 1, 4, 10)
4. data[2::2]: (1, 10, 12)
5. data[1:6:2]: (20, 4, 11)
6. data[::-1]: (500, 12, 11, 10, 4, 1, 20, 400)


## Estructuras de datos no secuenciales

Las estructuras no secuenciales permiten almacenar datos, pero sin establecer necesariamente un orden fijo de acceso a ellos. Esto impide que se pueda acceder a los datos usando indexación, sin embargo, esto se compensa al proveer métodos muy eficientes para **búsqueda** de datos. Las dos estructuras secuenciales que revisaremos son los diccionarios y los conjuntos (*sets*).

### Diccionarios

Imaginemos que estamos escribiendo un programa para manejar dinero, y necesitamos saber qué moneda usa el usuario dado el país en que se encuentra. Una posible solución es escribir una función que reciba el nombre del país y que en una trama de `if - elif - else` retorne la moneda correspondiente:

In [None]:
def get_moneda(pais):
    if pais == "Chile":
        return "Peso"
    elif pais == "Perú":
        return "Soles"
    elif pais == "España" or pais == "Holanda":
        return "Euro"
    elif pais == "Brasil":
        return "Real"

No obstante, esta solución es larga, tediosa de escribir, y muy difícil de mantener. Tampoco nos permite extender o actualizar la información en tiempo de ejecución, con datos que podemos leer desde un archivo o desde un servicio web. Si nos fijamos, lo único que estamos haciendo es asociar un valor que conocemos de antemano con otro valor. Esto es un comportamiento muy común de un programa, y es lo que hacen precisamente los **diccionarios**.

Un **diccionario** es una estructura de datos no secuencial y **mutable** que permite asociar pares de elementos mediante la relación **llave-valor**. Al diccionario se le consulta por una **llave** y retorna su **valor** asociado. La **llave** y el **valor** (*key-value*) pueden tener distinto tipo en un diccionario. A este tipo de estructura también se le conoce como estructura de "mapeo" (*mapping*), porque asocian o *mapean* un valor a otro. Estructuras similares existen en muchos otros lenguajes de programación con otros nombres como "tablas de hash" o "*hash maps*".

En el ejemplo de las monedas, los países serían las llaves por las que consultamos, y los valores serían las distintas monedas.

![](img/hash-table.png)

#### Diccionarios en Python


En Python, los diccionarios están implementados por la clase `dict`. La notación para describir un diccionario es mediante llaves (`{}`), y cada par llave-valor se asocia con `:` como muestra el ejemplo:

In [4]:
monedas = {
    "Chile": "Peso",
    "Perú": "Soles",
    "España": "Euro", 
    "Holanda": "Euro",
    "Brasil": "Real"
}

Para acceder al valor asociado a una llave se usan los corchetes (`[]`), mediante la instrucción:

`diccionario[nombre_llave]`.

In [6]:
print(monedas["Chile"])
print(monedas['Brasil'])

Peso
Real


Si se intenta consultar por una llave que no existe, obtenemos un error de tipo `KeyError` indicando que no existe una llave asociada a ese valor.

In [None]:
print(monedas["Argentina"])

KeyError: 'Argentina'

Otra manera de acceder al valor asociado a una llave consiste en utilizar el método [`get`](https://docs.python.org/3/library/stdtypes.html#dict.get) que posee la clase diccionario. Este método requiere dos parámetros: la llave buscada y un valor en caso de que la llave no exista.

In [None]:
print(monedas.get('Chile', 'No tiene moneda'))
print(monedas.get('Perú', 0))
print(monedas.get('Argentina', 'No tiene moneda'))
print(monedas.get('Colombia', False))

Peso
Soles
No tiene moneda
False


Como los diccionarios son **mutables**, si se asigna un valor a una llave existen dos comportamientos posibles. Si la llave no existe, ésta se crea y se le asigna un valor.

In [None]:
monedas["Vaticano"] = "Lira"
print(monedas)

{'Chile': 'Peso', 'Perú': 'Soles', 'España': 'Euro', 'Holanda': 'Euro', 'Brasil': 'Real', 'Vaticano': 'Lira'}


Si la llave ya existe, se actualiza con el nuevo valor:

In [None]:
monedas["Vaticano"] = "Euro"
print(monedas)

{'Chile': 'Peso', 'Perú': 'Soles', 'España': 'Euro', 'Holanda': 'Euro', 'Brasil': 'Real', 'Vaticano': 'Euro'}


A diferencia de otros lenguajes como C# o Java, en Python no es necesario que las llaves sean todas del mismo tipo. Tampoco es necesario que los valores sean todos del mismo tipo.

In [None]:
monedas[3.14] = ("Peso", "Dolar")
monedas

{'Chile': 'Peso',
 'Perú': 'Soles',
 'España': 'Euro',
 'Holanda': 'Euro',
 'Brasil': 'Real',
 'Vaticano': 'Euro',
 3.14: ('Peso', 'Dolar')}

Se puede eliminar ítems del diccionario utilizando la sentencia `del` como:

`del diccionario[nombre_llave]`.

In [None]:
del monedas[3.14]
monedas

{'Chile': 'Peso',
 'Perú': 'Soles',
 'España': 'Euro',
 'Holanda': 'Euro',
 'Brasil': 'Real',
 'Vaticano': 'Euro'}

Se puede comprobar la existencia de una llave en el diccionario utilizando la sentencia `in`. El comportamiento por defecto al utilizar sentencias sobre el diccionario es operar sobre los valores de las llaves. En el caso de `in`, devuelve `True` si la llave requerida existe dentro de las llaves en el diccionario.

In [None]:
print('Chile' in monedas)
print('Argentina' in monedas)
print('Peso' in monedas)
print('Euro' in monedas)

True
False
False
False


#### Eficiencia de diccionarios

Dada una llave `llave`, **acceder a su valor asociado `dict[llave]`** es una operación **muy eficiente** que toma tiempo constante, es decir, **no depende de la cantidad de elementos que tenga el diccionario**. En contraste, esta estructura no está diseñada para buscar (en forma eficiente) una llave a partir de su valor, por lo que sería necesario recorrer todas las llaves creadas para encontrarla, como uno haría con una lista convencional, lo cual implica que ese tiempo de búsqueda es **proporcional al tamaño del diccionario**.

Esta eficiencia de acceso mediante llaves viene con un costo, no todo objeto puede ser usado como llave de diccionario en Python:

##### Llaves permitidas en diccionarios

No todo elemento puede ser usado como llave en un diccionario. El primer requisito es que las llaves **deben ser únicas** (no pueden repetirse), de lo contrario podría pasar que dos valores queden asociados a la misma llave. El segundo requisito es que la llave debe ser [*hasheable*](https://docs.python.org/3/glossary.html#term-hashable), o en palabras (quizás demasiado) sencillas, algún *built-ins* de Python que sea **inmutables**, como `int`, `str` o `tuple`. Al contrario, los *built-ins* mutables no son *hasheables*, por lo que tipos como `list` no pueden ser ocupados como llave.

##### Valores permitidos en diccionarios

Para el caso de los valores que puede contener un diccionario, no hay restricciones. Los valores pueden ser mutables o inmutables, *hasheables* o no, e incluso pueden incluir otros diccionarios. Como en Python todo es un objeto, se pueden incluso guardar funciones y clases.

#### Métodos útiles

Tres métodos útiles que existen en los diccionarios son: 

1. `keys()`: permite obtener una lista con las llaves del diccionario.
2. `values()`: permite obtener una lista con los valores del diccionario.
3. `items()`: permite obtener una lista con los **pares** que tiene el diccionario. Cada par es una tupla de la forma `(llave, valor)`.

In [None]:
print(monedas.keys()) # una lista con todas las llaves
print(monedas.values()) # una lista con todos los valores
print(monedas.items()) # una lista con tuplas de pares llave-valor

dict_keys(['Chile', 'Perú', 'España', 'Holanda', 'Brasil', 'Vaticano'])
dict_values(['Peso', 'Soles', 'Euro', 'Euro', 'Real', 'Euro'])
dict_items([('Chile', 'Peso'), ('Perú', 'Soles'), ('España', 'Euro'), ('Holanda', 'Euro'), ('Brasil', 'Real'), ('Vaticano', 'Euro')])


Estos métodos son prácticos y útiles durante la **_iteración_** sobre diccionarios.

In [None]:
print('Las llaves en el diccionario son las siguientes:')

for m in monedas.keys():
    print(f'{m}')

Las llaves en el diccionario son las siguientes:
Chile
Perú
España
Holanda
Brasil
Vaticano


In [None]:
## También se puede hacer sin usar .keys().
## Si no se especifica nada, se recorren las llaves.

print('Las llaves en el diccionario son las siguientes:')

for m in monedas:
    print(f'{m}')

Las llaves en el diccionario son las siguientes:
Chile
Perú
España
Holanda
Brasil
Vaticano


In [None]:
print('Los valores en el diccionario:')

for v in monedas.values():
    print(f'{v}')

Los valores en el diccionario:
Peso
Soles
Euro
Euro
Real
Euro


In [None]:
print('Los pares en el diccionario:')

for k, v in monedas.items():
    print(f'La moneda de {k} es {v}')

Los pares en el diccionario:
La moneda de Chile es Peso
La moneda de Perú es Soles
La moneda de España es Euro
La moneda de Holanda es Euro
La moneda de Brasil es Real
La moneda de Vaticano es Euro


#### Diccionarios por comprensión

De forma similar a otras estructuras, en Python es posible definir diccionarios por comprensión. Esto permite escribir y crear diccionarios a partir de un concepto estructurado. Permite también el uso de filtrado dentro de éste.

In [None]:
from string import ascii_lowercase as letras


# Diccionario por comprensión
numero_por_letra = {letras[i].upper(): i + 1 for i in range(len(letras))}
print(numero_por_letra)

numero_por_vocales = {
    letras[i].upper(): i + 1 for i in range(len(letras))
    if letras[i].upper() in "AEIOU"
}
print(numero_por_vocales)

{'A': 1, 'B': 2, 'C': 3, 'D': 4, 'E': 5, 'F': 6, 'G': 7, 'H': 8, 'I': 9, 'J': 10, 'K': 11, 'L': 12, 'M': 13, 'N': 14, 'O': 15, 'P': 16, 'Q': 17, 'R': 18, 'S': 19, 'T': 20, 'U': 21, 'V': 22, 'W': 23, 'X': 24, 'Y': 25, 'Z': 26}
{'A': 1, 'E': 5, 'I': 9, 'O': 15, 'U': 21}


##### Ejemplo:

Codifique un programa que cuente cuántas veces aparece cada vocal en un *string*.

In [7]:
msg = 'supercalifragilisticoespialidoso'

# Crea un diccionario vacío para contabilizar las letras
vocales = dict()

for letra in msg:
    # Revisa si la letra es una vocal
    if letra in 'aeiou':
        if letra not in vocales:
            vocales[letra] = 0

        vocales[letra] += 1  # si ya existe, agrega una cuenta mas

print(vocales)

{'u': 1, 'e': 2, 'a': 3, 'i': 6, 'o': 3}


### *Sets*

Los *sets* (en español, conjuntos) son contenedores **mutables**, **no *hasheables***, y **no ordenados** que no repiten elementos. Tienen un comportamiento similar a los [conjuntos matemáticos](https://es.wikipedia.org/wiki/Conjunto). Los *sets* pueden contener cualquier objeto *hasheable*, los mismos que pueden ser llave en un diccionario. La razón de esto último es que los *sets* también utilizan *tablas de hash* para almacenar los datos.

Los *sets* típicamente se utilizan para eliminar duplicados o para revisar si un elemento se encuentra en esta estructura o no, de forma eficiente. **Revisar si un elemento está o no está** toma tiempo constante; es decir, el tiempo que se demora esta operación no depende de cuán grande es el conjunto.

En Python, los *sets* son implementados por la clase `set`. Es posible crear un *set* vacío con `set()`.

In [None]:
conjunto_vacío = set()
print(conjunto_vacío)

set()


Es posible crear un conjunto a partir de una lista de elementos. Notemos que el *set* creado **no tendrá elementos repetidos**, y no necesariamente respetará el orden original de los elementos.

In [None]:
lista_artistas = ["Olivia Newton-John", "Daddy Yankee", "Sting", 
                  "Dream Theater", "Mon Laferte", "Sting"]
print(set(lista_artistas))

{'Sting', 'Dream Theater', 'Daddy Yankee', 'Olivia Newton-John', 'Mon Laferte'}


Es importante notar que el músico Sting —que estaba repetido en la lista— queda una única vez al transformarlo a *set*. Podemos también construir un *set* directamente usando llaves `{`, `}`, donde los elementos están separados por coma.

In [None]:
conjunto_artistas = {"Olivia Newton-John", "Daddy Yankee", "Sting", 
                     "Dream Theater", "Mon Laferte"}
print(conjunto_artistas)

{'Dream Theater', 'Daddy Yankee', 'Olivia Newton-John', 'Sting', 'Mon Laferte'}


La notación con llaves no puede ser utilizada para crear un *set* vacío, ya que esa notación se usa para crear un diccionario.

In [None]:
intento_de_conjunto_vacío = {}
print(type(intento_de_conjunto_vacío))

<class 'dict'>


A diferencia de otros lenguajes como Java o C#, los tipos de los elementos de un *set* pueden ser heterogéneos.

In [None]:
conjunto_heterogéneo = {"cero", 3, "cero", 3, "cuatro", 5, "seis"}
print(conjunto_heterogéneo)

{'cero', 3, 5, 'seis', 'cuatro'}


Además, en Python se permite la definición por comprensión de *sets*, de forma similar a como es posible con listas y diccionarios. También, esto admite para definiciones más complejas que dependen de otro tipo de estructuras.

In [None]:
from collections import namedtuple


Película = namedtuple("Pelicula", ["título", "director", "género"])
películas = [
    Película("Into the Woods", "Rob Marshall", "Aventura"),
    Película("American Sniper", "Clint Eastwood", "Acción"),
    Película("Birdman", "Alejandro González Inárritu", "Comedia"),
    Película("Boyhood", "Richard Linklater", "Drama"),
    Película("Taken", "Pierre Morel", "Acción"),
    Película("Taken 2", "Olivier Megaton", "Acción"),
    Película("Taken 3", "Olivier Megaton", "Acción"),
    Película("The Imitation Game", "Morten Tyldum", "Biografías"),
    Película("Gone Girl", "David Fincher", "Drama")
]

# Set por comprensión
directores_acción = {p.director for p in películas if p.género == 'Acción'}
# Por cada elemento p en películas,
# si el género de p es 'Acción',
# entonces el director de p pertenece a directores_acción

print(directores_acción)  # Notamos que no hay duplicados, nuevamente

{'Pierre Morel', 'Olivier Megaton', 'Clint Eastwood'}


#### Operaciones sobre *sets*

En Python, los *sets* son capaces de realizar varias operaciones. Algunas son comunes con otros tipos de colecciones, y otras son análogas a las que se hacen con conjuntos matemáticos.

Es importante mencionar que los *sets* **no soportan ningún tipo de acceso indexado**, pues no tienen orden. Por ejemplo, el siguiente código arroja un error.

In [None]:
conjunto_artistas = {"Olivia Newton-John", "Daddy Yankee", "Sting", 
                     "Dream Theater", "Mon Laferte"}
conjunto_artistas[0]

TypeError: 'set' object is not subscriptable

Ahora revisaremos las operaciones más importantes que soportan los *sets*.

#### Revisar la cantidad de elementos

Tal y como con las otras estructuras, esto se hace con la función `len`

In [None]:
print(len(conjunto_artistas))

5


#### *Add*

A un *set* se le pueden añadir elementos con el método `add`.

In [None]:
conjunto_artistas.add("Taylor Swift")
print(conjunto_artistas)

{'Dream Theater', 'Daddy Yankee', 'Olivia Newton-John', 'Sting', 'Taylor Swift', 'Mon Laferte'}


Si se intenta agregar un elemento que ya estaba, nada ocurre.

In [None]:
conjunto_artistas.add("Sting")
print(conjunto_artistas)

{'Dream Theater', 'Daddy Yankee', 'Olivia Newton-John', 'Sting', 'Taylor Swift', 'Mon Laferte'}


#### *Remove*

Se puede sacar un elemento del *set* con el método `remove`.

In [None]:
conjunto_artistas.remove("Daddy Yankee")
print(conjunto_artistas)

{'Dream Theater', 'Olivia Newton-John', 'Sting', 'Taylor Swift', 'Mon Laferte'}


Esta operación resulta en un error si se intenta eliminar algo que no estaba previamente en el *set*.

In [None]:
conjunto_artistas.remove("The Beatles")

KeyError: 'The Beatles'

#### *Discard*

Es una operación similar a *remove*, pero que no lanza un error en caso de que el elemento no haya estado en el conjunto.

In [None]:
conjunto_artistas.discard("Dream Theater")
print(conjunto_artistas)

{'Olivia Newton-John', 'Sting', 'Taylor Swift', 'Mon Laferte'}


In [None]:
conjunto_artistas.discard("The Beatles")
print()




#### Iterar con `for`

Se puede iterar por los elementos de un conjunto con `for`. Debemos recordar, sin embargo, que el recorrido no se hará en ningún orden en particular, puesto que los *sets* **no** son estructuras ordenadas. Está garantizado que cada elemento será recorrido *exactamente una vez*.

In [None]:
for artista in conjunto_artistas:
    print(f"Por favor, ¡saluden a {artista}!")

Por favor, ¡saluden a Olivia Newton-John!
Por favor, ¡saluden a Sting!
Por favor, ¡saluden a Taylor Swift!
Por favor, ¡saluden a Mon Laferte!


#### Verificar si un elemento pertenece al *set*

Podemos verificar si un elemento está en el *set* con la sentencia `in`.

In [None]:
print("Natalia Lafourcade" in conjunto_artistas)

False


In [None]:
print("Sting" in conjunto_artistas)

True


En los *sets*, esta operación es **muy eficiente** y toma un tiempo que *no depende del tamaño del conjunto*.

Esto es muy distinto del caso de las listas. Para verificar si un elemento está o no en una lista, internamente se debe recorrer toda la lista hasta encontrarlo, o bien llegar al final para darse cuenta de que no estaba. Esto significa que el *tiempo máximo de búsqueda crece* a medida que el tamaño de la lista aumenta.

Para comprobar estas diferencias en tiempo, vamos a crear una lista y un *set*, cada uno con 10.000.000 de elementos.

In [None]:
from time import time


ELEMENTOS = 10 ** 7
ELEMENTO_A_BUSCAR = ELEMENTOS // 2

lista_gigante = list(range(ELEMENTOS))
set_gigante = set(range(ELEMENTOS))

tiempo_inicio = time()
ELEMENTO_A_BUSCAR in set_gigante
tiempo_fin = time()
tiempo_set = tiempo_fin - tiempo_inicio
print(f"set  -- La búsqueda de {ELEMENTO_A_BUSCAR} demoró... {tiempo_set:.6f} segundos.")

tiempo_inicio = time()
ELEMENTO_A_BUSCAR in lista_gigante
tiempo_fin = time()
tiempo_lista = tiempo_fin - tiempo_inicio
print(f"list -- La búsqueda de {ELEMENTO_A_BUSCAR} demoró... {tiempo_lista:.6f} segundos.")

print()
print(f"La búsqueda en la lista fue {tiempo_lista / tiempo_set:.2f} veces más lenta que en el set.")

set  -- La búsqueda de 5000000 demoró... 0.000115 segundos.
list -- La búsqueda de 5000000 demoró... 0.081251 segundos.

La búsqueda en la lista fue 708.51 veces más lenta que en el set.


#### Unión de conjuntos

![](https://upload.wikimedia.org/wikipedia/commons/3/32/SetUnion.svg)

Sirve para obtener un nuevo conjunto que tenga todos los elementos de los conjuntos que se unen. Esta operación no altera ninguno de los *sets* originales. Se utiliza el operador `|`.

In [None]:
set_a = {0, 1, 2, 3}
set_b = {5, 4, 3, 2}
set_union = set_a | set_b
print(set_union)

{0, 1, 2, 3, 4, 5}


También se puede ocupar el método `union`. Esta operación no altera ninguno de los *sets* originales.

In [None]:
set_union = set_a.union(set_b)
print(set_union)

{0, 1, 2, 3, 4, 5}


#### Intersección de conjuntos

![](https://upload.wikimedia.org/wikipedia/commons/c/cb/SetIntersection.svg)

Sirve para obtener un nuevo conjunto que tenga los elementos que están en **todos** los conjuntos que se intersectan. Esta operación no altera ninguno de los *sets* originales. Se utiliza el operador `&`.

In [None]:
set_a = {0, 1, 2, 3}
set_b = {4, 3, 2, 5}
set_intersection = set_a & set_b
print(set_intersection)

{2, 3}


También se puede ocupar el método `intersection`. Esta operación no altera ninguno de los *sets* originales.

In [None]:
set_intersection = set_a.intersection(set_b)
print(set_intersection)

{2, 3}


#### Diferencia de conjuntos

![](https://upload.wikimedia.org/wikipedia/commons/e/ec/SetDifferenceA.svg)

Sirve para obtener un nuevo conjunto que tenga los elementos que están en un conjunto, pero que no estén en otro. Esta operación no altera ninguno de los *sets* originales. Se utiliza el operador `-`. Notar que el resultado de esta operación **sí depende** del orden de los factores.

In [None]:
set_a = {0, 1, 2, 3}
set_b = {2, 3, 4, 5}
set_difference_a_b = set_a - set_b
set_difference_b_a = set_b - set_a
print(set_difference_a_b)
print(set_difference_b_a)

{0, 1}
{4, 5}


También se puede ocupar el método `difference`. Esta operación no altera ninguno de los *sets* originales.

In [None]:
set_difference_a_b = set_a.difference(set_b)
set_difference_b_a = set_b.difference(set_a)
print(set_difference_a_b)
print(set_difference_b_a)

{0, 1}
{4, 5}


##### Diferencia simétrica de conjuntos

![](https://upload.wikimedia.org/wikipedia/commons/f/f2/SetSymmetricDifference.svg)

Sirve para obtener un nuevo conjunto de objetos que están en un conjunto o en el otro, pero no en ambos. Esta operación no altera ninguno de los *sets* originales. Se ocupa el operador `^`. 

In [None]:
set_a = {0, 1, 2, 3}
set_b = {2, 3, 4, 5}
set_sym_difference = set_a ^ set_b
print(set_sym_difference)

{0, 1, 4, 5}


También se puede ocupar el método `symmetric_difference`. Esta operación no altera ninguno de los *sets* originales.

In [None]:
set_sym_difference = set_a.symmetric_difference(set_b)
print(set_sym_difference)

{0, 1, 4, 5}


#### Ejemplo de eliminación de duplicados

Podemos usar *sets* para eliminar duplicados de una lista.

In [None]:
lista = ['A', 'B', 'A', 'D', 'F', 'X', 'X', 'X', 'Z', 'Z', 'Y']
lista_set = set(lista)
print(lista_set)

{'A', 'Z', 'X', 'F', 'D', 'Y', 'B'}


Y también es posible crear una lista a partir de un *set*.

In [None]:
lista = list(lista_set)
print(lista)

['A', 'Z', 'X', 'F', 'D', 'Y', 'B']


Podemos ordenar la lista si queremos convencernos que no hay repetidos:

In [None]:
lista.sort()
print(lista)

['A', 'B', 'D', 'F', 'X', 'Y', 'Z']
