# Semana 2

Las estructuras de datos consisten en maneras eficientes de agrupar datos relacionados


Exitenn las estructuras de datos **secuenciales** y **no secuenciales**. Las secuenciales son aquellas que tienen un orden, como las listas, tuplas y str. Las no secuenciales son aquellas que no tienen un orden, como los conjuntos(sets) y los diccionarios.


## Tuplas 

Las tuplas son secuencias inmutables, es decir, no se pueden modificar. Se crean utilizando paréntesis y separando los elementos con comas.

```python
tupla = (1, 2, 3)
```

Pueden tener todo tipo de valores, incluso otras tuplas.

```python
tupla = (1, 'hola', (1, 2, 3))
```

```python
# Usando tuple() sin ingresar elementos, se crea una tupla vacía.
a = tuple()

# Declarando explícitamente los elementos de la tupla,
# ingresándolos entre paréntesis.
b = (0, 1, 2)

# Cuando creamos una tupla de tamaño 1, debemos incluir una coma al final.
c = (0, )

# Pueden ser creadas con objetos de distinto tipo.
# Al momento de la creación se pueden omitir los paréntesis.
d = 0, 'uno'

print(type(a), a)
print(type(b), b, b[0], b[1])
print(type(c), c)
print(type(d), d, d[0], d[1])
```
<class 'tuple'> ()
<class 'tuple'> (0, 1, 2) 0 1
<class 'tuple'> (0,)
<class 'tuple'> (0, 'uno') 0 uno

 Las tuplas una vez creadas son inmutables, es decir, no se pueden cambiar valores

```python
tupla = (1, 2, 3)
tupla[0] = 4 # Error
```

Sin embargo, como las tuplas admiten todo tipo de datos, si utilizamos i¿una lista o cualquier estructura de datos que sea mutable, entonces si cambiamos su valor si funcionara:

```python
meses = (2023, "semestre", 2, ['Ago', 'Sep', 'Oct', 'Nov', 'Dic'])

meses[3][0] = 'Ene'
print(meses)
```
(2023, 'semestre', 2, ['Ene', 'Sep', 'Oct', 'Nov', 'Dic'])

### Desempaquetado de tuplas (elementos)

El desempaquetado de tuplas es una forma de asignar los valores de una tupla a variables. Se hace colocando las variables a las que se quieren asignar los valores de la tupla a la izquierda del signo igual y la tupla a la derecha del signo igual.

```python
def calcular_geometria(a, b):
    area = a * b
    perimetro = (2 * a) + (2 * b)
    punto_medio_a = a / 2
    punto_medio_b = b / 2
    # Los paréntesis son opcionales, ya que estamos creando una tupla
    return (area, perimetro, punto_medio_a, punto_medio_b)


# Obtenemos una tupla con los datos provenientes de la función.
data = calcular_geometria(20.0, 10.0)
print(f"1: {data}")

# El tipo de dato obtenido es 'tuple'
print(type(data))

# Obtenemos un valor desde la tupla directamente usando su índice
p = data[1]
print(f"2: {p}")

# Desempaquetamos en variables independientes
# los valores contenidos en una tupla
a, p, mpa, mpb = data
print(f"3: {a}, {p}, {mpa}, {mpb}")

# Las funciones devuelven el conjunto de valores
# como una tupla. Se puede desempaquetar directamente
# en variables individuales como en el caso anterior.
a, p, mpa, mpb = calcular_geometria(20.0, 10.0)
print(f"4: {a}, {p}, {mpa}, {mpb}")
```
1: (200.0, 60.0, 10.0, 5.0)
<class 'tuple'>
2: 60.0
3: 200.0, 60.0, 10.0, 5.0
4: 200.0, 60.0, 10.0, 5.0

### Slicing de tuplas

Funciona igual que las str y listas.
	
Forma general de hacer *slicing* en Python:

- `a[start:end]`: retorna los elementos desde `start` hasta `end - 1`.

- `a[start:]`: retorna los elementos desde `start` hasta el final del arreglo.

- `a[:end]`: retorna los elementos desde el principio hasta `end - 1`.

- `a[:]`: crea una copia (*shallow*) del arreglo completo. Es decir, el arreglo retornado está en una nueva dirección de memoria, pero los elementos que están en este nuevo arreglo, hacen referencia a la dirección de memoria de los elementos del arreglo inicial.

- `a[start:end:step]`: retorna los elementos desde `start` hasta no pasar `end`, en pasos de a `step`.

- `a[-1]`: retorna el último elemento en el arreglo.

- `a[-n:]`: retorna los últimos `n` elementos en el arreglo.

- `a[:-n]`: retorna todos los elementos del arreglo menos los últimos `n` elementos.

Veamos algunos ejemplos de *slicing* aplicado a tuplas.



## Named tuples

Una alternativa a clases cuando los datos no tienen compartimientos asociados

```python
from collections import namedtuple

# Creamos una clase llamada 'Punto' con dos campos: 'x' e 'y'

Punto = namedtuple('Punto', ['x', 'y'])

# Creamos un objeto de la clase 'Punto'

p = Punto(11, 22)

# Accedemos a los campos del objeto

print(p.x, p.y) # 11 22

# El tipo de dato es 'Punto'

print(type(p)) # <class ´__main__.Punto´>
```

## Stacks

Una pila es una estructura de datos que permite almacenar y recuperar datos, siguiendo el principio LIFO (Last In, First Out). Es decir, el último elemento que se agrega a la pila es el primero en ser eliminado.

```python

# Creamos una lista vacía
stack = []

# Agregamos elementos a la pila
stack.append(1)
stack.append(2)

# Mostramos la pila
print(stack) # [1, 2]

# Eliminamos el último elemento agregado
stack.pop()

# Mostramos la pila
print(stack) # [1]
```

Un stack tiene dos operaciones básicas: 

- `push`: Agrega un elemento a la pila.
- `pop`: Elimina el último elemento agregado a la pila.

Hay una tercera operación que se puede realizar con un stack, que es `peek`, que permite ver el último elemento agregado a la pila sin eliminarlo.

Tambien es posible consultar cuantos elementos tiene la pila.


Si usamos stacks, y queremos sacar el primer elemento, tenemos que sacar todos los elementos que estan arriba de el, y luego sacar el elemento que queremos.

### Implementación en Python

En Python, podemos representar *stacks* mediante listas. A continuación, vemos una tabla con las operaciones del *stack* y su implementación en Python, seguida de ejemplos para cada operación:

| Operación                                  | Código Python            |Descripción                                           |
|--------------------------------------------|--------------------------|------------------------------------------------------|
| Crear *stack*                              | `stack = []`             |Crea un *stack* vacío                                 |
| *Push*                                     | `stack.append(elemento)` |Agrega un elemento al tope del *stack*                |
| *Pop*                                      | `stack.pop()`            |Retorna y extrae el elemento del tope del *stack*     |
| *Peek*                                     | `stack[-1]`              |Retorna el elemento del tope del *stack* sin extraerlo|
| *length*                                   | `len(stack)`             |Retorna la cantidad de elementos en el *stack*        |
| *is\_empty*                                | `len(stack) == 0`        |Retorna `true` si el *stack* está vacío               |


## Queues(colas)

Una cola es una estructura de datos que permite almacenar y recuperar datos, siguiendo el principio FIFO (First In, First Out). Es decir, el primer elemento que se agrega a la cola es el primero en ser eliminado.

Una cola tiene dos operaciones básicas:

- `enqueue`: Agrega un elemento a la cola.
- `dequeue`: Elimina el primer elemento agregado a la cola.

También es posible consultar cuántos elementos tiene la cola. 
Tiene un tercer elemento que es `peek`, que permite ver el primer elemento agregado a la cola sin eliminarlo.

| Operación                 | Código Python           | Descripción                                           |
|---------------------------|-------------------------|-------------------------------------------------------|
| Crear cola                | `cola = deque()`        | Crea una cola vacía                                   |
| Crear cola                | `cola = deque(lista)`   | Crea una cola a partir de los elementos de una lista  |
| *Enqueue*                 | `cola.append(elemento)` | Agrega un elemento al final de la cola                |
| *Dequeue*                 | `cola.popleft()`        | Retorna y extrae el elemento del principio de la cola |
| *Peek*                    | `cola[0]`               | Retorna el primer elemento de la cola sin extraerlo   |
| *length*                  | `len(cola)`             | Retorna la cantidad de elementos en la cola           |
|*is_empty*                 | `len(cola) == 0`        | Retorna true si la cola está vacía      

El módulo `collections`provee una implementación de colas que realiza todas las operaciones que queremos de manera eficiente. Sin embargo, esta no es exactamente la estructura *queue* que acabamos de describir, sino que una versión con más operaciones llamada *deque* (por *double ended queue*).

## Colas de dos extremos (deque)

| Operación      | Código Python                | Descripción                                                      |
|----------------|------------------------------|------------------------------------------------------------------|
| Crear *deque*  | `deque()`                    | Crea un *deque* vacío                                            |
| Crear *deque*  | `deque(lista)`               | Crea un *deque* a partir de los elementos de una lista           |
| *Add first*    | `deque.appendleft(elemento)` | Agrega un elemento al inicio del *deque*                         |
| *Add last*     | `deque.append(elemento)`     | Agrega un elemento al final del *deque*                          |
| *Delete first* | `deque.popleft()`            | Retorna y extrae el primer elemento del *deque*                  |
| *Delete last*  | `deque.pop()`                | Retorna y extrae el último elemento del *deque*                  |
| *First*        | `deque[0]`                   | Retorna sin extraer el primer elemento del *deque*               |
| *Last*         | `deque[-1]`                  | Retorna sin extraer el último elemento del *deque*               |
| *length*       | `len(deque)`                 | Retorna el número de elementos en el *deque*                     |
| *Is empty*     | `len(deque) == 0`            | Retorna true si el *deque* está vacío                            |
| *Clear*        | `deque.clear()`              | Limpia el *deque*                                                |
| *Remove*       | `deque.remove(elemento)`     | Saca el primer elemento del *deque* que sea igual a `elemento`   |
| *Count*        | `deque.count(elemento)`      | Cuenta el número de elementos iguales a `elemento` en el *deque* |


### List vs deque

La principal diferencia entre list y deque es que las operaciones de inserción y eliminación de elementos en listas son más lentas que en deque. Esto se debe a que las listas están optimizadas para acceso aleatorio, mientras que los deques están optimizados para inserciones y eliminaciones en ambos extremos.

```python	

from collections import deque
from time import time


ELEMENTS = 10_000_000

# Creamos un deque y una lista con 10.000.000 de enteros
number_deque = deque(range(ELEMENTS))
number_list = list(range(ELEMENTS))

# Vemos el time actual
start_time = time()
# Buscamos el elemento del medio
number_deque[ELEMENTS // 2]
finish_time = time()
deque_time = finish_time - start_time
# Imprimimos el tiempo transcurrido
print(f"""Buscar el elemento {ELEMENTS // 2} en el deque se demoró """
      f"""{deque_time:.6f} segundos.""")


# Vemos el time actual
start_time = time()
# Buscamos el elemento del medio
number_list[ELEMENTS // 2]
finish_time = time()
list_time = finish_time - start_time
# Imprimimos el tiempo transcurrido
print(f"""Buscar el elemento {ELEMENTS // 2} en la lista se demoró """
      f"""{list_time:.6f} segundos.""")
if list_time > 0.0:
    print(f"La búsqueda en deque fue {deque_time/list_time:.2f} veces el tiempo de list.")
else:
    print("Ups, tu computador es demasiado rápido.")
print()

# Vamos a hacer pop de los primeros 1000 elementos del deque
start_time = time()
N = 1000
for i in range(0, N):
    number_deque.popleft()
finish_time = time()
deque_time = finish_time - start_time
print(f"Sacar los primeros {N} elementos del deque se demoró   {deque_time:.6f} segundos.")

# Vamos a hacer pop de los primeros 1000 elementos de la lista
start_time = time()
N = 1000
for i in range(0, N):
    number_list.pop(0)
finish_time = time()
list_time = finish_time - start_time
print(f"Sacar los primeros {N} elementos de la lista se demoró {list_time:.6f} segundos.")
if deque_time > 0.0:
    print(f"La extracción en list fue {list_time/deque_time:.2f} veces el tiempo de deque.")
else:
    print("Ups, tu computador es demasiado rápido.")
print()

```

**Gana List**
Buscar el elemento 5000000 en el deque se demoró 0.192705 segundos.
Buscar el elemento 5000000 en la lista se demoró 0.000370 segundos.
La búsqueda en deque fue 520.45 veces el tiempo de list.

**Gana Deque**
Sacar los primeros 1000 elementos del deque se demoró   0.000399 segundos.
Sacar los primeros 1000 elementos de la lista se demoró 10.603456 segundos.
La extracción en list fue 26599.35 veces el tiempo de deque.


Finalmente, el Deque es una generalización de stacks y cola.

Otro ejemplo:

```python
from collections import deque


def es_palindrome(palabra):
    cola = deque(palabra)
    return es_palindrome_rec(cola)


def es_palindrome_rec(palabra):
    if len(palabra) <= 1:
        return True
    else:
        return palabra.popleft() == palabra.pop() \
                and es_palindrome_rec(palabra)


print(es_palindrome("reconocer"))
print(es_palindrome("espectaculo"))
print(es_palindrome("ana"))
print(es_palindrome("OssA"))
print(es_palindrome("OssO"))

```
True
False
True
False
True


**Nota**: En Python lo más directo para chequear si un *string* es palíndromo es simplemente comparar `palabra == palabra[::-1]`


## Dicts (diccionarios)

Los diccionarios sopn una estructura de datos **no secuencia y mutable** la cual asocia pares de elementos mediante la relación llave-valor. Las llaves son únicas y los valores no lo son.

Al dict se le cosnulta por una llave, y este devuelve el valor asociado a esa llave.


La llave y el valor pueden tenir disitnto tipo de estructura de un diccionario (Como las tuplas que aceptan todo tipo de datos)


A este tipo de estructura se les conococe como estructura de "mapeo" (mapping) porque asocian o mapea un valor a otro.

Estructuras similares con otros nombres en lenguajes de programación distintos a Python: tablas de hash(hash maps)

Los dict en phyton se escriben: 

```python
diccionario = {
    'llave1': 'valor1',
    'llave2': 'valor2',
    'llave3': 'valor3'
}
print(diccionario) # {'llave1': 'valor1', 'llave2': 'valor2', 'llave3': 'valor3'}

print(diccionario['llave1']) # valor1
```
Se puede eliminar ítems del diccionario utilizando la sentencia `del` como:

`del diccionario[nombre_llave]`.

```python
diccionario = {
    'llave1': 'valor1',
    'llave2': 'valor2',
    'llave3': 'valor3'
}

del diccionario['llave1']
print(diccionario) # {'llave2': 'valor2', 'llave3': 'valor3'}
```

Se puede comprobar la existencia de una llave en el diccionario utilizando la sentencia `in`. El comportamiento por defecto al utilizar sentencias sobre el diccionario es operar sobre los valores de las llaves. En el caso de `in`, devuelve `True` si la llave requerida existe dentro de las llaves en el diccionario.


### Eficiencia de los diccionarios

Los diccionarios son muy eficientes para buscar elementos. La operación de buscar un elemento en un diccionario es de tiempo constante, es decir, no importa cuántos elementos tenga el diccionario, la operación de buscar un elemento en el diccionario siempre demorará lo mismo.

Esto viene con un costom, no todo objeto puede ser usado como llave de diccionario. Las llaves de un diccionario deben ser objetos inmutables, es decir, que no puedan ser modificados después de haber sido creados. Por ejemplo, las tuplas pueden ser usadas como llaves de diccionario, pero las listas no.

### Llaves permitidas

Los dict estan implementados a partir una estructura llamada **tabla de hash** en esta estructura existe una funcion matematica que se le aplica a la llave para saber en que lugar se debe guardar un determinado valor. Esa funcion se llama **funcion de hash**.

Requisitos para las keys:

- La llave debe ser unica

- Debe ser hashable:
    Un objeto es haseable si:
        1. Implementa el método __hash__. Este método debe devolver un entero, y sirve de entrada para la función hash de la tabla de hash.

        2. El valor que tetorna __hash__  **no cambia** durante el ciclo de vida del objeto.

        3. Implementa el método __eq__. Este método compara dos objetos y retorna 
        True si son iguales y False si no lo son.

        4. Si segun el metodo eq son iguales entonces el valor que retorna hash debe ser el mismo, al revés no es necario que se cumpla.

    En particular todos los built-in inmutables son hashable, y los mutables no lo son.

    Como los tipos:
        - Int
        - Str
        - Tuple

    No son hashable:
        - List
        - Set
        - Dict


Ejemplo: 

```python

hello_1 = "Hello world"
hello_2 = "Hello world"

print(f"Hash de hello_1: {hash(hello_1)}")
print(f"Hash de hello_2: {hash(hello_2)}")
print(f"¿Son iguales? {hello_1 == hello_2}")
print(f"¿Son el mismo objeto? {hello_1 is hello_2}")

```
Hash de hello_1: -3814696044897253176
Hash de hello_2: -3814696044897253176
¿Son iguales? True
¿Son el mismo objeto? False


is es para saber si dos objetos son el mismo objeto, es decir, si apuntan a la misma dirección de memoria. == es para saber si dos objetos son iguales, es decir, si tienen el mismo valor.

**Nota:** Una tupla solo es hasheable solo si todos sus elementos son hasheables.

Las instancias de clases creadas por el usario son hasheables por defecto.

Notar que apesar de tener elementos no hasheables, la instancia es hasheable.

Esto sucede porque en instancias el valor del hash **no depende** de los valores de los atributos de la instancia.

### Valores permitidos en dicts

Los valores de un diccionario pueden ser cualquier tipo de dato, incluso otros diccionarios.


### Métodos útiles

Hay tres métodos.

- `keys()`: Retorna una vista de las llaves del diccionario.
- `values()`: Retorna una vista de los valores del diccionario.
- `items()`: Retorna una vista de los pares llave-valor del diccionario.

```python

print(monedas.keys()) # una lista con todas las llaves
print(monedas.values()) # una lista con todos los valores
print(monedas.items()) # una lista con tuplas de pares llave-valor

```

dict_keys(['Chile', 'Perú', 'España', 'Holanda', 'Brasil', 'Vaticano'])
dict_values(['Peso', 'Soles', 'Euro', 'Euro', 'Real', 'Euro'])
dict_items([('Chile', 'Peso'), ('Perú', 'Soles'), ('España', 'Euro'), ('Holanda', 'Euro'), ('Brasil', 'Real'), ('Vaticano', 'Euro')])


Estos métodos son prácticos y útiles durante la itreación de un diccionario.

```python

print('Las llaves en el diccionario son las siguientes:')

for m in monedas.keys():
    print(f'{m}')

```
Las llaves en el diccionario son las siguientes:
Chile
Perú
España
Holanda
Brasil
Vaticano

```python
## También se puede hacer sin usar .keys().
## Si no se especifica nada, se recorren las llaves.

print('Las llaves en el diccionario son las siguientes:')

for m in monedas:
    print(f'{m}')

```
Las llaves en el diccionario son las siguientes:
Chile
Perú
España
Holanda
Brasil
Vaticano


Luego se pueden ver los valores de la misma forma.

```python
print('Los valores en el diccionario:')

for v in monedas.values():
    print(f'{v}')

```
Los valores en el diccionario:
Peso
Soles
Euro
Euro
Real
Euro

Para valores pares se busca lo siguiente:

```python
print('Los pares en el diccionario:')

for k, v in monedas.items():
    print(f'La moneda de {k} es {v}')

```
Los pares en el diccionario:
La moneda de Chile es Peso
La moneda de Perú es Soles
La moneda de España es Euro
La moneda de Holanda es Euro
La moneda de Brasil es Real
La moneda de Vaticano es Euro


## Dict por compresión

Los diuct se pueden realizar por compresión, de la misma forma que las listas.

```python
from string import ascii_lowercase as letras


# Diccionario por comprensión
numero_por_letra = {letras[i].upper(): i + 1 for i in range(len(letras))}
print(numero_por_letra)

numero_por_vocales = {
    letras[i].upper(): i + 1 for i in range(len(letras))
    if letras[i].upper() in "AEIOU"
}
print(numero_por_vocales)

```


{'A': 1, 'B': 2, 'C': 3, 'D': 4, 'E': 5, 'F': 6, 'G': 7, 'H': 8, 'I': 9, 'J': 10, 'K': 11, 'L': 12, 'M': 13, 'N': 14, 'O': 15, 'P': 16, 'Q': 17, 'R': 18, 'S': 19, 'T': 20, 'U': 21, 'V': 22, 'W': 23, 'X': 24, 'Y': 25, 'Z': 26}
{'A': 1, 'E': 5, 'I': 9, 'O': 15, 'U': 21}


Applicaciones de los diccionarios:

Se pueden realizar conteos de frecuencia.

```python
msg = 'supercalifragilisticoespialidoso'

# Crea un diccionario vacío para contabilizar las letras
vocales = dict()

for letra in msg:
    # Revisa si la letra es una vocal
    if letra not in 'aeiou':
        continue

    # Revisa si letra existe en el diccionario, si no la crea en 0
    if letra not in vocales:
        vocales[letra] = 0

    vocales[letra] += 1  # si ya existe, agrega una cuenta mas

print(vocales) # {'u': 1, 'e': 2, 'a': 3, 'i': 6, 'o': 3}

```

## Defaultdicts

Nos permiten asignar valor por defecto a una llave que no existe en el diccionario.

```python

from collections import defaultdict

msg = 'supercalifragilisticoespialidoso'

# Crea un defaultdict vacío.
vocales = defaultdict(int)

# Pasamos int como callable. El callable se va a llamar sin parámetros
# cada vez que se consulte por una key que no existe.
# En este caso, int() devolverá el valor por defecto de este tipo (0)

for letra in msg:
    if letra not in 'aeiou':  # Revisa si la letra es una vocal
        continue

    vocales[letra] += 1  # si ya existe, agrega una cuenta mas

print(vocales) # defaultdict(<class 'int'>, {'u': 1, 'e': 2, 'a': 3, 'i': 6, 'o': 3})

```
Tambien podemos nosotros definir que key se agregara, en este caso un numero random.

```python
from random import random

def funcion_default():
    return random()


diccionario = defaultdict(funcion_default)

print(diccionario)
diccionario['A']
print(diccionario)
diccionario['B']
print(diccionario)

'''
defaultdict(<function funcion_default at 0x7fa9983d3d00>, {})
defaultdict(<function funcion_default at 0x7fa9983d3d00>, {'A': 0.6838323795438912})
defaultdict(<function funcion_default at 0x7fa9983d3d00>, {'A': 0.6838323795438912, 'B': 0.26569548318762837})
'''
```

## Sets

Son contenedores **mutables**, **no hasheables** y **no ordenados ** que no repite elementos.
Tienen comportamientos simalares a los conjuntos **matematicos**
Los sets pueden contener cualquier objeto hasheable, los mismos que pueden ser llave en un diccionario. Esto potrque usan tablas de hash.

Comunmente sirven para eliminar duplicados o revisar si un elemento se encuentra o no, de forma eficiente. 

```python
conjunto = set()
print(conjunto) # set()

```

Se puede crear un conjunto a partir de una lista de elementos (con elementos hasheables).

```python

lista_artistas = ["Olivia Newton-John", "Daddy Yankee", "Sting", 
                  "Dream Theater", "Mon Laferte", "Sting"]
print(set(lista_artistas))

```
{'Sting', 'Mon Laferte', 'Olivia Newton-John', 'Daddy Yankee', 'Dream Theater'}

No necesariamente respeta el orden original, y elimina los duplicados.


El set tambien se construye usando `{}`.

Para crear un set vacío no se puede usar solo `{}`, ya que se interpretará como un diccionario vacío. En su lugar, se debe usar `set()`.

Los sets pueden tener disntitos tipos de elementos hasheables


## Compresión de sets

```python

from collections import namedtuple


Película = namedtuple("Pelicula", ["título", "director", "género"])
películas = [
    Película("Into the Woods", "Rob Marshall", "Aventura"),
    Película("American Sniper", "Clint Eastwood", "Acción"),
    Película("Birdman", "Alejandro González Inárritu", "Comedia"),
    Película("Boyhood", "Richard Linklater", "Drama"),
    Película("Taken", "Pierre Morel", "Acción"),
    Película("Taken 2", "Olivier Megaton", "Acción"),
    Película("Taken 3", "Olivier Megaton", "Acción"),
    Película("The Imitation Game", "Morten Tyldum", "Biografías"),
    Película("Gone Girl", "David Fincher", "Drama")
]

# Set por comprensión
directores_acción = {p.director for p in películas if p.género == 'Acción'}
# Por cada elemento p en películas,
# si el género de p es 'Acción',
# entonces el director de p pertenece a directores_acción

print(directores_acción)  # Notamos que no hay duplicados, nuevamente

```

{'Clint Eastwood', 'Pierre Morel', 'Olivier Megaton'}


## Operaciones sobre sets

Es importante aclarar que los sets no tienen indexado, por lo que no se puede acceder a un elemento en particular.

Operaciones importantes:
    - Con len la cantidad de elementos
    - Con `add` se hace lo mismo que con `append` en listas:
        Esto lo hace de forma aleatoria.
        Si se agrega algo que ya existe este *no* cambia.
    - Con `remove` se elimina un elemento, *si no existe se lanza un error*.
    - Con `discard` se elimina un elemento, *no* lanza error si no existe.
    - Iterar con `for` para recorrer los elementos.
    - Con `in` se puede saber si un elemento esta en el set:
        Es muy eficiente, ya que se hace en tiempo constante. O(1)

### Union de conjuntos

![union](attachment:image.png)

A union B = {x | x pertenece a A o x pertenece a B}

* Muestra todos los valores de los conjuntos (sin repetidos)

Se utiliza el operador `|` o la función `union`.

```python

set_a = {0, 1, 2, 3}
set_b = {5, 4, 3, 2}
set_union = set_a | set_b
print(set_union) # {0, 1, 2, 3, 4, 5}

set_union = set_a.union(set_b)
print(set_union) # {0, 1, 2, 3, 4, 5}

```

### Intersección de conjuntos

A intersección B = {x | x pertenece a A y x pertenece a B}

* Muestra los que tengan iguales en ambos conjuntos

![Intersección](attachment:image.png)

Se utiliza el operador `&` o la función `intersection`.

```python

set_a = {0, 1, 2, 3}
set_b = {4, 3, 2, 5}
set_intersection = set_a & set_b
# set_intersection = set_a.intersection(set_b)
print(set_intersection) # {2, 3}

```

### Diferencia de conjuntos

A diferencia B = {x | x pertenece a A y x no pertenece a B}

* Solo muestra los valores que estan en A únicamente

![Diferencia](attachment:image-2.png)

Se utiliza el operador `-` o la función `difference`.

```python

set_a = {0, 1, 2, 3}
set_b = {2, 3, 4, 5}
set_difference_a_b = set_a - set_b
set_difference_b_a = set_b - set_a
# set_difference_a_b = set_a.difference(set_b)
# set_difference_b_a = set_b.difference(set_a)
print(set_difference_a_b) # {0, 1}
print(set_difference_b_a) # {4, 5}

```

### Diferencia simétrica de conjuntos

A diferencia simétrica B = {x | x pertenece a A o x pertenece a B, pero no en ambos}

* Muestra los valores que no estan en ambos conjuntos

![Diferencia simétrica](attachment:image-3.png)

Se utiliza el operador `^` o la función `symmetric_difference`.

```python

set_a = {0, 1, 2, 3}
set_b = {2, 3, 4, 5}
set_sym_difference = set_a ^ set_b
# set_sym_difference = set_a.symmetric_difference(set_b)
print(set_sym_difference) # {0, 1, 4, 5}

```

### Comparar conjuntos

Existen tres tipos de "conjuntos":

* `Subconjunto`: A es subconjunto de B si todos los elementos de A están en B. (Incluye el caso en que A sea igual a B)
    * `Subconjunto propio`: A es un subconjunto propio de B si todos los elementos de A están en B y A no es igual a B.

* `Superconjunto`: A es superconjunto de B si todos los elementos de B están en A.
    * `Superconjunto propio`: A es un superconjunto propio de B si todos los elementos de B están en A y A no es igual a B.
    
**La diferencia entre subconjunto y superconjunto es solo la perspectiva**

Se utilizan los operadores `<=` y `>=` para subconjunto y superconjunto respectivamente.

```python

artistas_lollapalooza = {"Mac Demarco", "The Killers", "Shakira", "Camila Cabello"}
artistas_favoritos = {"Mac Demarco", "Shakira"}


print("artistas_lollapalooza vs. artistas_favoritos:")
print(f"- superset: {artistas_lollapalooza >= artistas_favoritos}")
print(f"- subset: {artistas_lollapalooza <= artistas_favoritos}")
print(f"- iguales: {artistas_lollapalooza == artistas_favoritos}")

print("-" * 45)

print("artistas_favoritos vs. artistas_lollapalooza:")
print(f"- superset: {artistas_favoritos >= artistas_lollapalooza}")
print(f"- subset: {artistas_favoritos <= artistas_lollapalooza}")
print(f"- iguales: {artistas_favoritos == artistas_lollapalooza}")


print("artistas_lollapalooza es a artistas_favoritos:")
print("Superset: {}".format(artistas_lollapalooza.issuperset(artistas_favoritos)))
print("Subset: {}".format(artistas_lollapalooza.issubset(artistas_favoritos)))

print("-" * 45)

print("artistas_favoritos es a artistas_lollapalooza:")
print("Superset: {}".format(artistas_favoritos.issuperset(artistas_lollapalooza)))
print("Subset: {}".format(artistas_favoritos.issubset(artistas_lollapalooza)))

'''
artistas_lollapalooza es a artistas_favoritos:
Superset: True
Subset: False
---------------------------------------------
artistas_favoritos es a artistas_lollapalooza:
Superset: False
Subset: True
artistas_lollapalooza vs. artistas_favoritos:
- superset: True
- subset: False
- iguales: False
---------------------------------------------
artistas_favoritos vs. artistas_lollapalooza:
- superset: False
- subset: True
- iguales: False
'''
```

### Eliminar duplicados y convertir a lista


Podemos eliminar los duplicados transformando una lista a set.

```python

lista_artistas = ["Olivia Newton-John", "Daddy Yankee", "Sting", 
                  "Dream Theater", "Mon Laferte", "Sting"]
set_artistas = set(lista_artistas)

# Transformamos el set a lista
lista_artistas = list(set_artistas)
print(lista_artistas) # ['Sting', 'Mon Laferte', 'Olivia Newton-John', 'Daddy Yankee', 'Dream Theater']

```

## Args y Kwargs

Los ``args`` y ``kwargs`` son argumentos que se pueden pasar a una función.
Los ``args`` son argumentos posicionales, y los ``kwargs`` son argumentos de palabra clave.
``args`` es una tupla de argumentos posicionales, y ``kwargs`` es un diccionario de argumentos de palabra clave.

Importante destacar:
### Argumentos vs parámetros

- **Argumentos**: Son los valores que se pasan a la función cuando se llama.
- **Parámetros**: Son los nombres que se utilizan en la definición de la función.

Dado esto, los argumentos y argumentos por palabra clave.

### Argumentos y argumentos por palabra clave

Los argumentos se pueden espicificar al momento de llamar a una función, la forma más simple es pasar los argumentos en el orden en que se definen en la función.

Sin embargo los argumentos tambien pueden ser difinidos por su nombre como una llave en un diccionario.

```python
def ejemplo(a, b, c):
    print(f'a: {a}, b: {b}, c: {c}')
# Orden
ejemplo('hola', 'mundo', 42)
# Por nombre
ejemplo(b='mundo', c=42, a='hola')

```

Dado esto, la documentación de python cataloga los argumentos de la siguiente forma:
    * Argumento posicional: Es un argumento que no es un argumento de palabra clave. (Argumento a secas) sigue el orden de establecimiento
    * Argumento de palabra clave: Es un argumento que es un argumento de palabra clave. (Argumento con nombre) no sigue el orden de establecimiento (`name=value`) en el llamado de la función.

Python impone unas reglas para evitar ambiguedades:
    * Todos los argumentos posicionales deben ir antes de los argumentos de palabra clave.
    * No se pueden pasar dos valores para un mismo argumento.
    (No se puede pasar por argumento de palabra clave un argumento ya establecido posicionalmente)

Casos que si funcionan:

```python
ejemplo('hola', 'mundo', 42)
ejemplo('hola', 'mundo', c=42)
ejemplo('hola', b='mundo', c=42)
ejemplo('hola', c=42, b='mundo')
ejemplo(a='hola', b='mundo', c=42)
ejemplo(c=42, a='hola', b='mundo')
```
Invalidos:

```python
ejemplo(a='hola', 'mundo', 42)  # Posicional después de palabra clave
ejemplo('hola', 'mundo', a=42)  # Palabra clave vuelve a usar parámetro usado por argumento posicional
```

Ahora exiten dos formmas de establecer argumentos en la llamada de una función que no siguen con las reglas anteriores, en base a los operadores `*` y `**`.

*`func(*args)`: Permite pasar una lista de argumentos posicionales.. (En realidad puede ser cualquier objeto **iterable**, como tuplas, etc.)

*`func(**kwargs)`: Permite pasar un diccionario de argumentos de palabra clave. (Permite desempaquetar los pares llave-valor de un diccionario y establecer argumentos por palabra clave en la llamada)

Por ejemplo:

```python
lista = ['hola', 'mundo', 42]
tupla = ('hola', 'mundo', 42)
diccionario = {'a': 'hola', 'b': 'mundo', 'c': 42}

ejemplo(*lista)
ejemplo(*tupla)
ejemplo(**diccionario)

'''
a: hola, b: mundo, c: 42
a: hola, b: mundo, c: 42
a: hola, b: mundo, c: 42
'''
```
También permite el uso simultáneo de argumentos posicionales y de palabra clave.
Mientras se respenten las reglas de los argumentos posicionales y de palabra clave.

```python

ejemplo('hola', *['mundo', 42])
ejemplo(*['hola', 'mundo'], 42)
ejemplo(*['hola', 'mundo'], *[42])
ejemplo(*['hola', 'mundo'], c=42)
ejemplo('hola', 'mundo', **{'c': 42})
ejemplo(*['hola', 'mundo'], **{'c': 42})
ejemplo(*['hola'], **{'c': 42}, b='mundo')
ejemplo(*['hola'], **{'c': 42}, **{'b': 'mundo'})

'''
a: hola, b: mundo, c: 42
a: hola, b: mundo, c: 42
a: hola, b: mundo, c: 42
a: hola, b: mundo, c: 42
a: hola, b: mundo, c: 42
a: hola, b: mundo, c: 42
a: hola, b: mundo, c: 42
a: hola, b: mundo, c: 42
'''
```

## Cantidad variable de parámetros

En Python, se pueden definir funciones que acepten una cantidad variable de argumentos. Esto se logra con los argumentos `*args` y `**kwargs`.

La forma más simple para recibir una cantidad de argumentos variable es mediante valores por defecto de parámetros que toman cierto valor si no son declarados.

```python
def ejemplo(a, b="mundo", c=42):
    print(f'a: {a}, b: {b}, c: {c}')
'''
b y c tienen valores por defecto por si no se pasan
'''

ejemplo("hola", "Juan", 5)
ejemplo("hola", "Juan")
ejemplo("hola")
# Solo recibe en a
lista = ["chao"]
ejemplo(*lista)
# Solo recibe en a y b
lista.append("tú")
ejemplo(*lista)
# Recibe para todos
lista.append(100)
ejemplo(*lista)
# Solo recibe para a y c
ejemplo(**{'c': 21, 'a': 'ho'})

'''
a: hola, b: Juan, c: 5
a: hola, b: Juan, c: 42
a: hola, b: mundo, c: 42
a: chao, b: mundo, c: 42
a: chao, b: tú, c: 42
a: chao, b: tú, c: 100
a: ho, b: mundo, c: 21
'''
```

La unica restriccion que tiene declarar variables por defectos es que no puedes declarar argumentos por defecto y luego argumentos sin defecto.

Sin embargo, lo anterior sigue estando restringido a la cantidad de argumentos definidos en la función, pero sabemos que existen funciones que reciben argumentos variables.
Como ``print()`` que puede recibir cualquier cantidad de argumentos.

Resulta que se pueden definir funciones con argumentos variables, en base al uso de los operadores `*` y `**`.

* `*args`: Permite pasar una cantidad variable de argumentos posicionales. Al llamarse la función estos argumentos son contenidos en una tupla acessible por `args`.

* `**kwargs`: Permite pasar una cantidad variable de argumentos de palabra clave. Al llamarse a la funcion se reciben esos argumentos y son contenidos en un diccionario accesible por `kwargs`.

```python
def func1(*args):
    print(f'func1: {args}')


def func2(**kwargs):
    print(f'func2: {kwargs}')


func1(1)
func1(1, 2, 3, 4)
func1()
print('-' * 45)
func2(nombre='Pedro')
func2(nombre='Pedro', apellido="Rojas")
func2()

'''
func1: (1,)
func1: (1, 2, 3, 4)
func1: ()
---------------------------------------------
func2: {'nombre': 'Pedro'}
func2: {'nombre': 'Pedro', 'apellido': 'Rojas'}
func2: {}
'''
```

Cabe destacar que cada funcion recibe distitnos tipos de argumentos posicionales o por palabra clave, es decir si llamamos a la funcion uno con argumentos por palabra clave, se lanzara un error.

Lo mismo ocurrira si llamamos a la funcion 2 con argumentos posicionales.

Sin embargo, es posible usarlas en simultaneo, además definir parámetros minimos y por defecto:

```python
def func3(a, b=3, *args, **kwargs):
    print(f'a: {a}, b: {b}, args: {args}, kwargs: {kwargs})')


func3(1)
func3(1, 2)
func3(1, 2, 3)
func3(1, 2, 3, 4)
func3(1, 2, 3, 4, c=5, d=6)
func3(1, b=2, c=3, d=4)
func3(a=1, b=2, c=3, d=4)

'''
a: 1, b: 3, args: (), kwargs: {})
a: 1, b: 2, args: (), kwargs: {})
a: 1, b: 2, args: (3,), kwargs: {})
a: 1, b: 2, args: (3, 4), kwargs: {})
a: 1, b: 2, args: (3, 4), kwargs: {'c': 5, 'd': 6})
a: 1, b: 2, args: (), kwargs: {'c': 3, 'd': 4})
a: 1, b: 2, args: (), kwargs: {'c': 3, 'd': 4})
'''
```

Es importante notar que a y b  se llevan las dos primeras posiciones, si b no recibe nada utiliza su valor por defecto 3, luego *args se lleva los valores en una tupla que no correspondan a a y b, luego **kwars se lleva en un diccionario los valores llave-valor que no correspondan a los anteriores

Cabe destacar que estos son comportamientos propios de *  y de **, no especificamente de las variables args y kwargs, estos son definiciones formales pero podrian tener cualquier otro nombre.

Luego, solo puede haber una declarcion de *args y **kwargs en una funcion, y deben ir al final de los argumentos.

Sin embargo si es valirdo utilizar valores de tipo llave-valor entre * y **, poscionales si que nooo.

Finalemente podemos generalizar, se la funcion_general:

```python
def funcion_general(arg1, arg2, *args, kwarg1, kwarg2, **kwargs):
    pass
```
Entonces arg1, arg2 son argumentos posicionales.
*args es una tupla con argumentos posicionales adicionales.
kwarg1, kwarg2 son argumentos de palabra clave.
**kwargs es un diccionario con argumentos de palabra clave adicionales.

Finalmente alza la pregunta, es posible especificar en declaracion que un argumento solo puede declararse por posicion? Hasta python 3.7 no es posible, de 3.8 en adelante si es posible.

