# 4.2 Más Estructuras de Datos

Ya aprendimos nuestras primeras dos estructuras de Datos en Python: listas y tuplas. La principal diferencia es que las primeras sí se pueden modificar.

A continuación, veremos otras estructuras que sí se pueden modificar. ¿La primer diferencia? Éstas no necesariamente están ordenadas.

## Sets

Si te fijas bien, una lista puede tener valores repetidos.

In [1]:
mi_lista = [23, 15, 76, 23, 10, 23]
mi_lista

[23, 15, 76, 23, 10, 23]

No obstante, si usamos llaves (`{}`), estaremos creando una nueva estructura, diferente de tuplas y listas, llamada __Sets__. Es el equivalente al conjunto de las Matemáticas.

Éstas, sólo aceptan valores únicos.

In [None]:
mi_set = {8, 15, 12, 25}
mi_set

De hecho, si meto valores repetidos al crear un Set, Python eliminará los duplicados y se quedará con uno de cada uno.

In [4]:
mi_set2 = {23, 15, 76, 23, 10, 23}
mi_set2

{10, 15, 23, 76}

Por cierto, ¿te das cuenta de que Python reordena los elementos dentro de un set? Esto porque los sets _no son ordenados_. Entonces, no puedo utilizar un índice para extraer algún elemento, como sí lo hacía con listas y tuplas.

In [5]:
mi_set2[0]

TypeError: ignored

Sin embargo, los sets son muy útiles cuando tengo que estar trabajando con valores únicos...

### Operaciones con sets.

Supongamos que tengo un par de listas, que incluyen a los alumnos que están tomando dos materias distintas...

In [8]:
calculo = ["Natalia", "Gerardo", "Carolina", "Ana", "Luis", "Mauricio", "Francisco", "Natalia"]
algebra = ["Rebeca", "Gerardo", "Sofia", "Paulina", "Pablo", "Sofia", "Luis", "Jose"]

Por error, ¡escribí algunos alumnos dos veces dentro de cada materia!
No se preocupen; si las convierto a sets, puedo eliminar los duplicados dentro de cada arreglo...

In [13]:
calculo_set = set(calculo)
calculo_set

{'Ana', 'Carolina', 'Francisco', 'Gerardo', 'Luis', 'Mauricio', 'Natalia'}

In [14]:
algebra_set = set(algebra)
algebra_set

{'Gerardo', 'Jose', 'Luis', 'Pablo', 'Paulina', 'Rebeca', 'Sofia'}

Ahora, digamos que quiero tener a tooodoos los alumnos, independientemente de la materia que están tomando.

Al igual que en matemáticas, esta sería una **unión de conjuntos**, y se realiza así:

In [17]:
calculo_set | algebra_set

{'Ana',
 'Carolina',
 'Francisco',
 'Gerardo',
 'Jose',
 'Luis',
 'Mauricio',
 'Natalia',
 'Pablo',
 'Paulina',
 'Rebeca',
 'Sofia'}

Como estoy trabajando con sets, los alumnos que toman ambas materias sólo aparecen una vez al realizar la unión.

Ahora, ¿qué alumnos están tomando ambas materias?

Esa sería una **intersección de conjuntos** y se realiza así:

In [18]:
calculo_set & algebra_set

{'Gerardo', 'Luis'}

Ahora, ¿qué alumnos sólo toman cálculo, pero no álgebra?

Es decir, la **diferencia de conjuntos**.

In [19]:
calculo_set - algebra_set

{'Ana', 'Carolina', 'Francisco', 'Mauricio', 'Natalia'}

Y viceversa...

In [20]:
algebra_set - calculo_set

{'Jose', 'Pablo', 'Paulina', 'Rebeca', 'Sofia'}

Por último, ¿qué alumnos sólo toman una materia?

Es decir, la **diferencia simétrica de los conjuntos**.

In [21]:
calculo_set ^ algebra_set

{'Ana',
 'Carolina',
 'Francisco',
 'Jose',
 'Mauricio',
 'Natalia',
 'Pablo',
 'Paulina',
 'Rebeca',
 'Sofia'}

Una vez ocupadas las propiedades de sets, podemos regresar a trabajar con listas y/o tuplas, según nos convenga.

In [22]:
nuevo_set = algebra_set - calculo_set
nuevo_set

{'Jose', 'Pablo', 'Paulina', 'Rebeca', 'Sofia'}

In [23]:
nueva_lista = list(nuevo_set)
nueva_lista

['Sofia', 'Pablo', 'Jose', 'Paulina', 'Rebeca']

In [24]:
nueva_lista[2:len(nueva_lista)]

['Jose', 'Paulina', 'Rebeca']

In [26]:
nueva_tupla = tuple(nueva_lista[1:-2])
nueva_tupla

('Pablo', 'Jose')

Etc. etc.

Por cierto; este tema en Matemáticas se conoce como Teoría de Conjuntos....y lo repasaras bastante en tus clases de Probabilidad.

## Diccionarios
La última estructura de datos básica de Python se llaman **Diccionarios**.

Son muy útiles cuando necesitamos guardar valores emparejados. Por ejemplo, en la vida real, cuando estamos describiendo algo, frecuentemente usamos el formato *característica-valor:*

* Ojos: Negros
* Piel: Canela

En este ejemplo, a las características que usamos pare describir les llamaremos **llaves** o claves (keys), y a los valores que pueden tomar esa característica...les llamaremos así, **valores** (values).

Para definir un diccionario en Python, usaremos las llaves `{}`. Cada entrada tendrá el formato `llave: valor`, y estarán separadas por comas.

In [None]:
mi_diccionario = {"País": "Emirato Islámico de Afganistán",
                 "Capital": "Kabul",
                 "Poblacion": 35688822, "Costa":False}

mi_diccionario

{'País': 'Emirato Islámico de Afganistán',
 'Capital': 'Kabul',
 'Poblacion': 35688822,
 'Costa': False}

### Recuperando valores de un Diccionario
A diferencia de las tuplas y las listas, acá los elementos no vienen ordenados. Internamente, la computadora guardará mis datos de la forma que considere más óptima, y no es fácil de indentificarlo.

Para poder acceder a los valores, se ocupan también los corchetes desués del nombre, pero escribiendo la llave en vez de algún índice:

In [None]:
mi_diccionario["Poblacion"]

35688822

(Nota: ¡Python distingue entre mayúsculas y minúsculas!)

In [None]:
mi_diccionario["poblacion"]

KeyError: 'poblacion'

Si no recuerdo cómo se llamaban mis llaves, puedo recuperar esa información con un `.keys()` después del nombre de mi diccionario (Es un _método_).

In [None]:
mi_diccionario.keys()

dict_keys(['País', 'Capital', 'Poblacion', 'Costa'])

### Modificando un diccionario

Agregar información nueva es muy sencilla. Sólo tengo que seguir este formato:

` diccionario["nueva llave"] = "nuevo valor" `

In [None]:
mi_diccionario["Moneda"] = "afgani"
mi_diccionario

{'País': 'Emirato Islámico de Afganistán',
 'Capital': 'Kabul',
 'Poblacion': 35688822,
 'Costa': False,
 'Moneda': 'afgani'}

Y si quiero sobreescribir algún valor, hago lo mismo, pero con alguna llave ya existente.

In [None]:
mi_diccionario["Poblacion"] = 35687123
mi_diccionario

{'País': 'Emirato Islámico de Afganistán',
 'Capital': 'Kabul',
 'Poblacion': 35687123,
 'Costa': False,
 'Moneda': 'afgani'}

Finalmente, para eliminar algún valor, ocupo el método `.pop(llave)`

In [None]:
mi_diccionario.pop("Capital")
mi_diccionario

{'País': 'Emirato Islámico de Afganistán',
 'Poblacion': 35687123,
 'Costa': False,
 'Moneda': 'afgani'}

## Estructuras complejas

Tanto las llaves, como los valores, pueden ser de cualquier tipo de dato. Tradicionalmente, las llaves sólo son _strings_, mientras que los valores, números, strings, e incluso, otra estructura de datos.

In [None]:
union_europea = {"Miembros": ["Alemania", "Francia", "España", "Grecia", "Italia", "Polonia"],
                 "Moneda": "Euro",
                 "Fundacion": 1993,
                 "Idiomas": {"Francés": ["Francia", "Bélgica"], 
                             "Alemán": ["Alemania", "Austria"]} }

union_europea

{'Miembros': ['Alemania', 'Francia', 'España', 'Grecia', 'Italia', 'Polonia'],
 'Moneda': 'Euro',
 'Fundacion': 1993,
 'Idiomas': {'Francés': ['Francia', 'Bélgica'],
  'Alemán': ['Alemania', 'Austria']}}

Nota: (Esto aplica también para las otras estructuras ya vistas, donde podemos tener listas de listas, tuplas de diccionarios, etc.)

In [None]:
lista_de_diccionarios = [mi_diccionario, union_europea]

lista_de_diccionarios

[{'País': 'Emirato Islámico de Afganistán',
  'Capital': 'Kabul',
  'Poblacion': 35688822,
  'Costa': False},
 {'Miembros': ['Alemania', 'Francia', 'España', 'Grecia', 'Italia', 'Polonia'],
  'Moneda': 'Euro',
  'Fundacion': 1993,
  'Idiomas': {'Francés': ['Francia', 'Bélgica'],
   'Alemán': ['Alemania', 'Austria']}}]

Y para recuperar información, sólo falta ir subseleccionando uno por uno, tratando por separado cada estructura:

In [None]:
lista_de_diccionarios[1]

{'Miembros': ['Alemania', 'Francia', 'España', 'Grecia', 'Italia', 'Polonia'],
 'Moneda': 'Euro',
 'Fundacion': 1993,
 'Idiomas': {'Francés': ['Francia', 'Bélgica'],
  'Alemán': ['Alemania', 'Austria']}}

In [None]:
lista_de_diccionarios[1]["Idiomas"]

{'Francés': ['Francia', 'Bélgica'], 'Alemán': ['Alemania', 'Austria']}

In [None]:
lista_de_diccionarios[1]["Idiomas"]["Alemán"]

['Alemania', 'Austria']

In [None]:
lista_de_diccionarios[1]["Idiomas"]["Alemán"][0]

'Alemania'

Estas estructuras, y sobretodo los diccionarios, son bastante importantes, puesto que el formato casi universal entre distintos lenguajes de programación. No por ello, varias formas de compartir datos vienen en formatos parecidos: las *API*, los formatos *.json*, las bases de datos NoSQL, etc.

Tip: en Notebook, si se te olvidó abrir y cerrar paréntesis, sólo tienes que seleccionar el texto y, ya que lo tienes seleccionado, dar clic en la tecla que abre paréntesis. En automático, el texto seleccionado, ¡estará rodeado de paréntesis! Funciona también con comillas, corchetes y llaves.

In [None]:
"hoodie", "suéter", "chamarra", abrigo

NameError: name 'abrigo' is not defined