# Diccionarios

+ Un `dict` (diccionario) es una estructura de datos **mutable** que almacena parejas llave - valor.

+ Se accede a éstos por llave, no por posición

+ No permite llaves duplicadas

+ Mantiene orden de inserción

### ¿Cómo creamos diccionario?

+ Primera opción con {.} y llave:valor

In [None]:
persona = {
    "nombre": "Ana",
    "edad": 30,
    "ciudad": "CDMX"
}
persona

+ Segunda opción con la función `dict(.)`

In [None]:
persona = dict(nombre = "Ana", edad = 30, ciudad = "CDMX")
persona

In [None]:
persona2 = dict(nombre = "Eduardo", edad = 99, ciudad = "GDL")
persona2

In [None]:
persona.items()

In [None]:
persona.keys()

In [None]:
persona.values()

In [None]:
list(persona.keys())

In [None]:
list(persona.values())

In [None]:
list(persona)

In [None]:
sorted(persona)

In [None]:
dic_mixto = {
    "numero": 10,
    "lista": [1, 2, 3],
    "diccion": {"a": 1},
    "funcion": lambda x: x**2
}

dic_mixto

In [None]:
pares = [("a", 1), ("b", 2)]
mi_diccionario = dict(pares)
mi_diccionario

In [None]:
persona

In [None]:
persona["nombre"]

In [None]:
mi_diccionario['b']

In [None]:
#persona["altura"]

In [None]:
persona.get("altura")

In [None]:
persona.get("altura", "no encontrada")

In [None]:
persona["edad"] = 31
persona["profesion"] = "Actuaria"
persona

In [None]:
persona.update({"edad": 32, "ciudad": "Guadalajara"})

In [None]:
persona

In [None]:
del persona["ciudad"]

In [None]:
persona

In [None]:
persona.pop("edad")

In [None]:
persona

In [None]:
persona.popitem()

In [None]:
persona

In [None]:
estudiante = {
    "nombre": "Luis",
    "calificaciones": {
        "mate": 9,
        "estadistica": 10
    },
    "semestre": 6,
    "aprobado": True
}
estudiante

In [None]:
estudiante["calificaciones"]

In [None]:
estudiante["calificaciones"]["mate"]

In [None]:
"semestre" in estudiante

In [None]:
len(estudiante)

# Conjuntos

+ Un `set` (conjunto) es la implementación directa del concepto matemático de conjunto.

+ Un `set` (conjunto) es una colección no ordenada de elementos únicos.

+ No mantiene orden

+ No permite duplicados

+ Mutable

+ Operaciones de pertenencia (rápidas)

+ Operaciones algebraicas de conjuntos (eficientes)

### ¿Cómo creamos un conjunto?

+ Primera opción con {.}

In [None]:
cjto = {1, 2, 3, 4}
cjto

+ Segunda opción con la función `set(.)`

In [None]:
otro_cjto = set([1, 2, 2, 3])
otro_cjto

In [None]:
set("hola")

In [None]:
mi_cjto = {1, True}
mi_cjto

In [None]:
mi_cjto = {1, "a", (2, 3), True}
mi_cjto

In [None]:
#mi_cjto = {1, "a", (2, 3), True, [95, 43]}
#mi_cjto

In [None]:
#mi_cjto = {1, "a", (2, 3), True, {"a": 1}}
#mi_cjto

In [None]:
#mi_cjto = {1, "a", (2, 3), True, set([1, 2])}
#mi_cjto

In [None]:
mi_cjto = {1, "a", (2, 3), True, lambda x: x**2}
mi_cjto

In [None]:
3 in cjto

In [None]:
A = {1, 2, 3}
B = {3, 4, 5}

In [None]:
A | B

In [None]:
A.union(B)

In [None]:
A & B

In [None]:
A.intersection(B)

In [None]:
A - B

In [None]:
B - A

In [None]:
# Diferencia simétrica
A ^ B

In [None]:
A.issubset(B)

In [None]:
A.issuperset(B)

In [None]:
A.isdisjoint(B)

In [None]:
cjto = {1, 2, 3, 4}

In [None]:
len(cjto)

In [None]:
#cjto[0]

In [None]:
cjto.add(5)

In [None]:
cjto

In [None]:
cjto.update([6, 7])

In [None]:
cjto

In [None]:
cjto.remove(3)

In [None]:
cjto

In [None]:
#cjto.remove(10)

In [None]:
cjto.discard(10)

In [None]:
cjto

In [None]:
# Elimina un elemento aleatoriamente
cjto.pop()

In [None]:
cjto

In [None]:
cjto.clear()

In [None]:
cjto

# Usos típicos

In [None]:
# Eliminar duplicados
lista = [1, 2, 2, 3]
set(lista)

In [None]:
# Comparar colecciones
usuarios_activos = {1, 2, 3}
usuarios_bloqueados = {2, 3, 4}
usuarios_activos - usuarios_bloqueados

# Dataframes (de pandas)

+ Un `DataFrame` (de pandas) es una estructura de datos tabular (filas x columnas)

+ tabla SQL

+ data.frame de R

+ Sheet de Excel/Google Sheets

+ Conceptualmente un diccionario de columnas.

+ Cada columna tiene un nombre y un tipo de datos, y cada fila tiene un índice.

+ Bidimensional (filas y columnas)

+ Columnas etiquetadas

+ Indexación flexible

In [None]:
import pandas as pd
# Hablar sobre la convención estándar pd

In [None]:
mi_df = pd.DataFrame({
    "nombre": ["Ana", "Luis", "María"],
    "edad": [30, 25, 40],
    "ciudad": ["CDMX", "MTY", "GDL"]
})
mi_df

In [None]:
mi_df = pd.DataFrame([
    {"nombre": "Ana", "edad": 30},
    {"nombre": "Luis", "edad": 25}
])
mi_df

In [None]:
mi_df = pd.DataFrame(
    [[1, 2], [3, 4]],
    columns=["A", "B"]
)
mi_df

In [None]:
#pd.read_csv("archivo.csv")
#pd.read_excel("archivo.xlsx")
#pd.read_parquet("archivo.parquet")

In [None]:
mi_df = pd.DataFrame({
    "nombre": [
    "Ana", "Luis", "María", "Carlos", "Sofía",
    "Jorge", "Lucía", "Miguel", "Paula", "Andrés",
    "Elena", "Raúl", "Valeria", "Diego", "Carmen"
],
    "edad": [
    18, 22, 25, 29, 31,
    34, 37, 40, 43, 45,
    48, 50, 53, 56, 60
],
    "ciudad": [
    "CDMX", "NL", "JAL", "QRO", "PUE",
    "JAL", "SON", "CHIH", "YUC", "OAX",
    "GTO", "SLP", "CDMX", "VER", "AGS"
]
})
mi_df

In [None]:
mi_df.shape
# (filas, columnas)

In [None]:
# Nombres de columnas
mi_df.columns

**OJO:** `object` no es un tipo real, suele significar "mezcla o string".

In [None]:
# Índices de las filas
mi_df.index

In [None]:
# tipo de cada columna
mi_df.dtypes

In [None]:
mi_df.head()

In [None]:
mi_df.tail()

In [None]:
mi_df.info()

In [None]:
mi_df.describe()

In [None]:
mi_df.describe(include = "object")

In [None]:
mi_df.describe(include = "all")

In [None]:
mi_df["edad"]

In [None]:
mi_df.edad

In [None]:
mi_df.loc[0]

In [None]:
mi_df.loc[0, "edad"]

In [None]:
mi_df.iloc[0, 1]

In [None]:
mi_df[["nombre", "edad"]]

In [None]:
mi_df["edad_doble"] = mi_df["edad"] * 2

In [None]:
mi_df

In [None]:
mi_df[mi_df["edad"] > 30]

In [None]:
mi_df[(mi_df["edad"] > 25) & (mi_df["ciudad"] == "CDMX")]

In [None]:
mi_df["mayor_edad"] = mi_df["edad"] >= 18

In [None]:
mi_df

In [None]:
mi_df.loc[mi_df["nombre"] == "Ana", "edad"] = 31

In [None]:
mi_df