# Listas en Python

+ Una `list` (lista) de Python es una estructura de datos **mutable** y **ordenada** que permite almacenar una colección de elementos.
+ Es uno de los tipos más usados en Python para manejar datos en memoria.

+ Es **ordenada** pues los elementos tienen una posición (índice).

+ Es **mutable** pues se puede modificar después de crearse.

+ Además, es **heterogénea** puede contener distintos tipos de objetos.

+ IMPORTANTE: Indexada desde 0. No como en R, que se indexa desde 1.



## Construcción de listas

+ Mediante corchetes

In [None]:
## Construcción de listas

numeros = [1, 2, 3, 4]
nombres = ["Ana", "Luis", "María"]
mixta = [1, "texto", 3.5, True]


+ Usando la función `list()`

In [None]:
lista_vacia = list()
lista_desde_iterable = list("hola")

In [None]:
lista_desde_iterable

['h', 'o', 'l', 'a']

In [None]:
lista = [
    42,                    # int
    3.14,                  # float
    "texto",               # str
    True,                  # bool
    [1, 2, 3],             # otra list
    {"a": 1, "b": 2},      # dict
    lambda x: x**2         # función
]

In [None]:
lista

## Modificación/acceso a listas existentes

In [None]:
lista = [10, 20, 30, 40]

In [None]:
lista[0]

In [None]:
lista[2]

In [None]:
lista[-1]

In [None]:
lista[1:3]

In [None]:
lista[:2]

In [None]:
lista[::2]

In [None]:
lista[1] = 99

In [None]:
lista

[10, 20, 30, 40]

In [None]:
# Agrega un valor que le doy al final de la lista
lista.append(4)

In [None]:
lista

[10, 20, 30, 40, 4]

In [None]:
# inserta en posición específica
lista.insert(1, 88)

In [None]:
lista

[10, 88, 20, 30, 40, 4]

In [None]:
# agrega varios elementos a la vez
lista.extend([5, 6])

In [None]:
lista

[10, 20, 30, 40, 5, 6]

In [None]:
# Eliminar una entrada con un valor específico
lista.remove(99)

In [None]:
# Eliminar la última entrada
lista.pop()

In [None]:
# Eliminar entrada por índice
lista.pop(0)

In [None]:
# Elimina entrada por índice
del lista[1]

In [None]:
len(lista)

In [None]:
# Concatenar
[1, 2] + [3, 4]    # [1, 2, 3, 4]


In [None]:
# Concatenar
[0] * 5

[0, 0, 0, 0, 0]

In [None]:
# Concatenar
[0, 8] * 5

[0, 8, 0, 8, 0, 8, 0, 8, 0, 8]

In [None]:
# Verificar si un valor pertenece a una lista existente
3 in [1, 2, 3]

True

In [None]:
frutas = ['orange', 'apple', 'pear', 'banana', 'kiwi', 'apple', 'banana', 'apple', 'grape', 'apple', 'apple']
frutas

['orange',
 'apple',
 'pear',
 'banana',
 'kiwi',
 'apple',
 'banana',
 'apple',
 'grape',
 'apple',
 'apple']

In [None]:
frutas.count('apple')

5

In [None]:
frutas.count('berry')

0

In [None]:
# La primera vez que aparece un elemento
frutas.index('banana')

3

In [None]:
# La primera vez que aparece un elemento después de una posición dada
# La primera vez que aparace el elemento 'banana' pero después del índice 4
frutas.index('banana', 4)

6

In [None]:
frutas.reverse()

In [None]:
frutas

['apple',
 'apple',
 'grape',
 'apple',
 'banana',
 'apple',
 'kiwi',
 'banana',
 'pear',
 'apple',
 'orange']

In [None]:
frutas.sort()

In [None]:
frutas

['apple',
 'apple',
 'apple',
 'apple',
 'apple',
 'banana',
 'banana',
 'grape',
 'kiwi',
 'orange',
 'pear']

# Tuplas

+ Una `tuple` (tupla) es una estructura de datos ordenada e inmutable que almacena una colección de elementos.
+ Ordenada (tiene índices)
+ Inmutable (no se puede modificar después de creada)
+ Heterogénea

In [None]:
mi_tupla = (1, 2, 3)
mi_tupla

(1, 2, 3)

In [None]:
tuplilla = (
    42,
    3.14,
    "texto",
    True,
    [1, 2],
    {"a": 1},
    lambda x: x**2
)
tuplilla

(42, 3.14, 'texto', True, [1, 2], {'a': 1}, <function __main__.<lambda>(x)>)

In [None]:
otra_tupla = 1, 2, 3, 7
otra_tupla

(1, 2, 3, 7)

In [None]:
tupla_bebe = (5,)
tupla_bebe

(5,)

In [None]:
no_es_tupla = (5)
no_es_tupla

5

In [None]:
mi_tupla = tuple([1, 2, 3])
mi_tupla

(1, 2, 3)

In [None]:
mi_tupla = tuple("hola")
mi_tupla

('h', 'o', 'l', 'a')

In [None]:
mi_tupla = 12345, 54321, 'Hola mundo', 20, 30, True
mi_tupla

(12345, 54321, 'Hola mundo', 20, 30, True)

In [None]:
mi_tupla[0]

12345

In [None]:
# Para acceder al último elemento de la tupla
mi_tupla[-1]

True

In [None]:
# Para acceder desde el índice 1 (incluyéndolo) hasta el 3 (pero excluyéndolo)
mi_tupla[1:3]

(54321, 'Hola mundo')

Notese que el slicing (seleccionar varias entradas a la vez) de tuplas devuelve una tupla

+ Recuérdese que las tuplas son inmutables.

+ Intentemos mutarlas para ver qué pasa

In [None]:
mi_tupla[2]

'Hola mundo'

In [None]:
# Intentemos cambiar este valor
# mi_tupla[2] = "Adiós mundo"

TypeError: 'tuple' object does not support item assignment

In [None]:
# Intentemos agregarlo una entrada
# mi_tupla.append(4)

AttributeError: 'tuple' object has no attribute 'append'

+ Que sean inmutables no significa que no podamos hacer reasignaciones

In [None]:
mi_tupla = mi_tupla + (4, 5)
mi_tupla

(12345, 54321, 'Hola mundo', 20, 30, True, 4, 5)

In [None]:
otra_tupla = (1, [2, 3, 75, 83], 4)
otra_tupla

(1, [2, 3, 75, 83], 4)

In [None]:
otra_tupla[1]

[2, 3, 75, 83]

In [None]:
otra_tupla[1].append(99)

In [None]:
otra_tupla

(1, [2, 3, 75, 83, 99], 4)

In [None]:
nueva_tupla = (otra_tupla, mi_tupla)
nueva_tupla

((1, [2, 3, 75, 83, 99], 4), (12345, 54321, 'Hola mundo', 20, 30, True, 4, 5))

In [None]:
len(mi_tupla)

8

In [None]:
len(otra_tupla)

3

In [None]:
len(nueva_tupla)

2

In [None]:
(1, 2, "programando ando") + (False, 3, [5.6, 9], 4)

(1, 2, 'programando ando', False, 3, [5.6, 9], 4)

In [None]:
(1, 2, "programando ando") * 5

(1,
 2,
 'programando ando',
 1,
 2,
 'programando ando',
 1,
 2,
 'programando ando',
 1,
 2,
 'programando ando',
 1,
 2,
 'programando ando')

In [None]:
3 in (1, 2, 3)

True

In [None]:
False in (False, 3, [5.6, 9], 4)

True

Unpacking de tuplas

In [None]:
a, b, c, d = (1, "Python", False, [7,5,2])

In [None]:
a

1

In [None]:
b

'Python'

In [None]:
c

False

In [None]:
d

[7, 5, 2]

## ¿Cuándo usar tuplas?

+ Los datos no deben cambiar

+ Se quiere representar registros fijos (coordenadas, parámetros, IDs)

+ Como claves de diccionario

+ Se quiere expresar intención semántica de inmutabilidad ... En desarrollo de software, `tuple` comunica "esto no se toca".

# Diccionarios

+ Un `dict` (diccionario) es una estructura de datos mutable que almacena parejas llave - valor.

+ Son mutables

+ Se accede a éstos por llave, no por posición

+ No permite llaves duplicadas

+ Mantiene orden de inserción

In [None]:
persona = {
    "nombre": "Ana",
    "edad": 30,
    "ciudad": "CDMX"
}
persona

{'nombre': 'Ana', 'edad': 30, 'ciudad': 'CDMX'}

In [None]:
persona = dict(nombre = "Ana", edad = 30, ciudad = "CDMX")
persona

{'nombre': 'Ana', 'edad': 30, 'ciudad': 'CDMX'}

In [None]:
persona.items()

dict_items([('nombre', 'Ana'), ('edad', 31), ('ciudad', 'CDMX'), ('profesion', 'Actuaria')])

In [None]:
persona.keys()

dict_keys(['nombre', 'edad', 'ciudad', 'profesion'])

In [None]:
persona.values()

dict_values(['Ana', 31, 'CDMX', 'Actuaria'])

In [None]:
list(persona.keys())

['nombre', 'edad', 'ciudad', 'profesion']

In [None]:
list(persona.values())

['Ana', 31, 'CDMX', 'Actuaria']

In [None]:
list(persona)

['nombre', 'edad', 'ciudad', 'profesion']

In [None]:
sorted(persona)

['ciudad', 'edad', 'nombre', 'profesion']

In [None]:
dic_mixto = {
    "numero": 10,
    "lista": [1, 2, 3],
    "diccion": {"a": 1},
    "funcion": lambda x: x**2
}

dic_mixto

{'numero': 10,
 'lista': [1, 2, 3],
 'diccion': {'a': 1},
 'funcion': <function __main__.<lambda>(x)>}

In [None]:
pares = [("a", 1), ("b", 2)]
mi_diccionario = dict(pares)
mi_diccionario

{'a': 1, 'b': 2}

In [None]:
persona["nombre"]

'Ana'

In [None]:
mi_diccionario['b']

2

In [None]:
#persona["altura"]

KeyError: 'altura'

In [None]:
persona.get("altura")

In [None]:
persona.get("altura", "no encontrada")

'no encontrada'

In [None]:
persona["edad"] = 31
persona["profesion"] = "Actuaria"
persona

{'nombre': 'Ana', 'edad': 31, 'ciudad': 'CDMX', 'profesion': 'Actuaria'}

In [None]:
persona.update({"edad": 32, "ciudad": "Guadalajara"})

In [None]:
persona

{'nombre': 'Ana', 'edad': 32, 'ciudad': 'Guadalajara', 'profesion': 'Actuaria'}

In [None]:
del persona["ciudad"]

In [None]:
persona

{'nombre': 'Ana', 'edad': 32, 'profesion': 'Actuaria'}

In [None]:
persona.pop("edad")

32

In [None]:
persona

{'nombre': 'Ana', 'profesion': 'Actuaria'}

In [None]:
persona.popitem()

('profesion', 'Actuaria')

In [None]:
persona

{'nombre': 'Ana'}

In [None]:
persona

{'nombre': 'Ana', 'edad': 31, 'ciudad': 'CDMX', 'profesion': 'Actuaria'}

In [None]:
estudiante = {
    "nombre": "Luis",
    "calificaciones": {
        "mate": 9,
        "estadistica": 10
    },
    "semestre": 6,
    "aprobado": True
}
estudiante

{'nombre': 'Luis',
 'calificaciones': {'mate': 9, 'estadistica': 10},
 'semestre': 6,
 'aprobado': True}

In [None]:
estudiante["calificaciones"]

{'mate': 9, 'estadistica': 10}

In [None]:
estudiante["calificaciones"]["mate"]

9

In [None]:
"semestre" in estudiante

True

In [None]:
len(estudiante)

4

['Ana', 31, 'CDMX', 'Actuaria']

['ciudad', 'edad', 'nombre', 'profesion']

# Conjuntos

+ Un `set` (conjunto) es la implementación directa del concepto matemático de conjunto.

+ Un `set` (conjunto) es una colección no ordenada de elementos únicos.

+ No mantiene orden

+ No permite duplicados

+ Mutable

+ Operaciones de pertenencia (rápidas)

+ Operaciones algebraicas de conjuntos (eficientes)

In [None]:
cjto = {1, 2, 3, 4}
cjto

{1, 2, 3, 4}

In [None]:
otro_cjto = set([1, 2, 2, 3])
otro_cjto

{1, 2, 3}

In [None]:
set("hola")

{'a', 'h', 'l', 'o'}

In [None]:
mi_cjto = {1, True}
mi_cjto

{1}

In [None]:
mi_cjto = {1, "a", (2, 3), True}
mi_cjto

{(2, 3), 1, 'a'}

In [None]:
#mi_cjto = {1, "a", (2, 3), True, [95, 43]}
#mi_cjto

In [None]:
#mi_cjto = {1, "a", (2, 3), True, {"a": 1}}
#mi_cjto

In [None]:
#mi_cjto = {1, "a", (2, 3), True, set([1, 2])}
#mi_cjto

In [None]:
mi_cjto = {1, "a", (2, 3), True, lambda x: x**2}
mi_cjto

{(2, 3), 1, <function __main__.<lambda>(x)>, 'a'}

In [None]:
3 in cjto

True

In [None]:
A = {1, 2, 3}
B = {3, 4, 5}
A | B

{1, 2, 3, 4, 5}

In [None]:
A.union(B)

{1, 2, 3, 4, 5}

In [None]:
A & B

{3}

In [None]:
A.intersection(B)

{3}

In [None]:
A - B

{1, 2}

In [None]:
B - A

{4, 5}

In [None]:
# Diferencia simétrica
A ^ B

{1, 2, 4, 5}

In [None]:
A.issubset(B)

False

In [None]:
A.issuperset(B)

False

In [None]:
A.isdisjoint(B)

False

In [None]:
cjto = {1, 2, 3, 4}

In [None]:
len(cjto)

4

In [None]:
#cjto[0]

In [None]:
cjto.add(5)

In [None]:
cjto

{1, 2, 3, 4, 5}

In [None]:
cjto.update([6, 7])

In [None]:
cjto

{1, 2, 3, 4, 5, 6, 7}

In [None]:
cjto.remove(3)

In [None]:
cjto

{1, 2, 4, 5, 6, 7}

In [None]:
#cjto.remove(10)

In [None]:
cjto.discard(10)

In [None]:
cjto

{1, 2, 4, 5, 6, 7}

In [None]:
# Elimina un elemento aleatoriamente
cjto.pop()

1

In [None]:
cjto

{2, 4, 5, 6, 7}

In [None]:
cjto.clear()

In [None]:
cjto

set()

In [None]:
# Usos típicos

# Eliminar duplicados
lista = [1, 2, 2, 3]
set(lista)

{1, 2, 3}

In [None]:
# Comparar colecciones
usuarios_activos = {1, 2, 3}
usuarios_bloqueados = {2, 3, 4}
usuarios_activos - usuarios_bloqueados

{1}

# Dataframes (de pandas)

+ Un `DataFrame` (de pandas) es una estructura de datos tabular (filas x columnas)

+ tabla SQL

+ data.frame de R

+ Sheet de Excel/Google Sheets

+ Conceptualmente un diccionario de columnas.

+ Cada columna tiene un nombre y un tipo de datos, y cada fila tiene un índice.

+ Bidimensional (filas y columnas)

+ Columnas etiquetadas

+ Indexación flexible

In [None]:
import pandas as pd
# Hablar sobre la convención estándar pd

In [None]:
mi_df = pd.DataFrame({
    "nombre": ["Ana", "Luis", "María"],
    "edad": [30, 25, 40],
    "ciudad": ["CDMX", "MTY", "GDL"]
})
mi_df

Unnamed: 0,nombre,edad,ciudad
0,Ana,30,CDMX
1,Luis,25,MTY
2,María,40,GDL


In [None]:
mi_df = pd.DataFrame([
    {"nombre": "Ana", "edad": 30},
    {"nombre": "Luis", "edad": 25}
])
mi_df

Unnamed: 0,nombre,edad
0,Ana,30
1,Luis,25


In [None]:
mi_df = pd.DataFrame(
    [[1, 2], [3, 4]],
    columns=["A", "B"]
)
mi_df

Unnamed: 0,A,B
0,1,2
1,3,4


In [None]:
#pd.read_csv("datos.csv")
#pd.read_excel("archivo.xlsx")
#pd.read_parquet("datos.parquet")

In [None]:
mi_df = pd.DataFrame({
    "nombre": ["Ana", "Luis", "María"],
    "edad": [30, 25, 40],
    "ciudad": ["CDMX", "MTY", "GDL"]
})

In [None]:
mi_df.shape      # (filas, columnas)

(3, 3)

In [None]:
# Nombres de columnas
mi_df.columns


Index(['nombre', 'edad', 'ciudad'], dtype='object')

OJO: `object` no es un tipo real, suele significar "mezcla o string".

In [None]:
# Índices de las filas
mi_df.index

RangeIndex(start=0, stop=3, step=1)

In [None]:
# tipo de cada columna
mi_df.dtypes

Unnamed: 0,0
nombre,object
edad,int64
ciudad,object


In [None]:
mi_df.head()

Unnamed: 0,nombre,edad,ciudad
0,Ana,30,CDMX
1,Luis,25,MTY
2,María,40,GDL


In [None]:
mi_df.tail()

Unnamed: 0,nombre,edad,ciudad
0,Ana,30,CDMX
1,Luis,25,MTY
2,María,40,GDL


In [None]:
mi_df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   nombre  3 non-null      object
 1   edad    3 non-null      int64 
 2   ciudad  3 non-null      object
dtypes: int64(1), object(2)
memory usage: 204.0+ bytes


In [None]:
mi_df.describe()

Unnamed: 0,edad
count,3.0
mean,31.666667
std,7.637626
min,25.0
25%,27.5
50%,30.0
75%,35.0
max,40.0


In [None]:
mi_df["edad"]

Unnamed: 0,edad
0,30
1,25
2,40


In [None]:
mi_df.edad

Unnamed: 0,edad
0,30
1,25
2,40


In [None]:
mi_df.loc[0]

Unnamed: 0,0
nombre,Ana
edad,30
ciudad,CDMX


In [None]:
mi_df.loc[0, "edad"]

np.int64(30)

In [None]:
mi_df.iloc[0]

Unnamed: 0,0
nombre,Ana
edad,30
ciudad,CDMX


In [None]:
mi_df.iloc[0, 1]

np.int64(30)

In [None]:
mi_df[["nombre", "edad"]]

Unnamed: 0,nombre,edad
0,Ana,30
1,Luis,25
2,María,40


In [None]:
mi_df["edad_doble"] = mi_df["edad"] * 2

In [None]:
mi_df

Unnamed: 0,nombre,edad,ciudad,edad_doble
0,Ana,30,CDMX,60
1,Luis,25,MTY,50
2,María,40,GDL,80


In [None]:
mi_df[mi_df["edad"] > 30]

Unnamed: 0,nombre,edad,ciudad,edad_doble,mayor_edad
0,Ana,31,CDMX,60,True
2,María,40,GDL,80,True


In [None]:
mi_df[(mi_df["edad"] > 25) & (mi_df["ciudad"] == "CDMX")]

Unnamed: 0,nombre,edad,ciudad,edad_doble,mayor_edad
0,Ana,31,CDMX,60,True


In [None]:
mi_df["mayor_edad"] = mi_df["edad"] >= 18

In [None]:
mi_df

Unnamed: 0,nombre,edad,ciudad,edad_doble,mayor_edad
0,Ana,30,CDMX,60,True
1,Luis,25,MTY,50,True
2,María,40,GDL,80,True


In [None]:
mi_df.loc[mi_df["nombre"] == "Ana", "edad"] = 31

In [None]:
mi_df

Unnamed: 0,nombre,edad,ciudad,edad_doble,mayor_edad
0,Ana,31,CDMX,60,True
1,Luis,25,MTY,50,True
2,María,40,GDL,80,True
