<a href="https://colab.research.google.com/github/MiguelAngeloTr/ALMACENAMIENTO_DATOS_ESPE/blob/main/Mini_Laboratorio1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Laboratorio de Python: Listas, Tuplas, Diccionarios y Pandas

Diseñado por: Prof. Juan Manuel Núñez Velasco

Curso: ETL(Gestión y Almacenamiento de Datos)

Bienvenid@s estudiantes a este mini-laboratorio en formato cuaderno. Aquí encontrarás:
- Explicaciones **breves y claras**.
- Un **ejemplo** ejecutable.
- Un **ejercicio** justo debajo para practicar - Un **ejercicio** Extra
- Al final, una sección con **soluciones sugeridas** (opcionales) por si quieres comparar.

> Recomendación: intenta resolver los ejercicios **sin mirar** algunas soluciones propuestas.


## Cómo usar este cuaderno

1. Lee la explicación de cada sección.
0. Ejecuta y compreden temas de fundamentos de Python
1. Ejecuta la celda de **Ejemplo** para ver cómo funciona.
2. Resuelve el **Ejercicio** en la celda indicada (puedes modificarla libremente).
3. Si lo necesitas, revisa la sección de **Soluciones sugeridas** al final.

---


## 0. Variables,tipos de datos y operandos

En Python, una variable se crea en el momento en que le asignas un valor. No necesitas declarar el tipo explícitamente; Python es **dinámicamente tipado**.

In [None]:
# Asignación básica
x = 42          # int
pi = 3.1416     # float
nombre = "Ada"  # str
vivo = True     # bool
nada = None     # NoneType

x, pi, nombre, vivo, nada

(42, 3.1416, 'Ada', True, None)

In [None]:
# Asignación múltiple
a, b, c = 1, 2, 3
a,b,c

(1, 2, 3)

In [None]:
# Tipos: usa type() para inspeccionar
type(42), type(3.0), type("hola"), type(True), type(None)

(int, float, str, bool, NoneType)

### Operadores y operandos

**Aritméticos**: `+`, `-`, `*`, `/` (float), `//` (división entera), `%` (módulo), `**` (potencia)

In [None]:
# Aritméticos
7 + 5, 7 - 5, 7 * 5, 7 / 5, 7 // 5, 7 % 5, 2 ** 10

(12, 2, 35, 1.4, 1, 2, 1024)

**Comparación**: `==`, `!=`, `>`, `<`, `>=`, `<=`  
Devuelven `True` o `False`.


In [None]:
3 == 3, 3 != 4, 5 > 2, 5 <= 5

(True, True, True, True)

**Lógicos**: `and`, `or`, `not`  
Combinan expresiones booleanas.

In [None]:
True and False, True or False, not False

(False, True, True)

**Asignación aumentada**: `+=`, `-=`, `*=`, `/=`, `//=`, `%=`

In [None]:
n = 10
n += 5
n *= 2
n

30

**Pertenencia e identidad**
- Pertenencia: `in`, `not in`
- Identidad: `is`, `is not` (compara si son el **mismo objeto**, no solo igual en valor)


In [None]:
texto = "python"
'p' in texto, 'z' in texto, 'py' in texto


(True, False, True)

In [None]:
a = [1,2,3] # Creamos una lista en memoria
b = a # 'b' apunta a la MISMA lista que 'a'
c = [1,2,3] # Creamos una NUEVA lista, con los mismos valores
(b is a, c is a, c == a)

"""
Explicación del resultado

b is a

is comprueba si dos variables apuntan al mismo objeto en memoria.

Como b = a, ambos apuntan al mismo objeto lista.

Resultado: True.

------------------------------------------------------------

c is a

Aunque c tiene los mismos valores que a, se creó con [1,2,3] como un objeto nuevo.

Entonces c y a son objetos diferentes en memoria.

Resultado: False.

------------------------------------------------------------

c == a

== compara si los valores son iguales.

Ambos contienen [1,2,3].

Resultado: True.


"""

(True, False, True)

### Métodos y operaciones de strings

Los strings (`str`) tienen muchos métodos útiles.

In [None]:
s = "  Hola, Mundo!  "
s_upper = s.upper()       # Convierte a MAYÚSCULAS
s_lower = s.lower()       # Convierte a minúsculas
s_strip = s.strip()       # Elimina espacios al inicio y al final
s_replaced = s.replace("Mundo", "Python")  # Reemplaza texto
s_split = s_strip.split(",")               # Separa en lista según el delimitador
resultado = (s_upper, s_lower, s_strip, s_replaced, s_split)
resultado

('  HOLA, MUNDO!  ',
 '  hola, mundo!  ',
 'Hola, Mundo!',
 '  Hola, Python!  ',
 ['Hola', ' Mundo!'])

**Búsqueda y prefijos/sufijos**

In [None]:
s = "programar en python es bacano"
("python" in s,         # Comprueba si 'python' está dentro del string
 s.find("python"),      # Devuelve índice de la primera ocurrencia (o -1 si no existe)
 s.startswith("pro"),   # ¿Empieza con 'pro'?
 s.endswith("bacano")) # ¿Termina en 'bacano'?

(True, 13, True, True)

**Unir y partir (split/join)**

In [None]:
palabras = ["uno", "dos", "tres"]
"-".join(palabras)   # Une la lista con '-' como separador

'uno-dos-tres'

**Formateo de strings** con *f-strings* y formato clásico:

In [None]:
nombre = "Juan"
edad = 36
f"Me llamo {nombre} y tengo {edad} años."  # f-string, interpolación de variables

'Me llamo Juan y tengo 36 años.'

In [None]:
pi = 3.1415926535
"pi = {:.3f}".format(pi)  # Formato clásico, 3 decimales

'pi = 3.142'

**Slicing con String (rebanado)**: `s[inicio:fin:paso]`

In [None]:
t = "abcdefg"
(t[0],      # primer carácter
 t[-1],     # último carácter
 t[1:4],    # desde índice 1 hasta 3
 t[::2],    # cada 2 caracteres
 t[::-1])   # invertido

('a', 'g', 'bcd', 'aceg', 'gfedcba')

### Condicionales (`if`, `elif`, `else`)

In [None]:
x = 15
if x % 2 == 0:
    paridad = "par"
else:
    paridad = "impar"
paridad

'impar'

In [None]:
# if / elif / else
nota = 87
if nota >= 90:
    letra = "A"
elif nota >= 80:
    letra = "B"
elif nota >= 70:
    letra = "C"
else:
    letra = "D"

print(letra)

**Expresión condicional  If - else

In [None]:
edad = int(input("Ingrese su edad: "))

if edad >= 18:
  print("Usted es Mayor de Edad")
else:
  print("Usted es menor de edad")

### Ciclos (`for`, `while`)


Los bucles permiten repetir acciones.

In [None]:
#Ciclo For
nombres = ["Ana", "Luis", "María"]
for nombre in nombres:  #Nombre es la variable contador
    print(nombre)

Ana
Luis
María


In [None]:
#ciclo for con range
for i in range(1, 6):   # 1 hasta 5
    print(i)

In [None]:
# while con break/continue
n = 0
suma = 0
while True:
    n += 1
    if n % 2 == 0:
        continue  # salta los pares
    suma += n
    if n > 9:
        break     # sale del bucle
suma

36

In [None]:
#Ciclo While
n = 1
while n <= 5:          # Mientras n sea menor o igual a 5
    print(n)           # imprime n
    n += 1             # incrementa n

## 1) Listas

Una **lista** es una colección **mutable** y **ordenada** de elementos. Se definen con `[]`.
- Pueden contener elementos de **distintos tipos**.
- Se pueden **modificar** (agregar, quitar, reemplazar).
- Soportan **indexación** y **rebanado (slicing)**.

**Operaciones y métodos comunes:**
- Indexación: `mi_lista[0]`, `mi_lista[-1]`
- Slicing: `mi_lista[1:4]`, `mi_lista[::2]`
- Agregar: `.append(x)`, `.extend(iterable)`, `.insert(i, x)`
- Eliminar: `.pop(i)`, `.remove(x)`, `del mi_lista[i:j]`
- Otras: `.sort()`, `sorted(mi_lista)`, `.reverse()`, `len(mi_lista)`


In [None]:
# EJEMPLO (Listas)
numeros = [10, 3, 7, 1, 9]
print("Original:", numeros)

# Indexación y slicing
print("Primero:", numeros[0])
print("Último:", numeros[-1])
print("Slicing 1:4:", numeros[1:4])

# Agregar y eliminar
numeros.append(5)
numeros.remove(3)
print("Modificada:", numeros)

# Ordenar (sin modificar original)
ordenada = sorted(numeros)
print("Ordenada (copia):", ordenada)

# Ordenar in-place (modifica la lista)
numeros.sort()
print("Ordenada in-place:", numeros)

In [None]:
# EJERCICIO (Listas)
# 1. Crea una lista llamada 'temperaturas' con al menos 7 valores numéricos (pueden repetirse).
# 2. Imprime: el primer valor, los 3 últimos, y cada 2 elementos (usando slicing).
# 3. Agrega una nueva temperatura y elimina una existente por valor.
# 4. Ordena la lista de menor a mayor y guarda el resultado en 'ordenadas' sin modificar la original.
# 5. Calcula el promedio de 'ordenadas'.

# Escribe tu solución aquí:
temperaturas = []  # <- rellena


In [None]:
# EJERCICIO EXTRA (Listas)
# Dada la lista de palabras, realiza:
# 1) Crea una nueva lista 'longitudes' con la longitud de cada palabra.
# 2) Elimina duplicados de 'palabras' **preservando el orden** y guárdala en 'sin_duplicados'.
# 3) Encuentra la palabra más larga (si hay empate, quédate con la primera).
# 4) (Opcional) Crea una comprensión de listas que convierta a mayúsculas las palabras con longitud > 4.

palabras = ["sol", "luna", "estrella", "sol", "cometa", "luna", "planeta"]

# Escribe tu solución aquí:


## 2) Tuplas

Una **tupla** es una colección **inmutable** y **ordenada**. Se definen con `()`.
- No se pueden **modificar** después de creadas (no `.append`, no `.remove`).
- Útiles para **datos fijos** o para usar como **claves** en diccionarios (si todos sus elementos son inmutables).

**Operaciones comunes:**
- Indexación y slicing como en listas.
- Desempaquetado: `a, b = (1, 2)`
- Métodos: `.count(x)` y `.index(x)`


In [None]:
# EJEMPLO (Tuplas)
coordenada = (12.5, -3.7)
x, y = coordenada  # desempaquetado
print("x:", x, " y:", y)

colores = ("rojo", "verde", "azul", "rojo")
print("Count 'rojo':", colores.count("rojo"))
print("Index 'azul':", colores.index("azul"))

In [None]:
# EJERCICIO (Tuplas)
# 1. Crea una tupla 'producto' con: nombre (str), precio (float), en_stock (bool).
# 2. Desempaqueta la tupla en variables y muestra un resumen legible.
# 3. Crea otra tupla 'dimensiones' (ancho, alto, largo) y muestra solo 'alto'.

# Escribe tu solución aquí:
producto = ()  # <- rellena


In [None]:
# EJERCICIO EXTRA (Tuplas)
# Dada una lista de tuplas (nombre, edad):
# 1) Desempaqueta en dos listas: 'nombres' y 'edades'.
# 2) Crea una nueva tupla 'edades_siguiente_anio' con cada edad + 1 (usa comprensión/expresión de generador).
# 3) Cuenta cuántas personas son mayores o iguales a 18 años.
# 4) (Opcional) Obtén (min_edad, max_edad) usando solo la tupla de edades.

personas = [("Ana", 17), ("Luis", 21), ("Marta", 19), ("Pedro", 16), ("Lucía", 22)]

# Escribe tu solución aquí:


## 3) Diccionarios

Un **diccionario** mapea **claves** a **valores**. Se define con `{clave: valor}`.
- Las **claves** deben ser **hashables** (strings, números, tuplas inmutables, etc.).
- Permiten acceso por clave: `d["clave"]`
- Métodos útiles: `.get(k, por_defecto)`, `.keys()`, `.values()`, `.items()`, `.update(...)`, `.pop(k)`, `in`

**Patrones comunes:**
- Contar frecuencias.
- Transformar estructuras.
- Agrupar datos.


In [None]:
# EJEMPLO (Diccionarios)
persona = {
    "nombre": "Ana",
    "edad": 28,
    "ciudad": "Sevilla",
}
print("Nombre:", persona["nombre"])
print("Edad (get):", persona.get("edad", "desconocida"))

# Agregar/modificar
persona["profesion"] = "Ingeniera"
persona.update({"edad": 29})

# Recorrer
for k, v in persona.items():
    print(f"{k} -> {v}")

# Contar frecuencias de letras
texto = "manzana"
freq = {}
for ch in texto:
    freq[ch] = freq.get(ch, 0) + 1
print("Frecuencias:", freq)

In [None]:
# EJERCICIO (Diccionarios)
# Dado el siguiente listado de ventas por día, construye un diccionario de totales por producto.
ventas = [
    {"producto": "A", "unidades": 3, "precio": 10.0},
    {"producto": "B", "unidades": 1, "precio": 8.5},
    {"producto": "A", "unidades": 2, "precio": 10.0},
    {"producto": "C", "unidades": 5, "precio": 4.2},
    {"producto": "B", "unidades": 4, "precio": 8.5},
]

# 1. Crea un diccionario 'totales' donde la clave sea el producto y el valor el ingreso total (unidades*precio).
# 2. Imprime el producto con mayor ingreso.
# 3. (Opcional) Crea otro diccionario con unidades totales por producto.

# Escribe tu solución aquí:
totales = {}  # <- rellena


In [None]:
# EJERCICIO EXTRA (Diccionarios)
# 1) Normaliza el texto a minúsculas y elimina signos simples (, . ; : ! ?).
# 2) Construye un diccionario 'freq_palabras' con la frecuencia de cada palabra.
# 3) Muestra el TOP 3 de palabras más frecuentes (palabra, cuenta).
# 4) (Opcional) Invierte un diccionario simple producto->precio en otro precio->[productos].

texto = "¡Manzana, pera; manzana! Uva pera. Manzana: uva, pera."
productos_precios = {"A": 10, "B": 8.5, "C": 10, "D": 4.2}

# Escribe tu solución aquí:


## 4) Pandas

**Pandas** es una librería para análisis de datos que ofrece estructuras como:
- `Series`: una secuencia etiquetada unidimensional.
- `DataFrame`: una tabla de datos con filas y columnas.

**Operaciones esenciales con DataFrames:**
- Crear un DataFrame a partir de listas/dicts/CSV.
- Seleccionar columnas: `df["col"]`, `df[["col1","col2"]]`
- Filtrar filas: `df[df["col"] > 0]`
- Añadir columnas: `df["nueva"] = ...`
- Agrupar y agregar: `df.groupby("col").agg(...)`
- Describir datos: `df.describe()`

**Formas de mostrar resultado:**
- print() convierte lo que recibe a texto plano y lo envía a la salida estándar.

- display() muestra el objeto en su forma representativa más adecuada (HTML, imagen, tabla, etc.), dependiendo de su tipo.


In [None]:
# EJEMPLO (Pandas)
import pandas as pd

datos = {
    "producto": ["A", "B", "A", "C", "B", "A"],
    "unidades": [3, 1, 2, 5, 4, 6],
    "precio":   [10.0, 8.5, 10.0, 4.2, 8.5, 10.0],
}
df = pd.DataFrame(datos)
display(df.head())

# Nueva columna: ingreso
df["ingreso"] = df["unidades"] * df["precio"]

# Filtrar: ingresos > 20
filtrado = df[df["ingreso"] > 20]
display(filtrado)

# Agrupar por producto
resumen = df.groupby("producto").agg(
    unidades_totales=("unidades", "sum"),
    ingreso_total=("ingreso", "sum"),
    precio_medio=("precio", "mean")
).reset_index()

display(resumen)
print(df.select_dtypes(include="number").describe())

Unnamed: 0,producto,unidades,precio
0,A,3,10.0
1,B,1,8.5
2,A,2,10.0
3,C,5,4.2
4,B,4,8.5


Unnamed: 0,producto,unidades,precio,ingreso
0,A,3,10.0,30.0
3,C,5,4.2,21.0
4,B,4,8.5,34.0
5,A,6,10.0,60.0


Unnamed: 0,producto,unidades_totales,ingreso_total,precio_medio
0,A,11,110.0,10.0
1,B,5,42.5,8.5
2,C,5,21.0,4.2


       unidades     precio    ingreso
count  6.000000   6.000000   6.000000
mean   3.500000   8.533333  28.916667
std    1.870829   2.246479  17.619355
min    1.000000   4.200000   8.500000
25%    2.250000   8.500000  20.250000
50%    3.500000   9.250000  25.500000
75%    4.750000  10.000000  33.000000
max    6.000000  10.000000  60.000000


In [None]:
# EJERCICIO (Pandas)
# 1. Crea un DataFrame 'alumnos' con columnas: nombre, curso, nota (0-10).
# 2. Añade una columna 'aprobado' (True si nota >= 5).
# 3. Muestra solo los alumnos aprobados.
# 4. Calcula el promedio de nota por curso.
# 5. (Opcional) Ordena por nota descendente y muestra el top 3.

# Escribe tu solución aquí:
import pandas as pd
alumnos = pd.DataFrame({
    # "nombre": [...],
    # "curso":  [...],
    # "nota":   [...],
})


In [None]:
# EJERCICIO EXTRA (Pandas)
# Crea un DataFrame 'ventas' con columnas: fecha (YYYY-MM-DD), categoria, producto, unidades, precio.
# 1) Añade columna 'ingreso' = unidades*precio.
# 2) Filtra las filas del mes de "2025-03".
# 3) Calcula el ingreso total por categoria y ordénalo de mayor a menor.
# 4) (Opcional) Crea una tabla pivote con indice=categoria, columnas=producto, valores=ingreso (suma).

import pandas as pd

ventas = pd.DataFrame({
    "fecha":    ["2025-03-01","2025-03-02","2025-03-02","2025-03-15","2025-04-01","2025-03-20"],
    "categoria":["Electrónica","Hogar","Electrónica","Juguetes","Hogar","Electrónica"],
    "producto": ["Auriculares","Silla","Teclado","Puzzle","Mesa","Ratón"],
    "unidades": [2, 1, 3, 5, 1, 4],
    "precio":   [25.0, 45.0, 20.0, 8.0, 70.0, 15.0],
})

# Escribe tu solución aquí:


In [None]:
# EJERCICIO EXTRA (Pandas)
#Elegir un excel o csv a su gusto, leerlo desde Python y realizar un info(), describe()
# Escribe tu solución aquí:

---

## Soluciones sugeridas (revela solo si lo necesitas)

A continuación hay una posible forma de resolver cada ejercicio. No es la única.


In [None]:
# SOLUCIÓN (Listas)
temperaturas = [18.5, 20.0, 19.2, 22.1, 21.0, 17.8, 20.3]
print("Primera:", temperaturas[0])
print("Tres últimas:", temperaturas[-3:])
print("Cada 2:", temperaturas[::2])

# Agregar y eliminar
temperaturas.append(19.9)
temperaturas.remove(17.8)

# Ordenar sin modificar original
ordenadas = sorted(temperaturas)
print("Original:", temperaturas)
print("Ordenadas:", ordenadas)

# Promedio
promedio = sum(ordenadas) / len(ordenadas)
print("Promedio:", round(promedio, 2))

In [None]:
# SOLUCIÓN (Tuplas)
producto = ("Teclado", 24.99, True)
nombre, precio, en_stock = producto
print(f"Producto: {nombre} | Precio: {precio} | En stock: {en_stock}")

dimensiones = (45.0, 3.5, 12.0)  # ancho, alto, largo
_, alto, _ = dimensiones
print("Alto:", alto)

In [None]:
# SOLUCIÓN (Diccionarios)
ventas = [
    {"producto": "A", "unidades": 3, "precio": 10.0},
    {"producto": "B", "unidades": 1, "precio": 8.5},
    {"producto": "A", "unidades": 2, "precio": 10.0},
    {"producto": "C", "unidades": 5, "precio": 4.2},
    {"producto": "B", "unidades": 4, "precio": 8.5},
]

totales = {}
for v in ventas:
    p = v["producto"]
    ingreso = v["unidades"] * v["precio"]
    totales[p] = totales.get(p, 0) + ingreso

print("Totales por producto:", totales)

# Producto con mayor ingreso
producto_top = max(totales, key=totales.get)
print("Mayor ingreso:", producto_top, "->", totales[producto_top])

# (Opcional) Unidades totales
unidades_totales = {}
for v in ventas:
    p = v["producto"]
    unidades_totales[p] = unidades_totales.get(p, 0) + v["unidades"]
print("Unidades totales:", unidades_totales)

In [None]:
# SOLUCIÓN (Pandas)
import pandas as pd

alumnos = pd.DataFrame({
    "nombre": ["Ana", "Luis", "Marta", "Pedro", "Lucía", "Sergio"],
    "curso":  ["1A", "1A", "2B", "2B", "1A", "3C"],
    "nota":   [7.5, 4.3, 9.1, 5.0, 6.2, 3.8],
})

alumnos["aprobado"] = alumnos["nota"] >= 5
aprobados = alumnos[alumnos["aprobado"]]
print("Aprobados:")
display(aprobados)

promedio_por_curso = alumnos.groupby("curso")["nota"].mean().reset_index(name="promedio")
print("Promedio por curso:")
display(promedio_por_curso)

top3 = alumnos.sort_values("nota", ascending=False).head(3)
print("Top 3:")
display(top3)