In [None]:
# Crea dos datasets:
# - ventas.csv (con algunos problemas reales para limpiar)
# - ventas_pequenas.csv (mini CSV para lectura manual en Stop 2-2)

import pandas as pd
from io import StringIO

raw_full = StringIO("""producto,precio,cantidad,categoria
Manzana,100,3,Fruta
Banana,50,5,Fruta
Pera,80,2,Fruta
Notebook,350000,1,Electrónica
Mouse,8000,2,Electrónica
Manzana,100,,Fruta
Banana,50,3,fruta
Camisa,25000,1, Indumentaria
Camisa ,25000,2,Indumentaria
Mouse,8000,1,Electrónica
Cargador,6000,1,Electrónica
""")

raw_small = StringIO("""producto,precio,cantidad
Manzana,100,3
Banana,50,5
Pera,80,2
""")

df_full = pd.read_csv(raw_full)
df_small = pd.read_csv(raw_small)

df_full.to_csv("ventas.csv", index=False)               # para 2-3, 2-4, 2-5, 2-6
df_small.to_csv("ventas_pequenas.csv", index=False)     # para 2-2 (lectura manual)

print("OK -> ventas.csv y ventas_pequenas.csv creados")
display(df_full.head())


In [None]:
#STOP 1

# Diccionario con "ventas" (ojo: claves repetidas se pisan; lo forzamos vía lista de pares)
ventas_pairs = [
    ("Juan", 150),
    ("Ana", 200),
    ("Luis", 350),
    ("Ana", 50),   # repetido -> hay que acumular
]

# 1) Convertir a lista de tuplas (ya lo es), y 2) sumar valores por cliente

# Solución con acumulación manual
totales = {}
for cliente, total in ventas_pairs:
    totales[cliente] = totales.get(cliente, 0) + total
resultado_manual = list(totales.items())

# Solución con Counter
from collections import Counter
resultado_counter = list(Counter(dict(resultado_manual)).items())  # idempotente

print("Acumulación manual:", resultado_manual)
print("Con Counter:", resultado_counter)


In [None]:
STOP 2
# Lectura manual de ventas_pequenas.csv usando split()
with open("ventas_pequenas.csv", "r", encoding="utf-8") as f:
    header = next(f)  # saltar encabezado
    for linea in f:
        producto, precio, cantidad = linea.strip().split(",")
        total = int(precio) * int(cantidad)
        print(producto, total)


In [None]:
import csv

with open("ventas_pequenas.csv", "r", encoding="utf-8") as f:
    reader = csv.reader(f)
    next(reader)  # saltar encabezado
    for producto, precio, cantidad in reader:
        total = int(precio) * int(cantidad)
        print(producto, total)


In [None]:
#STOP 3
import pandas as pd

df = pd.read_csv("ventas.csv")
display(df.head())
print("\nInfo:")
print(df.info())
print("\nShape:", df.shape)
print("\nProductos únicos:", df["producto"].nunique())


In [None]:
#STOP 4
import pandas as pd

df = pd.read_csv("ventas.csv")

# Seleccionar columnas
cols = df[["producto", "precio"]]
display(cols.head())

# Filtrar filas con precio > 100
filtro = df[df["precio"] > 100][["producto", "precio"]].head(10)
print("\nProductos con precio > 100 (Top 10):")
display(filtro)


In [None]:
#STOP 5
import pandas as pd

df = pd.read_csv("ventas.csv")

# 1) Crear 'ingresos' = precio * cantidad (habrá NaN si hay cantidad nula)
df["ingresos"] = df["precio"] * df["cantidad"]

# 2) Renombrar 'producto' -> 'nombre_producto'
df = df.rename(columns={"producto": "nombre_producto"})

# 3) Reemplazar nulos en categoria
df["categoria"] = df["categoria"].fillna("Sin categoría")

display(df.head(8))
print("\nNulos por columna:")
print(df.isna().sum())



In [None]:
#STOP 6
import pandas as pd

df = pd.read_csv("ventas.csv")

# Asegurar columnas base
df["ingresos"] = df["precio"] * df["cantidad"]
df = df.rename(columns={"producto": "nombre_producto"})
df["categoria"] = df["categoria"].fillna("Sin categoría")

# 1) Sumar ingresos por categoría
ingresos_cat = (
    df.groupby("categoria")["ingresos"]
      .sum()
      .sort_values(ascending=False)
)
print("Ingresos por categoría:")
display(ingresos_cat)

# 2) Contar productos distintos por categoría
productos_cat = (
    df.groupby("categoria")["nombre_producto"]
      .nunique()
      .sort_values(ascending=False)
)
print("\nProductos distintos por categoría:")
display(productos_cat)
