# Actividad 4: Manejo de Datos con Pandas

**Estudiante:** Yeison

**Objetivo:** Practicar Series y DataFrames, manejo de faltantes, selección, ordenamiento, estadísticas, y lectura/escritura de archivos.

---

## 0. Dataset Base - Preparación

Creación del dataset base para todos los ejercicios.

In [None]:
import pandas as pd

# Crear el dataset base
datos = {
    'nombre':   ['Ana', 'Bob', 'Clara', 'Diego', 'Eva'],
    'edad':     [25, 30, 22, None, 28],
    'ciudad':   ['Madrid', 'Lima', 'Bogotá', 'Medellín', None],
    'producto': ['Laptop', 'Teléfono', 'Tablet', 'Laptop', 'Tablet'],
    'precio':   [1200, 800, 300, 1150, None],
    'stock':    [10, 15, 5, 8, 0]
}

df = pd.DataFrame(datos, index=['a', 'b', 'c', 'd', 'e'])

# Mostrar el DataFrame
print("Dataset Base:")
print(df)
print("\n" + "="*60 + "\n")

# Guardar el dataset para ejercicios de lectura/escritura
df.to_csv('actividad_semana4.csv', index=True)
print("✓ Archivo 'actividad_semana4.csv' creado exitosamente")

---

## Ejercicio 1: Series - crear y operar

**Objetivos:**
- Crear Series desde lista y diccionario
- Acceder a elementos por índice
- Modificar valores
- Realizar operaciones matemáticas

In [None]:
print("="*60)
print("EJERCICIO 1: SERIES - CREAR Y OPERAR")
print("="*60 + "\n")

# 1.1 Crear Series desde una lista
print("1.1 Series desde una lista:")
lista_precios = [1200, 800, 300, 1150, 450]
serie_lista = pd.Series(lista_precios, name='precios')
print(serie_lista)
print()

# 1.2 Crear Series desde un diccionario
print("1.2 Series desde un diccionario:")
dict_productos = {
    'Laptop': 1200,
    'Teléfono': 800,
    'Tablet': 300,
    'Monitor': 450,
    'Teclado': 80
}
serie_dict = pd.Series(dict_productos, name='precios_productos')
print(serie_dict)
print()

# 1.3 Acceder a elementos por índice
print("1.3 Acceso por índice:")
print(f"Precio en posición 0: {serie_lista[0]}")
print(f"Precio del producto 'Laptop': {serie_dict['Laptop']}")
print(f"Primeros 3 elementos: \n{serie_lista[:3]}")
print()

# 1.4 Modificar un valor
print("1.4 Modificar un valor:")
print(f"Precio original de Tablet: {serie_dict['Tablet']}")
serie_dict['Tablet'] = 350
print(f"Precio modificado de Tablet: {serie_dict['Tablet']}")
print()

# 1.5 Operación matemática (multiplicar por 2)
print("1.5 Operación matemática - Multiplicar precios por 2:")
serie_doble = serie_lista * 2
print(serie_doble)
print()

# 1.6 Operaciones adicionales
print("1.6 Operaciones adicionales:")
print(f"Suma total de precios: ${serie_lista.sum()}")
print(f"Precio promedio: ${serie_lista.mean():.2f}")
print(f"Precio máximo: ${serie_lista.max()}")
print(f"Precio mínimo: ${serie_lista.min()}")
print()

print("✓ Ejercicio 1 completado exitosamente")

---

## Ejercicio 2: DataFrame - crear y explorar

**Objetivos:**
- Crear DataFrame con índice personalizado
- Acceder a columnas
- Usar `loc` e `iloc`

In [None]:
print("="*60)
print("EJERCICIO 2: DATAFRAME - CREAR Y EXPLORAR")
print("="*60 + "\n")

# 2.1 Crear DataFrame desde diccionario con índice personalizado
print("2.1 Crear DataFrame con índice personalizado:")
datos_ej2 = {
    'nombre':   ['Ana', 'Bob', 'Clara', 'Diego', 'Eva'],
    'edad':     [25, 30, 22, 35, 28],
    'ciudad':   ['Madrid', 'Lima', 'Bogotá', 'Medellín', 'Santiago'],
    'salario':  [3000, 3500, 2800, 4000, 3200]
}
df_ej2 = pd.DataFrame(datos_ej2, index=['emp1', 'emp2', 'emp3', 'emp4', 'emp5'])
print(df_ej2)
print()

# 2.2 Acceder a una columna
print("2.2 Acceder a la columna 'nombre':")
print(df_ej2['nombre'])
print()

# 2.3 Usar loc para acceder por etiqueta
print("2.3 Usar loc - Acceder a fila 'emp3' por etiqueta:")
print(df_ej2.loc['emp3'])
print()

# 2.4 Usar iloc para acceder por posición
print("2.4 Usar iloc - Acceder a fila en posición 1:")
print(df_ej2.iloc[1])
print()

print("✓ Ejercicio 2 completado exitosamente")

---

## Ejercicio 3: Operaciones básicas

**Objetivos:**
- Agregar columnas derivadas
- Aplicar operaciones vectorizadas

In [None]:
print("="*60)
print("EJERCICIO 3: OPERACIONES BÁSICAS")
print("="*60 + "\n")

# Recargar dataset base
df_ej3 = df.copy()

print("DataFrame original:")
print(df_ej3)
print("\n" + "="*60 + "\n")

# 3.1 Agregar columna derivada: precio_descuento (10% de descuento)
print("3.1 Agregar columna 'precio_descuento' (10% descuento):")
df_ej3['precio_descuento'] = df_ej3['precio'] * 0.9
print(df_ej3[['producto', 'precio', 'precio_descuento']])
print()

# 3.2 Agregar columna: valor_inventario (precio * stock)
print("3.2 Agregar columna 'valor_inventario' (precio × stock):")
df_ej3['valor_inventario'] = df_ej3['precio'] * df_ej3['stock']
print(df_ej3[['producto', 'precio', 'stock', 'valor_inventario']])
print()

# 3.3 Operación vectorizada: incrementar stock en 5 unidades
print("3.3 Operación vectorizada - Incrementar stock en 5 unidades:")
df_ej3['stock_nuevo'] = df_ej3['stock'] + 5
print(df_ej3[['producto', 'stock', 'stock_nuevo']])
print()

print("✓ Ejercicio 3 completado exitosamente")

---

## Ejercicio 4: Manejo de datos faltantes

**Objetivos:**
- Detectar nulos con `isna()`
- Contar faltantes
- Completar con `fillna()`

In [None]:
print("="*60)
print("EJERCICIO 4: MANEJO DE DATOS FALTANTES")
print("="*60 + "\n")

# Recargar dataset base
df_ej4 = df.copy()

print("DataFrame original:")
print(df_ej4)
print("\n" + "="*60 + "\n")

# 4.1 Detectar nulos con isna()
print("4.1 Detectar valores nulos con isna():")
print(df_ej4.isna())
print()

# 4.2 Contar faltantes por columna
print("4.2 Contar valores faltantes por columna:")
print(df_ej4.isna().sum())
print()

# 4.3 Completar faltantes en 'edad' con 0
print("4.3 Completar faltantes en 'edad' con 0:")
print(f"Antes: {df_ej4['edad'].tolist()}")
df_ej4['edad'] = df_ej4['edad'].fillna(0)
print(f"Después: {df_ej4['edad'].tolist()}")
print()

# 4.4 Completar faltantes en 'ciudad' con 'Desconocido'
print("4.4 Completar faltantes en 'ciudad' con 'Desconocido':")
print(f"Antes: {df_ej4['ciudad'].tolist()}")
df_ej4['ciudad'] = df_ej4['ciudad'].fillna('Desconocido')
print(f"Después: {df_ej4['ciudad'].tolist()}")
print()

print("DataFrame final sin valores nulos:")
print(df_ej4)
print()

print("✓ Ejercicio 4 completado exitosamente")

---

## Ejercicio 5: Selección y filtrado

**Objetivos:**
- Filtrar por condiciones
- Usar operadores lógicos
- Usar `isin()` y `query()`

In [None]:
print("="*60)
print("EJERCICIO 5: SELECCIÓN Y FILTRADO")
print("="*60 + "\n")

# Recargar dataset base
df_ej5 = df.copy()

print("DataFrame original:")
print(df_ej5)
print("\n" + "="*60 + "\n")

# 5.1 Filtrar filas con precio > 500
print("5.1 Filtrar productos con precio > 500:")
filtro_precio = df_ej5[df_ej5['precio'] > 500]
print(filtro_precio)
print(f"\nTotal de productos con precio > 500: {len(filtro_precio)}")
print()

# 5.2 Filtrar productos 'Laptop' con stock > 5
print("5.2 Filtrar productos 'Laptop' con stock > 5:")
filtro_laptop = df_ej5[(df_ej5['producto'] == 'Laptop') & (df_ej5['stock'] > 5)]
print(filtro_laptop)
print(f"\nTotal de Laptops con stock > 5: {len(filtro_laptop)}")
print()

# 5.3 Filtrar usando isin()
print("5.3 Filtrar usando isin() - Productos en lista:")
productos_buscar = ['Laptop', 'Tablet']
filtro_isin = df_ej5[df_ej5['producto'].isin(productos_buscar)]
print(filtro_isin)
print()

print("✓ Ejercicio 5 completado exitosamente")

---

## Ejercicio 6: Ordenar datos

**Objetivos:**
- Ordenar por columnas
- Manejar nulos en ordenamiento
- Ordenar por múltiples columnas

In [None]:
print("="*60)
print("EJERCICIO 6: ORDENAR DATOS")
print("="*60 + "\n")

# Recargar dataset base
df_ej6 = df.copy()

print("DataFrame original:")
print(df_ej6)
print("\n" + "="*60 + "\n")

# 6.1 Ordenar por edad ascendente
print("6.1 Ordenar por edad (ascendente):")
df_edad_asc = df_ej6.sort_values('edad')
print(df_edad_asc)
print()

# 6.2 Ordenar por precio descendente
print("6.2 Ordenar por precio (descendente):")
df_precio_desc = df_ej6.sort_values('precio', ascending=False)
print(df_precio_desc)
print()

# 6.3 Ordenar por precio descendente (rellenar nulos temporalmente)
print("6.3 Ordenar por precio descendente (rellenar nulos con 0):")
df_temp = df_ej6.copy()
df_temp['precio_temp'] = df_temp['precio'].fillna(0)
df_ordenado = df_temp.sort_values('precio_temp', ascending=False)
df_ordenado = df_ordenado.drop('precio_temp', axis=1)
print(df_ordenado)
print()

print("✓ Ejercicio 6 completado exitosamente")

---

## Ejercicio 7: Estadísticas básicas

**Objetivos:**
- Usar `describe()`
- Usar `value_counts()`
- Calcular estadísticas por grupos

In [None]:
print("="*60)
print("EJERCICIO 7: ESTADÍSTICAS BÁSICAS")
print("="*60 + "\n")

# Recargar dataset base
df_ej7 = df.copy()

print("DataFrame original:")
print(df_ej7)
print("\n" + "="*60 + "\n")

# 7.1 Estadísticas descriptivas con describe()
print("7.1 Estadísticas descriptivas para columnas numéricas:")
print(df_ej7.describe())
print()

# 7.2 Conteo de valores con value_counts()
print("7.2 Conteo de valores para 'producto':")
print(df_ej7['producto'].value_counts())
print()

# 7.3 Estadísticas individuales
print("7.3 Estadísticas individuales:")
print(f"Media de edad: {df_ej7['edad'].mean():.2f}")
print(f"Mediana de precio: {df_ej7['precio'].median():.2f}")
print(f"Valor máximo de precio: {df_ej7['precio'].max():.2f}")
print(f"Suma total de stock: {df_ej7['stock'].sum()}")
print()

print("✓ Ejercicio 7 completado exitosamente")

---

## Ejercicio 8: Leer y guardar datos

**Objetivos:**
- Leer CSV
- Guardar CSV con columnas seleccionadas
- Usar diferentes separadores

In [None]:
print("="*60)
print("EJERCICIO 8: LEER Y GUARDAR DATOS")
print("="*60 + "\n")

# 8.1 Leer el CSV creado
print("8.1 Leer el archivo CSV:")
df_leido = pd.read_csv('actividad_semana4.csv', index_col=0)
print(df_leido)
print()

# 8.2 Mostrar las primeras filas
print("8.2 Mostrar las primeras 3 filas con head():")
print(df_leido.head(3))
print()

# 8.3 Guardar CSV con columnas seleccionadas
print("8.3 Guardar CSV con columnas seleccionadas:")
columnas_seleccionadas = ['nombre', 'producto', 'precio']
df_seleccion = df_leido[columnas_seleccionadas]
df_seleccion.to_csv('productos_precios.csv', index=False)
print("✓ Archivo 'productos_precios.csv' guardado con columnas:", columnas_seleccionadas)
print(df_seleccion)
print()

print("✓ Ejercicio 8 completado exitosamente")

---

## Ejercicio 9: Ejercicio integrado

**Objetivos:**
- Aplicar descuento del 10%
- Filtrar stock > 5
- Ordenar por precio_descuento
- Guardar resultado

In [None]:
print("="*60)
print("EJERCICIO 9: EJERCICIO INTEGRADO")
print("="*60 + "\n")

# Recargar dataset base
df_ej9 = df.copy()

print("Paso 1: Dataset original")
print(df_ej9)
print("\n" + "="*60 + "\n")

# Paso 1: Aplicar descuento del 10% a precio
print("Paso 2: Aplicar descuento del 10% al precio")
df_ej9['precio_descuento'] = df_ej9['precio'] * 0.9
print(df_ej9[['producto', 'precio', 'precio_descuento', 'stock']])
print("\n" + "="*60 + "\n")

# Paso 2: Filtrar productos con stock > 5
print("Paso 3: Filtrar productos con stock > 5")
df_filtrado = df_ej9[df_ej9['stock'] > 5]
print(df_filtrado[['producto', 'precio', 'precio_descuento', 'stock']])
print(f"\nProductos filtrados: {len(df_filtrado)} de {len(df_ej9)}")
print("\n" + "="*60 + "\n")

# Paso 3: Ordenar por precio_descuento (descendente)
print("Paso 4: Ordenar por precio_descuento (descendente)")
df_ordenado = df_filtrado.sort_values('precio_descuento', ascending=False)
print(df_ordenado[['producto', 'precio', 'precio_descuento', 'stock']])
print("\n" + "="*60 + "\n")

# Paso 4: Guardar como inventario_procesado.csv
print("Paso 5: Guardar resultado como 'inventario_procesado.csv'")
df_ordenado.to_csv('inventario_procesado.csv', index=True)
print("✓ Archivo 'inventario_procesado.csv' guardado exitosamente")
print()

# Resumen del proceso
print("="*60)
print("RESUMEN DEL PROCESO INTEGRADO")
print("="*60)
print(f"1. Dataset original: {len(df_ej9)} registros")
print(f"2. Descuento aplicado: 10% sobre precio")
print(f"3. Filtrado: stock > 5 → {len(df_filtrado)} registros")
print(f"4. Ordenamiento: por precio_descuento (descendente)")
print(f"5. Archivo guardado: inventario_procesado.csv")
print()

print("✓ Ejercicio 9 completado exitosamente")

---

## Conclusión

**Actividad 4 completada exitosamente** ✅

### Temas cubiertos:
1. ✅ Series - Creación y operaciones
2. ✅ DataFrame - Creación y exploración
3. ✅ Operaciones básicas - Columnas derivadas
4. ✅ Manejo de datos faltantes - isna() y fillna()
5. ✅ Selección y filtrado - Condiciones y operadores
6. ✅ Ordenar datos - sort_values()
7. ✅ Estadísticas básicas - describe() y value_counts()
8. ✅ Leer y guardar datos - CSV
9. ✅ Ejercicio integrado - Aplicación completa

### Archivos generados:
- `actividad_semana4.csv`
- `productos_precios.csv`
- `inventario_procesado.csv`