# Solución 1: Limpieza de Números Corruptos

In [24]:
import pandas as pd 
import numpy as np 

In [25]:
#Crear serie como texto
valores_dirt = pd.Series(['150.5', '200', 'Error', '300.5', 'Fallo', '50'])


#Intentar sumar sin convertir ni limpiar los datos
suma_total = valores_dirt.sum()
print("--- Error Típico: Suma de Textos ---")
print("Suma original:", suma_total)

#Convertir datos de texto a númericos
valores_num = pd.to_numeric(valores_dirt, errors="coerce")
print("--- Valores númericps ---")
print(valores_num)

#Sumar
print("\n--- Solución: Suma Numérica ---")
print("Suma corregida:", valores_num.sum())


--- Error Típico: Suma de Textos ---
Suma original: 150.5200Error300.5Fallo50
--- Valores númericps ---
0    150.5
1    200.0
2      NaN
3    300.5
4      NaN
5     50.0
dtype: float64

--- Solución: Suma Numérica ---
Suma corregida: 701.0


# Solución 2: Interpretación de Fechas

In [26]:
fechas_dirt = pd.Series([
    '2024-01-15',
    '2024-02-10',
    '2024-01-30',
    '2024-03-01'
])

print("Original:",fechas_dirt.dtypes)


#Convertimos a datetime
fechas_clean=pd.to_datetime(fechas_dirt)
print("Convertido:", fechas_clean.dtype)

#Ahora podemos extraer información
print("\n--- Extracción de Meses ---")
print(fechas_clean.dt.month_name())

Original: str
Convertido: datetime64[us]

--- Extracción de Meses ---
0     January
1    February
2     January
3       March
dtype: str


# Solución 3: Optimización de Memoria

In [27]:
#Creación de la lista serie
cat_ciudades=pd.Series(['Bogotá', 'Medellín','Cali']*9000)

#Medimos memoria como 'object' (texto)
mem_obj=cat_ciudades.memory_usage(deep=True)

#Convertimos a 'category'
ciudades_cat=cat_ciudades.astype('category')
mem_cat=ciudades_cat.memory_usage(deep=True)

print(f"--- Ahorro de Memoria ---")
print(f"Memoria Object: {mem_obj} bytes")
print(f"Memoria Category: {mem_cat} bytes")
print(f"Reducción: {round((1 - mem_cat/mem_obj) * 100, 2)}%")


--- Ahorro de Memoria ---
Memoria Object: 1773132 bytes
Memoria Category: 27347 bytes
Reducción: 98.46%


# Solución 4: Corrección de Valores Booleanos

In [28]:
#Creación de la serie
serie = pd.Series(["True", "False", "True", "True", "False"])

#Convertir a booleanos reales
serie_bool = serie.map({"True": True, "False": False})

#Cuantos Booleanos hay
print("--- Contador de Booleanos ---")
conteo = serie_bool.value_counts()
print(conteo)

--- Contador de Booleanos ---
True     3
False    2
Name: count, dtype: int64
