## Manejo de valores faltantes: Estrategias y métodos


### Descripción del truco:
Pandas ofrece múltiples formas de manejar valores faltantes en un DataFrame. Algunas de las estrategias más comunes incluyen:
- Eliminar filas o columnas con valores faltantes: Esto es útil cuando la cantidad de datos perdidos es baja y no se afecta la integridad del análisis. </br>

Ejemplo:


In [7]:
# df = df.dropna()  # Elimina todas las filas con al menos un valor NaN
# df = df.dropna(axis=1)  # Elimina las columnas con al menos un valor NaN


- Rellenar valores faltantes: Rellenar valores NaN con algún valor específico, como la media o mediana de la columna, puede ser una forma útil de preservar la información. <br>
Ejemplo:

In [6]:
# df['columna'].fillna(df['columna'].mean(), inplace=True) # Rellena con la media
# df['columna'].fillna(df['columna'].median(), inplace=True) # Rellena con la mediana

### Investigacion:
Uno de los trucos menos conocidos es el uso de metodos como interpolate() para completar los valores faltantes basandose en interpolaciones, lo cual es muy útil para series temporales o datos numéricos con una tendencia clara.
### Descripción del truco:
El método interpolate() en Pandas permite rellenar valores faltantes utilizando distintos métodos de interpolación, como lineal, polinómica, o spline. Este enfoque es especialmente útil cuando tenés series temporales o datos con una tendencia subyacente, y simplemente rellenar con la media o mediana no es adecuado.
### Ejemplo del código:

In [8]:
import pandas as pd
import numpy as np

# Crear un DataFrame de ejemplo con valores faltantes
data = {'tiempo': [1, 2, 3, 4, 5, 6],
        'valor': [10, np.nan, np.nan, 40, 50, 60]}

df = pd.DataFrame(data)

# Rellenar los valores faltantes usando interpolación lineal
df['valor_interpolado'] = df['valor'].interpolate(method='linear')

print(df)


   tiempo  valor  valor_interpolado
0       1   10.0               10.0
1       2    NaN               20.0
2       3    NaN               30.0
3       4   40.0               40.0
4       5   50.0               50.0
5       6   60.0               60.0


### Mejora en el uso de Pandas:
Este método es más avanzado que simplemente rellenar valores con la media o eliminar filas, porque preserva las tendencias en los datos, lo que es crucial en análisis de series temporales. Además, mejora la precisión de los análisis posteriores, ya que conserva la estructura de los datos originales sin introducir sesgos.

Este truco es especialmente útil cuando se trabaja con datasets de series temporales o datos secuenciales donde eliminar o rellenar con un único valor afectaría el análisis.