## Limpeza e Preparação de Dados (Tratamento de Valores Nulos)


#### Em muitas análises de dados, você frequentemente encontrará valores ausentes. O Pandas fornece ferramentas poderosas para lidar com isso.

In [1]:
# Remover ou substituir valores nulos em um DataFrame.

import pandas as pd

# Criando um DataFrame de exemplo com valores nulos
data = {'nome': ['Ana', 'Carlos', 'Maria', None],
        'idade': [23, 45, None, 30],
        'cidade': ['São Paulo', 'Rio de Janeiro', 'Curitiba', None]}
df = pd.DataFrame(data)

# Exibindo o DataFrame original
print("Original:")
print(df)

# Remover linhas com qualquer valor nulo
df_clean = df.dropna()

# Substituindo valores nulos por um valor específico
df_filled = df.fillna({'idade': df['idade'].mean(), 'cidade': 'Desconhecida'})

print("\nApós limpar (remover):")
print(df_clean)

# Ao preencher valores nulos com a média da coluna "idade", a média foi calculada com base nas idades existentes
print("\nApós preencher (substituir):")
print(df_filled)


Original:
     nome  idade          cidade
0     Ana   23.0       São Paulo
1  Carlos   45.0  Rio de Janeiro
2   Maria    NaN        Curitiba
3    None   30.0            None

Após limpar (remover):
     nome  idade          cidade
0     Ana   23.0       São Paulo
1  Carlos   45.0  Rio de Janeiro

Após preencher (substituir):
     nome      idade          cidade
0     Ana  23.000000       São Paulo
1  Carlos  45.000000  Rio de Janeiro
2   Maria  32.666667        Curitiba
3    None  30.000000    Desconhecida
