In [1]:
import pandas as pd

# Extração: Carregar os dados do arquivo CSV
dados = pd.read_csv('animes.csv')

# Transformação: Limpeza e manipulação dos dados

# 1. Tratamento de valores nulos
# Substituir valores nulos por valores padrão ou média, dependendo do tipo de dado
for col in dados.columns:
    if dados[col].dtype == "float64" or dados[col].dtype == "int64":
        dados[col].fillna(dados[col].mean(), inplace=True)  # Substitui por média para dados numéricos
    else:
        dados[col].fillna('Desconhecido', inplace=True)     # Substitui por 'Desconhecido' para dados categóricos

# 2. Normalização de tipos de dados
# Conversão de tipos de dados se necessário (por exemplo, garantindo que 'rate' seja float)
dados['rate'] = dados['rate'].astype(float)

# 3. Renomeação de colunas para melhor entendimento
dados.rename(columns={
    'anime': 'Nome do Anime',
    'episodes': 'Número de Episódios',
    'votes': 'Votos',
    'rate': 'Classificação',
    'type': 'Tipo'
}, inplace=True)

# 4. Criação de novas colunas
# Adicionando uma coluna de classificação baseada na coluna 'Classificação'
bins = [0, 2, 4, 6, 8, 10]
labels = ['Muito Ruim', 'Ruim', 'Médio', 'Bom', 'Excelente']
dados['Classificação Categórica'] = pd.cut(dados['Classificação'], bins=bins, labels=labels)

# Carregamento: Exportar os dados transformados para um arquivo CSV

dados.to_csv('dados_tratados_para_power_bi.csv', index=False, header=True)

# Informar que o processo foi completado com sucesso
print("Dados exportados com sucesso para 'dados_tratados_para_power_bi.csv'. Prontos para serem usados no Power BI.")


Dados exportados com sucesso para 'dados_tratados_para_power_bi.csv'. Prontos para serem usados no Power BI.


The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  dados[col].fillna('Desconhecido', inplace=True)     # Substitui por 'Desconhecido' para dados categóricos
The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  dados[col].fillna(dados[col].mean(), inplace=True)  # Substitui por média para dados numéricos
