In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

In [None]:
# Carregar os dados
dados = pd.read_csv('animes.csv')

# Tratamento de valores nulos
for col in dados.columns:
    if dados[col].dtype in ["float64", "int64"]:
        dados[col].fillna(dados[col].mean(), inplace=True)
    else:
        dados[col].fillna('Desconhecido', inplace=True)

# Normalização e renomeação de tipos de dados
dados['rate'] = dados['rate'].astype(float)
dados.rename(columns={
    'anime': 'Nome do Anime',
    'episodes': 'Número de Episódios',
    'votes': 'Votos',
    'rate': 'Classificação'
}, inplace=True)

# Criação de novas colunas
bins = [0, 2, 4, 6, 8, 10]
labels = ['Muito Ruim', 'Ruim', 'Médio', 'Bom', 'Excelente']
dados['Classificação Categórica'] = pd.cut(dados['Classificação'], bins=bins, labels=labels)

# Análise Comparativa por Gênero
genres_columns = [col for col in dados.columns if 'genre_' in col]
genres_aggregated = dados[genres_columns + ['Votos', 'Classificação']].groupby(genres_columns).agg({
    'Votos': ['sum', 'mean', 'count'],
    'Classificação': ['mean', 'std']
})

# Correlação entre Número de Episódios e Classificação
correlation_data = dados[['Número de Episódios', 'Classificação']].corr()

In [None]:
dados.to_csv('dados_tratados_para_power_bi.csv', index=False, header=True)
print("Dados exportados com sucesso para 'dados_tratados_para_power_bi.csv'. Prontos para serem usados no Power BI.")