In [1]:
import pandas as pd

# Carregamento dos dados
caminho_arquivo = 'animes.csv'  # Substitua pelo caminho correto do arquivo
dados_animes = pd.read_csv(caminho_arquivo)

# Renomeando colunas para Português
renomear_colunas = {
    'rate': 'Avaliação',
    'votes': 'Votos Totais',
    'episodes': 'Número de Episódios'
}
dados_animes.rename(columns=renomear_colunas, inplace=True)

# Excluir animes que não possuem episódios
dados_animes = dados_animes[dados_animes['Número de Episódios'] > 0]

# Adicionando indicadores estatísticos
colunas_genero = [col for col in dados_animes.columns if 'genre_' in col]
anime_popular_por_genero = {}

for genero in colunas_genero:
    dados_genero = dados_animes[dados_animes[genero] == 1]
    if not dados_genero.empty:
        mais_popular = dados_genero.loc[dados_genero['Votos Totais'].idxmax()]
        anime_popular_por_genero[genero] = mais_popular['anime']

# Criando uma coluna para animes populares e seus gêneros
dados_animes['Anime Popular'] = dados_animes['anime'].apply(lambda x: x if x in anime_popular_por_genero.values() else '')
dados_animes['Gênero do Anime Popular'] = dados_animes['Anime Popular'].apply(lambda x: next((g.replace('genre_', '').capitalize() for g, a in anime_popular_por_genero.items() if a == x), ''))

# Calculando estatísticas descritivas para o DataFrame inteiro
assimetria_aval = dados_animes['Avaliação'].skew()
curtose_aval = dados_animes['Avaliação'].kurt()
desvio_padrao_aval = dados_animes['Avaliação'].std()

# Adicionando as estatísticas como novas colunas
dados_animes['Assimetria Avaliação'] = assimetria_aval
dados_animes['Curtose Avaliação'] = curtose_aval
dados_animes['Desvio Padrão Avaliação'] = desvio_padrao_aval

# Reorganizando colunas
colunas_nucleo = ['anime', 'anime_url', 'anime_img', 'Número de Episódios', 'Votos Totais',
                  'Avaliação', 'Anime Popular', 'Gênero do Anime Popular']
colunas_estatisticas = ['Assimetria Avaliação', 'Curtose Avaliação', 'Desvio Padrão Avaliação']

# Reorganizando colunas
dados_animes = dados_animes[colunas_nucleo + colunas_estatisticas]

# Salvando o dataframe processado
caminho_arquivo_processado = 'animes_final.csv'  # Substitua pelo caminho desejado
dados_animes.to_csv(caminho_arquivo_processado, index=False)

print(f"Arquivo processado salvo em: {caminho_arquivo_processado}")


Arquivo processado salvo em: animes_final.csv
