In [1]:
# Script para inspecionar as primeiras 5 linhas de um arquivo
file_path = 'house_16H.arff' # Coloque o caminho para o seu arquivo aqui

try:
    with open(file_path, 'r', encoding='utf-8') as f:
        for i in range(5):
            print(f.readline().strip())
except FileNotFoundError:
    print(f"Erro: Arquivo '{file_path}' não encontrado.")
except Exception as e:
    print(f"Ocorreu um erro: {e}")

@relation house_16H

@attribute P1 numeric
@attribute P5p1 numeric
@attribute P6p2 numeric


In [3]:
import pandas as pd
from scipy.io import arff
import os

# --- Passo 1: Definir os nomes dos arquivos ---
# O nome do arquivo que você baixou (sem extensão)
arff_filename = 'house_16H.arff' 
# O nome do novo arquivo CSV que vamos criar
csv_filename = 'house_data_classificacao.csv'

try:
    # --- Passo 2: Carregar os dados do arquivo ARFF ---
    print(f"Carregando o arquivo ARFF: '{arff_filename}'...")
    data, meta = arff.loadarff(arff_filename)
    
    # --- Passo 3: Converter para um DataFrame do Pandas ---
    df = pd.DataFrame(data)
    print("Arquivo ARFF carregado com sucesso em um DataFrame.")

    # --- Passo 4: Salvar o DataFrame como um arquivo CSV ---
    # O parâmetro index=False evita que o pandas crie uma coluna extra para o índice.
    df.to_csv(csv_filename, index=False)
    print(f"DataFrame salvo com sucesso como '{csv_filename}'.")

    # --- Passo 5: Verificação (Opcional, mas recomendado) ---
    # Vamos ler o CSV que acabamos de criar para garantir que tudo está correto.
    print("\nVerificando o arquivo CSV criado...")
    df_from_csv = pd.read_csv(csv_filename)
    
    print("As 5 primeiras linhas do arquivo CSV são:")
    print(df_from_csv.head())

except FileNotFoundError:
    print(f"ERRO: O arquivo '{arff_filename}' não foi encontrado. Verifique o nome e o local do arquivo.")
except Exception as e:
    print(f"Ocorreu um erro inesperado: {e}")

Carregando o arquivo ARFF: 'house_16H.arff'...
Arquivo ARFF carregado com sucesso em um DataFrame.
DataFrame salvo com sucesso como 'house_data_classificacao.csv'.

Verificando o arquivo CSV criado...
As 5 primeiras linhas do arquivo CSV são:
        P1      P5p1      P6p2     P11p4     P14p9     P15p1     P15p3  \
0  15512.0  0.460869  0.049252  0.226470  0.149827  0.752837  0.010057   
1   1550.0  0.470968  0.002581  0.137419  0.096342  0.862581  0.000000   
2   4741.0  0.485341  0.000211  0.189412  0.135656  0.856992  0.000000   
3    467.0  0.498929  0.000000  0.100642  0.085470  0.907923  0.000000   
4    310.0  0.474194  0.680645  0.225807  0.128834  0.896774  0.000000   

      P16p2     P18p2     P27p4      H2p2      H8p2     H10p1     H13p1  \
0  0.579729  0.003251  0.075912  0.625318  0.036613  0.991377  0.260116   
1  0.695142  0.005025  0.043551  0.064263  0.003350  0.994975  0.285267   
2  0.683584  0.004143  0.027965  0.065796  0.000000  0.997411  0.315433   
3  0.780488 