# Código Python para gerar os arquivos .csv no formato normalizado e com label 

In [None]:
# Importando as bibliotecas necessárias
import os
import pandas as pd
from datetime import datetime

In [None]:
# Diretórios de entrada
base_directory = r'/workspaces/madonna'
directories = [os.path.join(base_directory, 'face'), os.path.join(base_directory, 'Insta'), os.path.join(base_directory, 'X')]

In [None]:
# Diretório de saída
output_dir = os.path.join(base_directory, 'split')

In [None]:
# Cria o diretório de saída caso não exista
os.makedirs(output_dir, exist_ok=True)

In [None]:
# Função para determinar o código de sentimento
def get_sentiment_code(sentiment):
    sentiment_map = {'neutral': 0, 'positive': 1, 'negative': 2}
    return sentiment_map.get(sentiment.lower(), 'unknown')

In [None]:
# Nomes das colunas
sentiment_column = 'sentiment'
service_column = 'SERVICE'

In [None]:
# Processa cada diretório
for directory in directories:
    if os.path.exists(directory):
        for filename in os.listdir(directory):
            if filename.endswith('.csv'):
                # Caminho completo do arquivo
                file_path = os.path.join(directory, filename)
                
                # Lê o arquivo CSV
                df = pd.read_csv(file_path)
                
                # Verifica se as colunas necessárias existem
                if sentiment_column not in df.columns or service_column not in df.columns:
                    print(f"Colunas '{sentiment_column}' ou '{service_column}' não encontradas em {file_path}. Pulando este arquivo.")
                    continue
                
                # Cabeçalho do arquivo
                header = df.columns.tolist()
                
                # Gera um novo arquivo para cada linha do CSV
                for index, row in df.iterrows():
                    sentiment = row[sentiment_column]
                    service = row[service_column]
                    sentiment_code = get_sentiment_code(sentiment)
                    date_str = datetime.now().strftime('%Y%m%d%H%M')
                    new_filename = f'{service}_{date_str}_{sentiment_code}_{index+1:07d}.csv'
                    new_file_path = os.path.join(output_dir, new_filename)
                    
                    # Escreve a linha em um novo arquivo CSV
                    row_df = pd.DataFrame([row], columns=header)
                    row_df.to_csv(new_file_path, index=False)
    else:
        print(f"Diretório não encontrado: {directory}")

print("Processamento concluído.")

Criado em 20240614 Versão Final