# Explicação do Código

## O que o código faz:
1. **Carregamento de Arquivos CSV**:
   - Carrega dois arquivos CSV usando `pandas`:
     - `actions_data.csv`: contém informações sobre tempos e eventos relacionados a ações.
     - `executions.csv`: contém informações sobre interações e resultados relacionados às execuções.

2. **Renomeação de Colunas**:
   - Renomeia algumas colunas dos dois arquivos para facilitar a combinação e tornar os nomes mais descritivos:
     - No `actions_data.csv`:
       - `code_time` → `tempo_implementacao`
       - `num_events` → `num_eventos`
       - `num_deletes` → `num_eventos_del`
     - No `executions.csv`:
       - `num_submissions` → `num_submissoes`
       - `num_students_interactions` → `num_consultas`
       - `amount_of_change` → `qtd_alteracoes_codigo`

3. **União dos Dados**:
   - Combina os dois DataFrames com base na coluna `question`, utilizando um merge à esquerda (`how='left'`), o que preserva todas as linhas de `executions.csv`.

4. **Seleção de Colunas**:
   - Cria um novo DataFrame contendo apenas as colunas relevantes para a análise:
     - `question`, `tempo_implementacao`, `num_eventos`, `num_eventos_del`, `num_consultas`, `num_submissoes`, `num_tests`, `num_correct`, `num_errors`, `num_logic_errors`, `num_syntax_errors`, `qtd_alteracoes_codigo`.

5. **Exportação para CSV**:
   - Salva o DataFrame resultante em um novo arquivo chamado `resultado.csv`.

6. **Mensagem de Sucesso**:
   - Exibe uma mensagem no console indicando que o arquivo foi gerado com sucesso.

## Resultado:
- Um arquivo CSV chamado `resultado.csv`, contendo as colunas combinadas e selecionadas dos dois arquivos originais, está pronto para ser usado em análises ou relatórios.


In [3]:
import pandas as pd

# Carregar os dois arquivos CSV
df1 = pd.read_csv(r'output/metrics/actions_data.csv')  # Primeiro arquivo com os tempos e eventos
df2 = pd.read_csv(r'output/metrics/executions.csv')  # Segundo arquivo com as interações e resultados

# Renomear colunas para facilitar a combinação
df1.rename(columns={
    'code_time': 'tempo_implementacao',
    'num_events': 'num_eventos',
    'num_deletes': 'num_eventos_del'
}, inplace=True)

# Renomear colunas do segundo DataFrame
df2.rename(columns={
    'num_submissions': 'num_submissoes',
    'num_students_interactions': 'num_consultas',  # Renomeando para compatibilidade
    'amount_of_change': 'qtd_alteracoes_codigo'  # Renomeando para compatibilidade
}, inplace=True)

# Unir os DataFrames com base na coluna 'question'
merged_df = pd.merge(df2, df1, on='question', how='left')

# Selecionar apenas as colunas desejadas para o novo DataFrame
final_df = merged_df[['question', 'tempo_implementacao', 'num_eventos', 'num_eventos_del', 
                       'num_consultas', 'num_submissoes',  # Usando 'num_consultas' renomeado
                       'num_tests', 'num_correct', 'num_errors', 
                       'num_logic_errors', 'num_syntax_errors', 'qtd_alteracoes_codigo']]  # Usando 'qtd_alteracoes_codigo' renomeado

# Salvar o DataFrame resultante em um novo arquivo CSV
final_df.to_csv('resultado.csv', index=False)

print("Arquivo 'resultado.csv' gerado com sucesso!")


Arquivo 'resultado.csv' gerado com sucesso!


## Explicação do Código

Este código tem como objetivo ler um arquivo CSV, manipular os dados e salvar um novo arquivo com os resultados. O processo é o seguinte:

1. **Leitura do arquivo CSV**: 
   O arquivo `'unified_solutions.csv'` é carregado em um DataFrame utilizando a biblioteca `pandas`.

2. **Criação de nova coluna**:
   Uma nova coluna chamada `'id'` é criada, copiando os valores da coluna `'assignment'`.

3. **Remoção de duplicatas**:
   A coluna `'id'` é filtrada para remover duplicatas, criando um novo DataFrame com valores únicos.

4. **Salvamento dos dados**:
   O novo DataFrame é salvo em um arquivo CSV chamado `'assessments.csv'`.

5. **Mensagem de sucesso**:
   Uma mensagem é exibida para informar que o arquivo de saída foi criado com sucesso.

### Código

```python
import pandas as pd

input_file = 'unified_solutions.csv'
output_file = 'assessments.csv'

df = pd.read_csv(input_file)
df['id'] = df['assignment']
df_output = df[['id']].drop_duplicates()

df_output.to_csv(output_file, index=False)

print(f"Arquivo '{output_file}' criado com sucesso!")


In [None]:
import pandas as pd

# Caminho do arquivo de entrada e nome do arquivo de saída
input_file = 'unified_solutions.csv'  # Substitua pelo nome do seu arquivo CSV
output_file = 'assessments.csv'

# Carrega o CSV de entrada
df = pd.read_csv(input_file)

# Cria a coluna 'id' a partir da coluna 'assignment'
df['id'] = df['assignment']

# Remove duplicatas da coluna 'id'
df_output = df[['id']].drop_duplicates()

# Salva o novo DataFrame em um arquivo CSV
df_output.to_csv(output_file, index=False)

print(f"Arquivo '{output_file}' criado com sucesso!")


# Explicação do Código

## O que o código faz:

1. **Importação do Módulo CSV**:
   - Utiliza o módulo `csv` do Python para manipular arquivos CSV.

2. **Função para Leitura de CSV**:
   - A função `ler_csv`:
     - Recebe o nome de um arquivo CSV.
     - Lê o conteúdo do arquivo e retorna uma lista de dicionários, onde cada linha do CSV é representada como um dicionário.

3. **Leitura dos Arquivos de Entrada**:
   - `dados_question`: Contém informações sobre as questões (ex.: tempo de implementação, número de eventos, etc.), lido de `resultado.csv`.
   - `dados_respostas`: Contém informações adicionais sobre as questões (ex.: dificuldade, discriminação, etc.), lido de `questoes_ordenadas.csv`.

4. **Combinação dos Dados**:
   - Para cada questão em `dados_question`:
     - Procura a questão correspondente em `dados_respostas` (compara a coluna `id` com `question`).
     - Cria um novo registro com informações combinadas de ambos os arquivos.

5. **Estrutura do Novo Registro**:
   - As informações do novo registro incluem:
     - Dados da questão (`tempo_implementacao`, `num_eventos`, `num_tests`, etc.).
     - Dados adicionais das respostas (`dificuldade`, `discriminacao`, etc.).

6. **Escrita do Arquivo Resultante**:
   - Salva os registros combinados em um novo arquivo chamado `question_new_info.csv`:
     - Escreve um cabeçalho com os nomes das colunas.
     - Adiciona as linhas dos registros combinados.

7. **Mensagem de Sucesso**:
   - Exibe uma mensagem no console indicando que os dados foram combinados e salvos com sucesso.

## Resultado:
- Um arquivo CSV chamado `question_new_info.csv` é gerado, contendo informações combinadas de `resultado.csv` e `questoes_ordenadas.csv`.
- Esse arquivo pode ser usado para análises completas das questões e suas respectivas métricas.


In [None]:
import csv

# Função para ler um CSV e retornar como uma lista de dicionários
def ler_csv(nome_arquivo):
    with open(nome_arquivo, mode='r', newline='') as arquivo_csv:
        leitor = csv.DictReader(arquivo_csv)
        return [linha for linha in leitor]

# Lendo os arquivos CSV de entrada
dados_question = ler_csv(r'resultado.csv')
dados_respostas = ler_csv(r'..\..\Etapa_3\questoes_ordenadas.csv')

# Criar um novo registro para cada linha de dados_question
resultados = []

for question in dados_question:
    # Encontrar a resposta correspondente
    for resposta in dados_respostas:
        if int(resposta['id']) == int(question['question']):
            novo_registro = {
                "question": question['question'],
                "tempo_implementacao": question['tempo_implementacao'],
                "num_eventos": question['num_eventos'],
                "num_eventos_del": question['num_eventos_del'],
                "num_consultas": question['num_consultas'],
                "num_submissoes": question['num_submissoes'],
                "num_tests": question['num_tests'],
                "num_correct": question['num_correct'],
                "num_errors": question['num_errors'],
                "num_logic_errors": question['num_logic_errors'],
                "num_syntax_errors": question['num_syntax_errors'],
                "qtd_alteracoes_codigo": question['qtd_alteracoes_codigo'],
                "dificuldade": resposta['dificuldade'],
                "discriminacao": resposta['discriminacao'],
                "respostas": resposta['respostas'],
                "usuarios_respondidos": resposta['usuarios_respondidos']
            }
            resultados.append(novo_registro)

# Escrever os resultados em um novo arquivo CSV
with open('question_new_info.csv', mode='w', newline='') as arquivo_csv:
    campos = resultados[0].keys()
    escritor_csv = csv.DictWriter(arquivo_csv, fieldnames=campos)

    escritor_csv.writeheader()
    escritor_csv.writerows(resultados)

print("Dados combinados e salvos em question_new_info.csv")


In [None]:
import pandas as pd

def ordenar_question(arquivo_question):
    # Ler o arquivo CSV
    question_df = pd.read_csv(arquivo_question)

    # Ordenar o DataFrame pela coluna 'question'
    question_df_sorted = question_df.sort_values(by='question', ascending=True)

    # Sobrescrever o arquivo original com o DataFrame ordenado
    question_df_sorted.to_csv(arquivo_question, index=False)

    print(f"Arquivo '{arquivo_question}' foi ordenado e salvo com sucesso.")

# Exemplo de uso
arquivo_question = 'question_new_info.csv'
ordenar_question(arquivo_question)


In [None]:
import pandas as pd

def comparar_e_gerar_csv(arquivo_question, arquivo_metrics, arquivo_saida):
    # Ler os arquivos CSV
    question_df = pd.read_csv(arquivo_question)
    metrics_df = pd.read_csv(arquivo_metrics)

    # Renomear a coluna 'question' para 'question_id' em question_df para facilitar a junção
    question_df.rename(columns={'question': 'question_id'}, inplace=True)

    # Fazer a junção dos DataFrames com base na coluna 'question_id'
    merged_df = pd.merge(metrics_df, question_df, on='question_id', how='inner')

    # Ordenar o DataFrame resultante com base na ordem de 'question_id' do question_df original
    merged_df = merged_df.sort_values(by='question_id')

    # Selecionar as colunas que você deseja manter
    colunas_a_manter = metrics_df.columns.tolist()  # Manter todas as colunas do metrics_df

    # Salvar o DataFrame resultante em um novo arquivo CSV
    merged_df.to_csv(arquivo_saida, columns=colunas_a_manter, index=False)

# Exemplo de uso com uma string "raw"
comparar_e_gerar_csv(
    'question_new_info.csv', 
    r'output/data/code_metrics_professor.csv', 
    'code_metrics_professor_util.csv'
)

print("Arquivo gerado: code_metrics_professor_util.csv")



# Ler o arquivo CSV
df = pd.read_csv('code_metrics_professor_util.csv')

# Renomear a coluna 'question_id' para 'question'
df.rename(columns={'question_id': 'question'}, inplace=True)

# Salvar o DataFrame com o novo nome da coluna
df.to_csv('code_metrics_professor_util.csv', index=False)

print("Nome da coluna alterado com sucesso no arquivo 'code_metrics_professor_util.csv'.")
