<a href="https://colab.research.google.com/github/jcnborges/AutomaticHWCorrector/blob/main/AITeacherAssistant.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Assistente IA para Correção de Exercícios de Programação

O assistente IA proporciona uma forma automática de corrigir exercícios de programação, pode ser usada por qualquer professor que trabalhe em um Ambiente Virtual de Aprendizagem (AVA) capaz de baixar as respostas dos estudantes em um arquivo único compactado.

# Entrada
O assistente é capaz de ler um arquivo PDF contendo o enunciado dos exercícios de programação e corrigir as respostas dos estudantes, que vem compactadas em um arquivo ZIP.

# Saída
O modelo gera um feedback personalizado para cada exercício feito pelo aluno, atribuindo uma nota de 0 a 10 e calculando a média final obtida.

# Dados de teste
Foram empregados dados reais (descaracterizados) para testar o modelo, você pode baixar os arquivos utilizados no teste:

*   Arquivo PDF contendo o enunciado dos exercícios. [Clique aqui para baixar o arquivo PDF de teste](https://raw.githubusercontent.com/jcnborges/AutomaticHWCorrector/main/teste/Lista%201%20-%20Revis%C3%A3o%20da%20linguagem%20Java.pdf)

*   Arquivo ZIP contendo a resposta de cada estudante. [Clique aqui para baixar o arquivo ZIP de teste](https://raw.githubusercontent.com/jcnborges/AutomaticHWCorrector/main/teste/respostas.zip)

# AI Gemini Systems Instructions

As seguintes instruções foram configuradas para serem aplicadas em todas as avaliações dos alunos:



```
Faça a avaliação como se fosse um professor de engenharia de software.
Use os enunciados do PDF para avaliar o exercício do aluno.
Informe se o exercício do aluno diverge do enunciado do PDF.
Atribua uma nota de 0 a 10 a cada exercício e calcule a média final.
Caso o exercício não tenha sido entregue, atribua a nota zero.
Use o nome do arquivo para inferir qual é o exercício.
Forneça um relatório padronizado:
    ## Nome do aluno: <nome> ##
    ## Exercício: <numero> ##
        * Enunciado PDF:        
        * Avaliação do código:
        * Sugestão de melhoria:
        * Nota:
    ## Média final: ##
    ## Dificuldade do aluno:   
```

In [1]:
API_KEY = "AIzaSyCLMq0XGV-L-IuIbQa8RZ_5U3f57Ej5wow"

In [2]:
import sys

if not 'PyPDF2' in sys.modules:
    !pip install -U 'PyPDF2'

# Extraindo texto de um arquivo PDF em Python
import PyPDF2
import requests
import io
import zipfile
import os

def extrair_texto_pdf_url(url):
  try:
    # Baixar o conteúdo do PDF
    response = requests.get(url)
    response.raise_for_status()

    # Criar um objeto de arquivo temporário a partir do conteúdo
    pdf_file = io.BytesIO(response.content)

    # Ler o PDF a partir do arquivo temporário
    pdf_reader = PyPDF2.PdfReader(pdf_file)

    texto_completo = ""
    for page_num in range(len(pdf_reader.pages)):
      page = pdf_reader.pages[page_num]
      texto_completo += page.extract_text()

    return texto_completo

  except requests.exceptions.RequestException as e:
    print(f"Erro ao baixar o PDF: {e}")
    return None
  except Exception as e:
    print(f"Erro ao processar o PDF: {e}")
    return None

def extrair_codigos_java_zips_aninhados(url):
  def processar_zip(zip_file, resultados):
    with zipfile.ZipFile(zip_file, 'r') as zip_ref:
      for arquivo_info in zip_ref.infolist():
        nome_arquivo = arquivo_info.filename
        if nome_arquivo.endswith(".zip"):
          # ZIP aninhado: processar recursivamente
          with zip_ref.open(nome_arquivo) as arquivo_zip_aninhado:
            processar_zip(io.BytesIO(arquivo_zip_aninhado.read()), resultados)
        elif nome_arquivo.endswith(".java"):
          # Arquivo Java: extrair o conteúdo
          with zip_ref.open(nome_arquivo) as arquivo_java:
            conteudo_arquivo = arquivo_java.read().decode('utf-8')
            tokens = nome_arquivo.split('/')
            if tokens[1] not in resultados:
                resultados[tokens[1]] = []
            resultados[tokens[1]].append(dict({"arquivo": tokens[2], "codigo": conteudo_arquivo}))
  try:
    # Baixar o conteúdo do ZIP principal
    response = requests.get(url)
    response.raise_for_status()

    # Processar o ZIP principal e seus ZIPs aninhados
    resultados = {}
    processar_zip(io.BytesIO(response.content), resultados)
    return resultados
  except requests.exceptions.RequestException as e:
    print(f"Erro ao baixar o ZIP: {e}")
    return {}
  except Exception as e:
    print(f"Erro ao processar o ZIP: {e}")
    return {}

url_pdf = 'https://raw.githubusercontent.com/jcnborges/AutomaticHWCorrector/main/teste/Lista%201%20-%20Revis%C3%A3o%20da%20linguagem%20Java.pdf'
conteudo_pdf = extrair_texto_pdf_url(url_pdf)

url_respostas = 'https://raw.githubusercontent.com/jcnborges/AutomaticHWCorrector/main/teste/respostas.zip'
respostas = extrair_codigos_java_zips_aninhados(url_respostas)

from pathlib import Path
import hashlib
import google.generativeai as genai

genai.configure(api_key=API_KEY)

# Set up the model
generation_config = {
  "temperature": 1,
  "top_p": 0.95,
  "top_k": 0,
  "max_output_tokens": 8192,
}

safety_settings = [
  {
    "category": "HARM_CATEGORY_HARASSMENT",
    "threshold": "BLOCK_MEDIUM_AND_ABOVE"
  },
  {
    "category": "HARM_CATEGORY_HATE_SPEECH",
    "threshold": "BLOCK_MEDIUM_AND_ABOVE"
  },
  {
    "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
    "threshold": "BLOCK_MEDIUM_AND_ABOVE"
  },
  {
    "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
    "threshold": "BLOCK_MEDIUM_AND_ABOVE"
  },
]

system_instruction = """
Faça a avaliação como se fosse um professor de engenharia de software.
Use os enunciados do PDF para avaliar o exercício do aluno.
Informe se o exercício do aluno diverge do enunciado do PDF.
Atribua uma nota de 0 a 10 a cada exercício e calcule a média final.
Caso o exercício não tenha sido entregue, atribua a nota zero.
Use o nome do arquivo para inferir qual é o exercício.
Forneça um relatório padronizado:
    ## Nome do aluno: <nome> ##
    ## Exercício: <numero> ##
        * Enunciado PDF:
        * Avaliação do código:
        * Sugestão de melhoria:
        * Nota:
    ## Média final: ##
    ## Dificuldade do aluno:
"""

model = genai.GenerativeModel(model_name="gemini-1.5-pro-latest",
                              generation_config=generation_config,
                              system_instruction=system_instruction,
                              safety_settings=safety_settings)

def extract_exercice_responses(aluno: str) -> list[str]:
  parts = [f"--- INICIO RESPOSTAS ALUNO ${aluno} ---"]
  exercices = []
  for ex in respostas[aluno]:
    parts.append(f"--- ARQUIVO {ex['arquivo']} ---")
    parts.append(ex['codigo'])
  return parts

print('Tudo pronto! Selecione um aluno para avaliar.\n')

alunos = []
c = 0
print('------------------')
print('idx \t nome')
print('------------------')
for r in respostas:
    alunos.append(r)
    print(f'{c} \t {r}')
    c = c + 1
print('------------------')

Collecting PyPDF2
  Downloading pypdf2-3.0.1-py3-none-any.whl (232 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m232.6/232.6 kB[0m [31m2.9 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: PyPDF2
Successfully installed PyPDF2-3.0.1
Tudo pronto! Selecione um aluno para avaliar.

------------------
idx 	 nome
------------------
0 	 aluno1
1 	 aluno2
2 	 aluno3
3 	 aluno4
4 	 aluno5
5 	 aluno6
6 	 aluno7
7 	 aluno8
8 	 aluno9
9 	 aluno10
10 	 aluno11
------------------


# Seleção do aluno para avaliação

**Não precisa mais rodar a parte de cima ;)**

Modifique o valor da variável 'idx' abaixo para selecionar o aluno a ser avaliado.

Lembrando que o **aluno11** foi sintetizado para gerar situações inesperadas e verificar a resposta do modelo. [Clique aqui para baixar a descrição desse teste](https://raw.githubusercontent.com/jcnborges/AutomaticHWCorrector/main/teste/erros_simulados.txt)

```
------------------
idx 	 nome
------------------
0 	 aluno1
1 	 aluno2
2 	 aluno3
3 	 aluno4
4 	 aluno5
5 	 aluno6
6 	 aluno7
7 	 aluno8
8 	 aluno9
9 	 aluno10
10 	 aluno11
------------------
```

In [3]:
idx = 5 # seleção do aluno
prompt_parts = [
  f"--- INICIO PDF ${url_pdf}$",
  f"--- CONTEUDO ${conteudo_pdf}$",
  *extract_exercice_responses(alunos[idx])
]

response = model.generate_content(prompt_parts)
print(response.text)

## Nome do aluno: aluno6 ##
## Exercício: 1 ##
        * Enunciado PDF:        Faça um programa em Java (F.U.P ) que pergunta um valor em metros e imprime o correspondente em decímetros, centímetros e milímetros. 
        * Avaliação do código: O código está correto e atende ao enunciado, convertendo a medida em metros para decímetros, centímetros e milímetros.
        * Sugestão de melhoria: Sem sugestões de melhoria. O código está bem escrito e cumpre o objetivo.
        * Nota: 10
## Exercício: 2 ##
        * Enunciado PDF:        F.U.P que imprime uma tabela com a tabuada de 1 a 9.  
        * Avaliação do código: O código está correto e atende ao enunciado, imprimindo a tabuada de 1 a 9 de forma organizada, formatada como uma tabela. 
        * Sugestão de melhoria: Sem sugestões de melhoria. O código está bem escrito e atende ao objetivo.
        * Nota: 10
## Exercício: 3 ##
        * Enunciado PDF:        F.U.P que leia 10 números decimais e armazene -os em um vetor, (i) calcul