# Classificação de Dúvidas em Categorias de Ensino

Este código exemplifica o processo de classificação de uma dúvida em uma das categorias de ensino. 

O objetivo é receber uma pergunta e determinar em qual categoria de ensino ela se enquadra. Para isso, utilizamos o módulo `API`.

A pergunta é definida como uma string e passada como argumento para a função `get_classification()`. A função retorna a categoria de ensino correspondente à pergunta.

- Funções utilizadas:
    - `get_classification(pergunta)`: Retorna a categoria de ensino correspondente à pergunta.
    - `is_classification_valid(classification, response)`: Retorna `True` se a classificação da pergunta for válida, e `False` caso contrário.
    - `evalue_classification()`: Retorna a acurácia do prompt.

Para a instalação das bibliotecas necessárias, execute o comando abaixo:

```bash
!pip install -r requirements.txt
```

Para o pleno funcionamento da aplicação, você deve ter uma chave de acesso para a API da OpenAI e inseri-la no campo `api_key` do módulo `API`.

- **Como gerar chave openai?** : Para obter uma chave de acesso para a API da OpenAI, siga estes passos:

        Acesse o site da OpenAI em https://openai.com/.
        Clique em "Sign up" ou "Get started" para criar uma conta.
        Preencha o formulário de registro com suas informações pessoais.
        Após criar sua conta, faça login no site da OpenAI.
        Navegue até a seção de "APIs" ou "Developers" no site.
        Procure pela opção de "API Key" ou "Generate API Key".
        Clique nessa opção para gerar uma nova chave de acesso.
        Copie a chave de acesso gerada.
        Guarde essa chave de acesso em um local seguro, pois ela será necessária para autenticar suas solicitações à API da OpenAI.
        Certifique-se de ler e seguir os termos de uso e as políticas de privacidade da OpenAI ao utilizar a API.

**Aqui está o código de exemplo:**



In [None]:
import API

def main(pergunta):

    completion = API.get_classification(pergunta)

    print(completion)

pergunta = """ 
Entre as consequências da Expansão Marítima,
não encontramos 
a) a formação do Sistema Colonial.
b) o desenvolvimento do eurocentrismo.
c) a expansão do regime assalariado da Europa para a
América.
d) início do processo de acumulação de capitais.
impulsionando o modo de produção capitalista.
e) introdução do trabalho escravo na América.
"""
main(pergunta)

**Como utilizar o código?**
- Execute o código e escreva sua dúvida, em seguida aperte ENTER.

In [None]:
import API

def main(pergunta):

    completion = API.get_classification(pergunta)

    print(completion)
    
pergunta = input("Digite a pergunta: ")
main(pergunta)

**Teste de acertividade:**
- Envie sua dúvida e a categoria de ensino esperada.


In [None]:
import API
import difflib

materias = ["Matemática", "Física", "Química", "Biologia", "História", "Geografia", "Filosofia", "Sociologia", "Inglês", "Espanhol", "Português", "Artes", "Educação Física", "Literatura", "Redação"]
pergunta = input("Digite a pergunta: ")
materia = difflib.get_close_matches(input("Digite a matéria: "), materias, n=1, cutoff=0.7)[0]

guess = API.get_classification(pergunta)

print("Sua pergunta é de", materia)
print(f"O modelo acha que a pergunta é de {guess}")


API.is_classification_valid(materia, guess)

**Teste com entradas fornecidas:**

**Química:**

- Pergunta: Olá, como são formadas as cavernas? E as estalactites e estalagmites?

**Biologia:**

- Pergunta: Qual a diferença entre a gordura animal e a gordura vegetal hidrogenada?

- Pergunta: Boa tarde! Qual a relação das mitocôndrias com a síntese proteica?

**Matemática:**

- Pergunta: Como funciona a relação do ângulo externo do triângulo com os outros dois ângulos internos do triângulo?

- Pergunta (UESB BA/2017): Sejam dois conjuntos não vazios, quaisquer, X e Y, satisfazendo a seguinte propriedade: “A quantidade de subconjuntos de X é o dobro da quantidade de subconjuntos de Y”. Considerando-se n (X) o número de elementos do conjunto X, e n (Y), o número de elementos do conjunto Y, é correto afirmar que n (X) é igual a... (opções de resposta numeradas)

**História:**

- Pergunta: Entre as consequências da Expansão Marítima, não encontramos...

**Literatura:**

- Pergunta: Ainda não entendi o que significa eu lírico, pode me explicar?

**Matemática:**

- Pergunta: Quanto vale 18 rad?

- Pergunta: Se {-1; 2x+y; 2; 3; 1} = {2; 4; x-y; 1; 3}, então... (opções de resposta numeradas)

**Física:**

- Pergunta: Olá, todos os conceitos de potencial (potencial gravitacional, potencial elétrico, etc) utilizam noções de trabalho? Por quê?    

In [None]:
import API
import asyncio
import nest_asyncio
nest_asyncio.apply()

evaluate_tax = asyncio.run(API.evaluate_classification())
print(f"{evaluate_tax} % das classificações estão corretas")

**Respondendo ao desenho da pesquisa**
    
- Primeiramente, a taxa de acerto: "Acredito que se adotarmos um modelo de LLM como ChatGPT ou Lhama, necessitariamos usar de LoRa, treinando camadas especializadas para cada categoria de ensino/ tarefa de classificação, e assim, teríamos uma taxa de acerto mais elevada gastando menos recursos computacionais, visto que o reajuste de uma tarefa específica como classificação geralmente não necessita de grandes reajustes nas camadas."

- Custo: "No longo prazo, LLMS como o ChatGPT tornam-se custosas, em eficiência temporal e em custo financeiro, principalmente com um trânsito alto de requisições. Acredito que uma rede neural de classificação binária aplicada pra cada matéria usando as strings de dúvida como entrada, em formato de tokens, e as categorias de ensino como saída, seria mais eficiente e menos custosa, levando em conta que dados de treino são obtidos diariamente pelo aplicativo do TutorMundi e podem retroalimentar o modelo."

- Velocidade de resposta: "Uma request pra uma API é temporalmente custoso e depende da disponibilidade do servidor da OpenAI, este problema é evitado com uma rede de classificação operando dentro de um servidor próprio e que pode ser acessado por uma API própria, além de."