# Transferência de aprendizado com Hugging Face

Um curso preparatório está buscando alternativas para que os alunos possam praticar mais a redação de textos.

Atualmente o curso preparatório consegue fazer a correção de apenas uma redação por semana para cada aluno e por conta disso, os alunos não se sentem motivados a fazer mais redações, uma vez que não terão ideia de qual seria a nota recebida nas redações extras que não serão corrigidas pelo curso.

Nosso papel nesse projeto é construir um **aplicativo de IA** para atribuir uma nota a uma redação, para que os alunos possam praticar quantas vezes quiserem e saberem se estão indo bem nos estudos.

## Explorando modelo pré-treinado

### Utilizando o hugging face pipeline

Para construir o aplicativo, precisamos de algo que consiga interpretar os textos e atribuir uma nota para a redação. Vamos utilizar um modelo pré-treinado da plataforma Hugging Face para tentar solucionar nosso problema.

Como a nossa tarefa é bem específica, vamos utilizar um modelo zero-shot que consegue fazer a classificação de um texto a partir de labels personalizadas.

Modelo zero-shot em português:

- https://huggingface.co/Mel-Iza0/zero-shot

In [3]:
!pip install -q transformers

In [5]:
from transformers import pipeline

In [6]:
classificador = pipeline("zero-shot-classification", model="Mel-Iza0/zero-shot", tokenizer="Mel-Iza0/zero-shot")

config.json: 0.00B [00:00, ?B/s]

pytorch_model.bin:   0%|          | 0.00/738M [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/738M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/407 [00:00<?, ?B/s]

spm.model:   0%|          | 0.00/2.46M [00:00<?, ?B/s]

tokenizer.json: 0.00B [00:00, ?B/s]

added_tokens.json:   0%|          | 0.00/23.0 [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/173 [00:00<?, ?B/s]

Device set to use cpu
Failed to determine 'entailment' label id from the label2id mapping in the model config. Setting to -1. Define a descriptive label2id mapping in the model config to ensure correct outputs.


In [8]:
texto = 'Com o início da era digital, a capacidade de transmissão de informações cresceu apressuradamente, o que facilitou o contato com diversos assuntos, dentre eles a educação sexual . Entretanto, surgiram paralelamente algumas questões, das quais se destacam a preocupação com o momento adequado do ingresso do tema a vida do estudante, assim como de maneira antagônica, o aumento de casos de DST´S\\xa0\\xa0e gravidez indesejada nesse período, a qual leva a um maior questionamento sobre o começo desta pauta., A falta de comunicação sobre a sexualidade entre jovens no Brasil acarreta muitas das vezes\\xa0na inserção desses em um meio repleto de dúvidas, gerando a ocorrência de doenças sexualmente transmissíveis e de gravidez precoce. Com base nisso, muitos adolescentes buscam compreender melhor essas questões na internet, local onde se podem encontrar notícias falsas ou inadequadas para seu desenvolvimento, impedindo assim a correta compreensão do assunto, assim como a responsabilidade imposta por ele., Por outro lado, o diálogo em relação à sexualidade e seus tópicos é um tabu para pais e professores, que se sentem desorientados sobre a devida hora e os devidos critérios a serem tratados com os filhos e alunos, dificultando com que esses esclareçam suas dúvidas e entenda de maneira correta, o que levaria a conscientização da seriedade dessa discussão., Em virtude do que foi mencionado, as indagações a respeito divide várias opiniões e reflexões acima do que deve ser feito. É de extrema importância o Ministério da Educação, em parceria com o Ministério da Cidadania, implantar a educação sexual na matriz curricular estudantil dos jovens, através de aulas elaboradas e destinadas ao esclarecimento de perguntas, assim como palestras e programas com a intenção de propagar o conteúdo aos estudantes, contando com o suporte dos pais, funcionários e encarregados da rede de ensino no país, para que seja realizado constantemente.'

In [9]:
classificador(texto, candidate_labels=['0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '10'])

Asking to truncate to max_length but no maximum length is provided and the model has no predefined maximum length. Default to no truncation.


{'sequence': 'Com o início da era digital, a capacidade de transmissão de informações cresceu apressuradamente, o que facilitou o contato com diversos assuntos, dentre eles a educação sexual . Entretanto, surgiram paralelamente algumas questões, das quais se destacam a preocupação com o momento adequado do ingresso do tema a vida do estudante, assim como de maneira antagônica, o aumento de casos de DST´S\\xa0\\xa0e gravidez indesejada nesse período, a qual leva a um maior questionamento sobre o começo desta pauta., A falta de comunicação sobre a sexualidade entre jovens no Brasil acarreta muitas das vezes\\xa0na inserção desses em um meio repleto de dúvidas, gerando a ocorrência de doenças sexualmente transmissíveis e de gravidez precoce. Com base nisso, muitos adolescentes buscam compreender melhor essas questões na internet, local onde se podem encontrar notícias falsas ou inadequadas para seu desenvolvimento, impedindo assim a correta compreensão do assunto, assim como a responsabil

# Realizando o deploy com gradio

Para que o aplicativo fique completo, podemos utilizar o gradio, uma ferramenta que permite interação de forma rápida e eficientes a modelos de IA

In [10]:
!pip install -q gradio

In [11]:
import gradio as gr

In [14]:
def mostrar_resultado(texto):
    return classificador(texto, candidate_labels=['0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '10'])['labels'][0]

In [15]:
app = gr.Interface(
    fn=mostrar_resultado,
    inputs=["text"],
    outputs=["text"]
)

app.launch()

It looks like you are running Gradio on a hosted Jupyter notebook, which requires `share=True`. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://eb85b81a29e7f6a7a3.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)


