
# Demonstração de Uso de Ferramentas para Manipulação de Modelos de Linguagem

Nesta seção, aplicamos os conceitos apresentados nas seções anteriores em uma demonstração prática. Vamos explorar o uso de um modelo de linguagem generativa pré-treinado, desde a inicialização até a geração de texto, com exemplos claros e objetivos.

**Objetivo da demonstração:**
* Mostrar como carregar e usar um modelo pré-treinado da biblioteca Hugging Face.
* Gerar texto a partir de prompts personalizados.
* Explorar como diferentes configurações de parâmetros impactam os resultados.
* Ao final, você será capaz de utilizar modelos de linguagem para tarefas práticas como geração de texto criativo, resumos ou respostas para perguntas específicas.








# Instalar a biblioteca Transformers (caso não esteja instalada)

In [1]:
!pip install transformers

Collecting transformers
  Obtaining dependency information for transformers from https://files.pythonhosted.org/packages/96/f2/25b27b396af03d5b64e61976b14f7209e2939e9e806c10749b6d277c273e/transformers-4.52.4-py3-none-any.whl.metadata
  Downloading transformers-4.52.4-py3-none-any.whl.metadata (38 kB)
Collecting filelock (from transformers)
  Obtaining dependency information for filelock from https://files.pythonhosted.org/packages/4d/36/2a115987e2d8c300a974597416d9de88f2444426de9571f4b59b2cca3acc/filelock-3.18.0-py3-none-any.whl.metadata
  Downloading filelock-3.18.0-py3-none-any.whl.metadata (2.9 kB)
Collecting huggingface-hub<1.0,>=0.30.0 (from transformers)
  Obtaining dependency information for huggingface-hub<1.0,>=0.30.0 from https://files.pythonhosted.org/packages/33/fb/53587a89fbc00799e4179796f51b3ad713c5de6bb680b2becb6d37c94649/huggingface_hub-0.33.0-py3-none-any.whl.metadata
  Downloading huggingface_hub-0.33.0-py3-none-any.whl.metadata (14 kB)
Collecting numpy>=1.17 (from tr


[notice] A new release of pip is available: 23.2.1 -> 25.1.1
[notice] To update, run: python.exe -m pip install --upgrade pip


# Carregando o Modelo

In [2]:
# Importa as classes para trabalhar com modelos e tokenizadores
from transformers import AutoModelForCausalLM, AutoTokenizer

# Define o nome de um modelo treinado para português
# model_name = "pierreguillou/gpt2-small-portuguese"  # Modelo GPT-2 adaptado para Português/BR
model_name = "CEIA-UFG/Gemma-3-Gaia-PT-BR-4b-it"    # Modelo em Português/BR - Google + CEIA/UFG

# Carrega o modelo e o tokenizador correspondentes
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

None of PyTorch, TensorFlow >= 2.0, or Flax have been found. Models won't be available and only tokenizers, configuration and file/data utilities can be used.


tokenizer_config.json:   0%|          | 0.00/1.16M [00:00<?, ?B/s]

To support symlinks on Windows, you either need to activate Developer Mode or to run Python as an administrator. In order to activate developer mode, see this article: https://docs.microsoft.com/en-us/windows/apps/get-started/enable-your-device-for-development
Xet Storage is enabled for this repo, but the 'hf_xet' package is not installed. Falling back to regular HTTP download. For better performance, install the package with: `pip install huggingface_hub[hf_xet]` or `pip install hf_xet`


tokenizer.model:   0%|          | 0.00/4.69M [00:00<?, ?B/s]

Xet Storage is enabled for this repo, but the 'hf_xet' package is not installed. Falling back to regular HTTP download. For better performance, install the package with: `pip install huggingface_hub[hf_xet]` or `pip install hf_xet`


tokenizer.json:   0%|          | 0.00/33.4M [00:00<?, ?B/s]

added_tokens.json:   0%|          | 0.00/35.0 [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/662 [00:00<?, ?B/s]

ImportError: 
AutoModelForCausalLM requires the PyTorch library but it was not found in your environment. Checkout the instructions on the
installation page: https://pytorch.org/get-started/locally/ and follow the ones that match your environment.
Please note that you may need to restart your runtime after installation.


# Gerando Texto a Partir de um Prompt

In [None]:
# Define o prompt inicial que será usado como entrada para o modelo
prompt = """
Escreva um parágrafo em português sobre como a inteligência artificial está transformando o setor de saúde.
Foque em exemplos como diagnósticos precisos, análise de dados médicos e personalização de tratamentos.
"""

# Tokeniza o prompt, convertendo-o em tensores que o modelo pode processar
# - return_tensors="pt": Retorna os tokens no formato de tensor PyTorch
inputs = tokenizer.encode(prompt, return_tensors="pt")

# Gera texto com base no prompt tokenizado
outputs = model.generate(
    inputs,
    max_length=200,  # Limita o comprimento da saída
    num_return_sequences=1,  # Gera uma sequência
    temperature=0.9,  # Controla a criatividade do texto
    do_sample=True,  # Ativa amostragem aleatória
    pad_token_id=tokenizer.eos_token_id,  # Define o token de preenchimento
    top_p=0.95,
    eos_token_id=None
)

# Decodifica os tokens gerados de volta para texto legível
# - skip_special_tokens=True: Remove tokens especiais, como "<|endoftext|>"
generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)

# Exibe o texto gerado
print(generated_text)


Escreva um parágrafo em português sobre como a inteligência artificial está transformando o setor de saúde.
Foque em exemplos como diagnósticos precisos, análise de dados médicos e personalização de tratamentos.
A ciência é um campo multidisciplinar em que diversas especialidades são usadas, o que tem gerado muitos debates. Os principais ramos dessa ciência são: neurociência, neurobiológicas, neurofisiologia, neurofisiologia animal, neurobiologia, genética e ciências biológicas. O termo ciências é derivado do latim "scramma", uma palavra alemã que significa "observação" ou "responsabilidade", por ter uma conotação filosófica.

Existem diversas áreas em que a ciência atua, muitas delas, de acordo com a própria ciência. As primeiras incluem a medicina, a neurologia, a etnografia e o neuropsicologia, mas as áreas atuais incluem a genética, a genética biológica, a neurocirurgia, a biofísica, a neurologia da informação, a neurociência cognitiva, a neurociência


# Prompt para gerar um resumo

In [None]:
# Prompt para gerar um resumo
prompt = "Resuma o seguinte texto em poucas palavras: A reciclagem é importante porque reduz resíduos, economiza energia e protege o meio ambiente."

# inputs = tokenizer.encode(prompt, return_tensors="pt")

# outputs = model.generate(inputs, max_length=60, num_return_sequences=1, temperature=0.7)

# Define 'input_ids' e 'attention_mask' usando padding para limite/ajuste
inputs = tokenizer(prompt, return_tensors="pt", padding=True)

# Geração do texto
outputs = model.generate(inputs["input_ids"], attention_mask=inputs["attention_mask"],
max_length=60, num_return_sequences=1, temperature=0.7, do_sample=True, pad_token_id=tokenizer.eos_token_id)

print(tokenizer.decode(outputs[0], skip_special_tokens=True))

Resuma o seguinte texto em poucas palavras: A reciclagem é importante porque reduz resíduos, economiza energia e protege o meio ambiente.

Para conseguir reciclagem, é preciso de um bom plano de reciclagem, com boa ênfase na reciclagem de lixo e reciclagem de resíduos sólidos, que são difíceis de se mover
