<h1/>Introdução a LLMs 🤖</h1>

<h3/>O que são LLMs?</h3>

LLMs(Large Language Models) são algoritmos de inteligência artificial, que aplicam técnicas de rede neurais para realização de processamento da linguagem humana ou texto usando <a href="https://www.ibm.com/br-pt/think/topics/self-supervised-learning"/>aprendizado autossupervisionado</a>. As principais tarefas que esses modelos realizam são: Geração de texto, tradução, resumos, geração de imagem e chat-bots.

A seguir uma imagem mostrando a evolução do surgimento de LLMs no mercado:

<img src="https://infohub.delltechnologies.com/static/media/13f83181-93ad-4024-a34b-26de431d4d17.png"/>

<h3>Como Funcionam?</h3>

Basicamente, os LLMs funcionam com o principio do <a href="https://www.ibm.com/br-pt/think/topics/deep-learning"/>Deep Learning</a>, fazendo uso das arquiteturas de redes neurais para processamento da linguagem humana. Geralmente esses modelos são treinados com grandes <a href="https://www.ibm.com/br-pt/think/topics/dataset"/>datasets</a> usando a técnica de aprendizado autossupervisionado, a base de suas funcionalidades irá variar com o relacionamento e padrões linguísticos presentes nos dados usados para seu treinamento. A arquitetura de um LLM consiste em várias camadas, as principais sendo as camadas de avanço(feedfoward layers), camadas de incorporação(embeddings layers) e as camadas de atenção(attention layers).

A seguir uma imagem contendo um diagrama de como as camadas se comportam:

<img src="https://media.geeksforgeeks.org/wp-content/uploads/20230531140926/Transformer-python-(1).png"/>

Outros componentes que influenciam na arquitetura dos LLMs são:
<ul/>
    <li>Tamanho do modelo e quantidade de <a href="https://pt.dataconomy.com/2025/05/08/parametros-llm/">parâmetros</a></li>
    <li>Representação do input</li>
    <li>Eficiência computacional</li>
    <li>Mecanismos de auto-atenção</li>
    <li>Objetivos de treino</li>
    <li>Decodificação e geração de output</li>
</ul>

<h3>Aplicação dos LLMs</h3>

Atualmente os LLMs exercem as seguintes tarefas:
<ul>
    <li>
    <b/>Geração de Código:</b> Os LLMs conseguem gerar códigos basedos na instrução do usuário para tarefas específicas.
    </li>
    <li>
    <b/>Debugging e Documentação:</b> Os mesmos podem ser utilizados para indentificação de erros em código e automatização de documentações de projetos.
    </li>
    <li>
    <b/>Responder Perguntas:</b> O usuário pode realizar perguntas simples ou complexas, gerando respostas com contextos concisos.
    </li>
    <li>
    <b/>Tradução e Correção Liguística:</b> Esses modelos também realização traduções e correções gramaticais na maioria das linguas.
    </li>   
</ul>

Atualmente, existem diversas aplicações no mercado que fazem uso de Modelos de Linguagem de Grande Escala (LLMs). A OpenAI é uma das mais conhecidas, com o ChatGPT, mas não é a única a oferecer soluções em larga escala baseadas nessa tecnologia. Outras empresas também têm se destacado, como o Google, com o Gemini; a DeepSeek; e a Microsoft, com o Copilot. Além disso, há aplicações voltadas para propósitos específicos, como o GitHub Copilot, focado em programação, e o DALL·E, da própria OpenAI, voltado para geração de imagens. Devido à sua natureza adaptativa, a tendência é que o uso de LLMs continue crescendo de forma significativa nos mais diversos setores.

<h3>Exemplo Prático</h3>

Nesse exemplo usaremos a biblioteca <a href="https://huggingface.co/transformers/v3.0.2/index.html">Transformers</a> do <a href="https://huggingface.co/">Hugginface</a> que é uma plataforma colaborativa voltada pra IA, semelhante ao GitHub, nele temos uma vasta coleção de modelos, datasets, entre outras informações sobre IA. para iniciarmos precisamos configurar o ambiente e instalar as dependências nescessárias.


In [4]:
!pip install transformers

Looking in indexes: https://anu9rng:****@rb-artifactory.bosch.com/artifactory/api/pypi/python-virtual/simple



[notice] A new release of pip is available: 24.2 -> 25.1.1
[notice] To update, run: python.exe -m pip install --upgrade pip


Também é necessário a instalação do pytorch, a mesma é uma biblioteca pra dessenvolvimento de IA, sendo uma das depêndencias para rodar os LLMs.

In [5]:
!pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113

Looking in indexes: https://anu9rng:****@rb-artifactory.bosch.com/artifactory/api/pypi/python-virtual/simple, https://download.pytorch.org/whl/cu113



[notice] A new release of pip is available: 24.2 -> 25.1.1
[notice] To update, run: python.exe -m pip install --upgrade pip


Usaremos o GPT2 como exemplo para geração de texto.

In [6]:
from transformers import pipeline, set_seed
import torch
import os

#Configuração de proxy, mantenha-se fora do proxy antes de rodar
os.environ['HTTP_PROXY'] = ''
os.environ['HTTPS_PROXY'] = ''

#A Classe pipeline abstrai conceitos, facilitando a conexão direta com huggin face e utilização dos LLMs.
generator = pipeline('text-generation', model='gpt2')

#Essa inicializa um gerador de números pseudoaleatórios.
set_seed(42)

#Aqui definimos o texto base, o cumprimento máximo do texto que será gerado e o numero de retornos.
generator("Hello, I'm a language model,", max_length=30, num_return_sequences=5)

Device set to use cpu
Truncation was not explicitly activated but `max_length` is provided a specific value, please use `truncation=True` to explicitly truncate examples to max length. Defaulting to 'longest_first' truncation strategy. If you encode pairs of sequences (GLUE-style) with the tokenizer you can select this strategy more precisely by providing a specific strategy to `truncation`.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
Both `max_new_tokens` (=256) and `max_length`(=30) seem to have been set. `max_new_tokens` will take precedence. Please refer to the documentation for more information. (https://huggingface.co/docs/transformers/main/en/main_classes/text_generation)


[{'generated_text': "Hello, I'm a language model, I'm a language model. In my mind, I'm doing the same thing as you. All these different people are thinking about the same thing.\n\nI'm not talking about what the computer program does. I'm talking about what I'm thinking about. I'm thinking about what my body is thinking about. I'm thinking about what I'm making it. I'm thinking about what I'm making it. What my body is doing. I'm thinking about what my body is thinking about. What's my body doing? What's my body doing? What's my body doing?\n\nLet's talk about this, I'm not a computer programmer. I'm not a software developer. I'm not a computer programmer. I'm not a language model. I'm not a language model. My body is thinking about what I'm doing. What is my body doing? What's my body doing? What's my body doing?\n\nNow, I'm not saying that this is a good thing. But if you want to get better at programming, you can get better at writing. You can get better at being human. You can get

Isso é um exemplo básico de utilização, podendo ser adaptado para diversas tarefas e casos de uso por meio de fine tuning, porém isso requer uso de um bom hardware e principalmente uma boa GPU, para realização de treinamentos mais específicos

<h3>Benefícios dos LLM</h3>

Os LLMs (Modelos de Linguagem de Grande Escala) são capazes de realizar o <a href="https://www.ibm.com/br-pt/think/topics/zero-shot-learning">aprendizado zero-shot</a>. Isso significa que conseguem generalizar tarefas para as quais não foram explicitamente treinados, permitindo que se adaptem a novos cenários sem a necessidade de treinamento adicional.
Outro benefício importante é a capacidade de manipular e compreender grandes volumes de dados, o que se aplica, por exemplo, à tradução de idiomas e à geração de resumos de documentos.
Além disso, os LLMs podem passar por <a href="http://ibm.com/br-pt/think/topics/fine-tuning">fine-tuning</a> com conjuntos de dados específicos, o que permite que se mantenham em constante evolução e adaptação a diferentes casos de uso na indústria.
Por fim, esses modelos automatizam uma ampla variedade de tarefas, como geração de código e criação de conteúdo, otimizando tempo e reduzindo a necessidade de mão de obra em atividades repetitivas, permitindo que os recursos humanos sejam direcionados a demandas mais estratégicas e específicas dentro de um projeto.

<h3>Conclusão</h3>

Diante dos tópicos abordados, é possível afirmar com segurança que os LLMs (Modelos de Linguagem de Grande Escala) já se tornaram uma parte fundamental dos avanços tecnológicos na indústria. Sua presença é cada vez mais evidente em soluções inovadoras, integrando-se a fluxos de trabalho, produtos e serviços de maneira estratégica.
A tendência é de avanços contínuos e cada vez mais expressivos nessa tecnologia. Praticamente todas as big techs — como Google, Microsoft, Meta, Amazon e OpenAI — já desenvolvem e oferecem soluções baseadas em LLMs, investindo pesadamente em pesquisa e desenvolvimento para ampliar a capacidade e eficiência desses modelos.