<h1/>Introdu√ß√£o a LLMs ü§ñ</h1>

<h3/>O que s√£o LLMs?</h3>

LLMs(Large Language Models) s√£o algoritmos de intelig√™ncia artificial, que aplicam t√©cnicas de rede neurais para realiza√ß√£o de processamento da linguagem humana ou texto usando <a href="https://www.ibm.com/br-pt/think/topics/self-supervised-learning"/>aprendizado autossupervisionado</a>. As principais tarefas que esses modelos realizam s√£o: Gera√ß√£o de texto, tradu√ß√£o, resumos, gera√ß√£o de imagem e chat-bots.

A seguir uma imagem mostrando a evolu√ß√£o do surgimento de LLMs no mercado:

<img src="https://infohub.delltechnologies.com/static/media/13f83181-93ad-4024-a34b-26de431d4d17.png"/>

<h3>Como Funcionam?</h3>

Basicamente, os LLMs funcionam com o principio do <a href="https://www.ibm.com/br-pt/think/topics/deep-learning"/>Deep Learning</a>, fazendo uso das arquiteturas de redes neurais para processamento da linguagem humana. Geralmente esses modelos s√£o treinados com grandes <a href="https://www.ibm.com/br-pt/think/topics/dataset"/>datasets</a> usando a t√©cnica de aprendizado autossupervisionado, a base de suas funcionalidades ir√° variar com o relacionamento e padr√µes lingu√≠sticos presentes nos dados usados para seu treinamento. A arquitetura de um LLM consiste em v√°rias camadas, as principais sendo as camadas de avan√ßo(feedfoward layers), camadas de incorpora√ß√£o(embeddings layers) e as camadas de aten√ß√£o(attention layers).

A seguir uma imagem contendo um diagrama de como as camadas se comportam:

<img src="https://media.geeksforgeeks.org/wp-content/uploads/20230531140926/Transformer-python-(1).png"/>

Outros componentes que influenciam na arquitetura dos LLMs s√£o:
<ul/>
    <li>Tamanho do modelo e quantidade de <a href="https://pt.dataconomy.com/2025/05/08/parametros-llm/">par√¢metros</a></li>
    <li>Representa√ß√£o do input</li>
    <li>Efici√™ncia computacional</li>
    <li>Mecanismos de auto-aten√ß√£o</li>
    <li>Objetivos de treino</li>
    <li>Decodifica√ß√£o e gera√ß√£o de output</li>
</ul>

<h3>Aplica√ß√£o dos LLMs</h3>

Atualmente os LLMs exercem as seguintes tarefas:
<ul>
    <li>
    <b/>Gera√ß√£o de C√≥digo:</b> Os LLMs conseguem gerar c√≥digos basedos na instru√ß√£o do usu√°rio para tarefas espec√≠ficas.
    </li>
    <li>
    <b/>Debugging e Documenta√ß√£o:</b> Os mesmos podem ser utilizados para indentifica√ß√£o de erros em c√≥digo e automatiza√ß√£o de documenta√ß√µes de projetos.
    </li>
    <li>
    <b/>Responder Perguntas:</b> O usu√°rio pode realizar perguntas simples ou complexas, gerando respostas com contextos concisos.
    </li>
    <li>
    <b/>Tradu√ß√£o e Corre√ß√£o Ligu√≠stica:</b> Esses modelos tamb√©m realiza√ß√£o tradu√ß√µes e corre√ß√µes gramaticais na maioria das linguas.
    </li>   
</ul>

Atualmente, existem diversas aplica√ß√µes no mercado que fazem uso de Modelos de Linguagem de Grande Escala (LLMs). A OpenAI √© uma das mais conhecidas, com o ChatGPT, mas n√£o √© a √∫nica a oferecer solu√ß√µes em larga escala baseadas nessa tecnologia. Outras empresas tamb√©m t√™m se destacado, como o Google, com o Gemini; a DeepSeek; e a Microsoft, com o Copilot. Al√©m disso, h√° aplica√ß√µes voltadas para prop√≥sitos espec√≠ficos, como o GitHub Copilot, focado em programa√ß√£o, e o DALL¬∑E, da pr√≥pria OpenAI, voltado para gera√ß√£o de imagens. Devido √† sua natureza adaptativa, a tend√™ncia √© que o uso de LLMs continue crescendo de forma significativa nos mais diversos setores.

<h3>Exemplo Pr√°tico</h3>

Nesse exemplo usaremos a biblioteca <a href="https://huggingface.co/transformers/v3.0.2/index.html">Transformers</a> do <a href="https://huggingface.co/">Hugginface</a> que √© uma plataforma colaborativa voltada pra IA, semelhante ao GitHub, nele temos uma vasta cole√ß√£o de modelos, datasets, entre outras informa√ß√µes sobre IA. para iniciarmos precisamos configurar o ambiente e instalar as depend√™ncias nescess√°rias.


In [4]:
!pip install transformers

Looking in indexes: https://anu9rng:****@rb-artifactory.bosch.com/artifactory/api/pypi/python-virtual/simple



[notice] A new release of pip is available: 24.2 -> 25.1.1
[notice] To update, run: python.exe -m pip install --upgrade pip


Tamb√©m √© necess√°rio a instala√ß√£o do pytorch, a mesma √© uma biblioteca pra dessenvolvimento de IA, sendo uma das dep√™ndencias para rodar os LLMs.

In [5]:
!pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113

Looking in indexes: https://anu9rng:****@rb-artifactory.bosch.com/artifactory/api/pypi/python-virtual/simple, https://download.pytorch.org/whl/cu113



[notice] A new release of pip is available: 24.2 -> 25.1.1
[notice] To update, run: python.exe -m pip install --upgrade pip


Usaremos o GPT2 como exemplo para gera√ß√£o de texto.

In [6]:
from transformers import pipeline, set_seed
import torch
import os

#Configura√ß√£o de proxy, mantenha-se fora do proxy antes de rodar
os.environ['HTTP_PROXY'] = ''
os.environ['HTTPS_PROXY'] = ''

#A Classe pipeline abstrai conceitos, facilitando a conex√£o direta com huggin face e utiliza√ß√£o dos LLMs.
generator = pipeline('text-generation', model='gpt2')

#Essa inicializa um gerador de n√∫meros pseudoaleat√≥rios.
set_seed(42)

#Aqui definimos o texto base, o cumprimento m√°ximo do texto que ser√° gerado e o numero de retornos.
generator("Hello, I'm a language model,", max_length=30, num_return_sequences=5)

Device set to use cpu
Truncation was not explicitly activated but `max_length` is provided a specific value, please use `truncation=True` to explicitly truncate examples to max length. Defaulting to 'longest_first' truncation strategy. If you encode pairs of sequences (GLUE-style) with the tokenizer you can select this strategy more precisely by providing a specific strategy to `truncation`.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
Both `max_new_tokens` (=256) and `max_length`(=30) seem to have been set. `max_new_tokens` will take precedence. Please refer to the documentation for more information. (https://huggingface.co/docs/transformers/main/en/main_classes/text_generation)


[{'generated_text': "Hello, I'm a language model, I'm a language model. In my mind, I'm doing the same thing as you. All these different people are thinking about the same thing.\n\nI'm not talking about what the computer program does. I'm talking about what I'm thinking about. I'm thinking about what my body is thinking about. I'm thinking about what I'm making it. I'm thinking about what I'm making it. What my body is doing. I'm thinking about what my body is thinking about. What's my body doing? What's my body doing? What's my body doing?\n\nLet's talk about this, I'm not a computer programmer. I'm not a software developer. I'm not a computer programmer. I'm not a language model. I'm not a language model. My body is thinking about what I'm doing. What is my body doing? What's my body doing? What's my body doing?\n\nNow, I'm not saying that this is a good thing. But if you want to get better at programming, you can get better at writing. You can get better at being human. You can get

Isso √© um exemplo b√°sico de utiliza√ß√£o, podendo ser adaptado para diversas tarefas e casos de uso por meio de fine tuning, por√©m isso requer uso de um bom hardware e principalmente uma boa GPU, para realiza√ß√£o de treinamentos mais espec√≠ficos

<h3>Benef√≠cios dos LLM</h3>

Os LLMs (Modelos de Linguagem de Grande Escala) s√£o capazes de realizar o <a href="https://www.ibm.com/br-pt/think/topics/zero-shot-learning">aprendizado zero-shot</a>. Isso significa que conseguem generalizar tarefas para as quais n√£o foram explicitamente treinados, permitindo que se adaptem a novos cen√°rios sem a necessidade de treinamento adicional.
Outro benef√≠cio importante √© a capacidade de manipular e compreender grandes volumes de dados, o que se aplica, por exemplo, √† tradu√ß√£o de idiomas e √† gera√ß√£o de resumos de documentos.
Al√©m disso, os LLMs podem passar por <a href="http://ibm.com/br-pt/think/topics/fine-tuning">fine-tuning</a> com conjuntos de dados espec√≠ficos, o que permite que se mantenham em constante evolu√ß√£o e adapta√ß√£o a diferentes casos de uso na ind√∫stria.
Por fim, esses modelos automatizam uma ampla variedade de tarefas, como gera√ß√£o de c√≥digo e cria√ß√£o de conte√∫do, otimizando tempo e reduzindo a necessidade de m√£o de obra em atividades repetitivas, permitindo que os recursos humanos sejam direcionados a demandas mais estrat√©gicas e espec√≠ficas dentro de um projeto.

<h3>Conclus√£o</h3>

Diante dos t√≥picos abordados, √© poss√≠vel afirmar com seguran√ßa que os LLMs (Modelos de Linguagem de Grande Escala) j√° se tornaram uma parte fundamental dos avan√ßos tecnol√≥gicos na ind√∫stria. Sua presen√ßa √© cada vez mais evidente em solu√ß√µes inovadoras, integrando-se a fluxos de trabalho, produtos e servi√ßos de maneira estrat√©gica.
A tend√™ncia √© de avan√ßos cont√≠nuos e cada vez mais expressivos nessa tecnologia. Praticamente todas as big techs ‚Äî como Google, Microsoft, Meta, Amazon e OpenAI ‚Äî j√° desenvolvem e oferecem solu√ß√µes baseadas em LLMs, investindo pesadamente em pesquisa e desenvolvimento para ampliar a capacidade e efici√™ncia desses modelos.