# Código usando LLM no Hugging Face em Jupyter Notebook (Google Colab)

In [None]:
# Instala as bibliotecas necessárias
!	pip install transformers datasets accelerate huggingface_hub

In [None]:
# Importa as bibliotecas
from transformers import pipeline
from datasets import load_dataset

In [None]:
# Carrega o modelo de linguagem pré-treinado (neste caso, GPT-2)
generator = pipeline('text-generation', model='gpt2')

In [None]:
# Define o texto de entrada
text = 'O céu está azul e'

# Gera texto usando o modelo
output = generator(text, max_length=50, num_return_sequences=3)

In [None]:
# Imprime as saídas geradas
for i, generated_text in enumerate(output):
  print(f'Saída {i+1}: {generated_text['generated_text']}'
  print('---')

## Usando o modelo para gerar texto a partir de um dataset

In [None]:
# Carrega um dataset
dataset = load_dataset('imdb')

In [None]:
# Itera sobre as primeiras 5 amostras do dataset
for i in range(5):
  text = dataset['train'][i]['text']
  print(f'Texto de entrada: {text[:100]}...')
  output = generator(text[:100], max_length=50, num_return_sequences=1)
  print(f'Saída: {output[0]['generated_text']}'
  print('---')

## Salvando o modelo em seu próprio repositório Hugging Face

In [None]:
# Importe a biblioteca 'huggingface_hub'
from huggingface_hub import notebook_login

# Autentique-se com sua conta do Hugging Face
notebook_login()

In [None]:
# Define o nome do repositório e o nome do modelo
repo_name = 'meu-modelo-de-linguagem'
model_name = 'meu-modelo'

# Salva o modelo no repositório
generator.save_pretrained(repo_name)

## Carregando o modelo salvo

In [None]:
# Carrega o modelo do repositório
generator = pipeline('text-generation', model=f'your_huggingface_username/{repo_name}')

In [None]:
# Testa o modelo carregado
text = 'O céu está azul e'
output = generator(text, max_length=50, num_return_sequences=3)
for i, generated_text in enumerate(output):
  print(f'Saída {i+1}: {generated_text['generated_text']}'
  print('---')