In [None]:
import transformers
from transformers import AutoTokenizer, pipeline
import torch

model_id = "deepseek-ai/deepseek-llm-67b-chat"
# Para modelo mais leve: "deepseek-ai/deepseek-llm-7b-chat"

# 🔥 MODE OFFLINE - use local_files_only=True
tokenizer = AutoTokenizer.from_pretrained(
    model_id, 
    local_files_only=True  # ✅ Esta linha é crucial
)

pipeline = transformers.pipeline(
    "text-generation",
    model=model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto",
    trust_remote_code=True,
    local_files_only=True  # ✅ Esta linha é crucial
)

topic = "artificial intelligence in education"
n_tweets = 30

# Prompt específico para DeepSeek
messages = [
    {"role": "User", "content": f"Generate {n_tweets} different tweets about '{topic}'. Each must be under 280 characters, sound natural, and be varied in style. Respond only with the tweets separated by new lines."},
    {"role": "Assistant", "content": "Okay, I will generate engaging tweets about " + topic}
]

# DeepSeek requer formatação especial
formatted_prompt = tokenizer.apply_chat_template(messages, tokenize=False)

outputs = pipeline(
    formatted_prompt,
    max_new_tokens=500,
    do_sample=True,
    temperature=0.8,
    top_p=0.9,
    repetition_penalty=1.1,
    eos_token_id=tokenizer.eos_token_id,
)

# Extrai apenas a parte gerada
generated_text = outputs[0]['generated_text'].replace(formatted_prompt, "").strip()
print(generated_text)

In [1]:
# Execute este código em uma máquina COM internet
from transformers import AutoTokenizer, AutoModel
import torch

model_id = "deepseek-ai/deepseek-llm-67b-chat"  # ou use o modelo 7B se preferir
token = "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"

# Baixe o tokenizer e modelo
tokenizer = AutoTokenizer.from_pretrained(model_id, token=token)
model = AutoModel.from_pretrained(model_id, token=token, torch_dtype=torch.bfloat16)

print("✅ Download completo! Arquivos salvos em cache.")

  from .autonotebook import tqdm as notebook_tqdm
Fetching 14 files: 100%|██████████| 14/14 [08:43<00:00, 37.36s/it]  
Loading checkpoint shards: 100%|██████████| 14/14 [00:09<00:00,  1.43it/s]


✅ Download completo! Arquivos salvos em cache.


In [None]:
import torch
import subprocess
import os

print("=== VERIFICAÇÃO DE RECURSOS COM PYTHON ===")

# Verificar se PyTorch vê as GPUs
print(f"GPUs disponíveis: {torch.cuda.device_count()}")
for i in range(torch.cuda.device_count()):
    print(f"GPU {i}: {torch.cuda.get_device_name(i)}")
    print(f"  Memória: {torch.cuda.get_device_properties(i).total_memory / 1e9:.1f} GB")

# Verificar CPU
print(f"\nNúcleos CPU: {os.cpu_count()}")

# Verificar memória
import psutil
print(f"Memória RAM Total: {psutil.virtual_memory().total / 1e9:.1f} GB")
print(f"Memória RAM Disponível: {psutil.virtual_memory().available / 1e9:.1f} GB")