<a href="https://colab.research.google.com/github/vo6i/Chrome-Extensions/blob/main/Untitled0.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
import torch
import torch.nn as nn

# --- 1. АРХИТЕКТУРА ---
class MiniGPT(nn.Module):
    def __init__(self, vocab_size, embed_size, num_heads):
        super().__init__()
        self.embedding = nn.Embedding(vocab_size, embed_size)
        self.pos_emb = nn.Parameter(torch.zeros(1, 100, embed_size))
        layer = nn.TransformerEncoderLayer(d_model=embed_size, nhead=num_heads, batch_first=True)
        self.transformer = nn.TransformerEncoder(layer, num_layers=2)
        self.fc_out = nn.Linear(embed_size, vocab_size)

    def forward(self, x):
        x = self.embedding(x) + self.pos_emb[:, :x.size(1), :]
        return self.fc_out(self.transformer(x))

# --- 2. ПОДГОТОВКА (ДАННЫЕ) ---
# Упрощенный словарь: 0: "привет", 1: "как", 2: "дела", 3: "нормально", 4: "пока"
vocab = {"привет": 0, "как": 1, "дела": 2, "нормально": 3, "пока": 4}
data = torch.tensor([[0, 1, 2, 3, 4]]) # Обучающая фраза

model = MiniGPT(vocab_size=5, embed_size=16, num_heads=2)
optimizer = torch.optim.Adam(model.parameters(), lr=0.01)
criterion = nn.CrossEntropyLoss()

# --- 3. ЦИКЛ ОБУЧЕНИЯ ---
print("Начинаю обучение...")
for epoch in range(200):
    logits = model(data[:, :-1]) # Предсказываем всё кроме первого слова
    target = data[:, 1:]         # Цель — следующие слова

    loss = criterion(logits.reshape(-1, 5), target.reshape(-1))

    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

    if epoch % 50 == 0:
        print(f"Эпоха {epoch}, Ошибка: {loss.item():.4f}")

# --- 4. ПРОВЕРКА (ГЕНЕРАЦИЯ) ---
model.eval()
input_seq = torch.tensor([[0]]) # Начинаем со слова "привет" (0)
for _ in range(4):
    with torch.no_grad():
        out = model(input_seq)
        next_id = torch.argmax(out[:, -1, :], dim=-1).unsqueeze(0)
        input_seq = torch.cat([input_seq, next_id], dim=1)

# Переводим цифры обратно в слова
inv_vocab = {v: k for k, v in vocab.items()}
result = [inv_vocab[i] for i in input_seq[0].tolist()]
print("\nМодель говорит:", " ".join(result))

Начинаю обучение...
Эпоха 0, Ошибка: 2.0098
Эпоха 50, Ошибка: 0.0078
Эпоха 100, Ошибка: 0.0037
Эпоха 150, Ошибка: 0.0022

Модель говорит: привет как дела нормально пока


In [5]:

import torch
import torch.nn as nn
import torch.nn.functional as F
import time

# --- 1. АРХИТЕКТУРА МОДЕЛИ ---
class MiniGPT(nn.Module):
    def __init__(self, vocab_size, embed_size, num_heads, block_size):
        super(MiniGPT, self).__init__()
        self.block_size = block_size
        self.embedding = nn.Embedding(vocab_size, embed_size)
        # Упрощенное позиционное кодирование:
        self.pos_embedding = nn.Embedding(block_size, embed_size)

        encoder_layer = nn.TransformerEncoderLayer(d_model=embed_size, nhead=num_heads, batch_first=True)
        self.transformer = nn.TransformerEncoder(encoder_layer, num_layers=2)

        self.fc_out = nn.Linear(embed_size, vocab_size)

    def forward(self, x):
        B, T = x.shape # Batch, Time (sequence length)
        # Создаем позиции от 0 до T-1
        pos = torch.arange(T, device=x.device).unsqueeze(0) # [1, T]

        tok_emb = self.embedding(x) # [B, T, E]
        pos_emb = self.pos_embedding(pos) # [1, T, E]

        out = tok_emb + pos_emb # Складываем смысл и позицию
        out = self.transformer(out)
        logits = self.fc_out(out)
        return logits

# --- 2. ПОДГОТОВКА ДАННЫХ (СИМВОЛЬНЫЙ ТОКЕНИЗАТОР) ---
# Замени этот текст на свой (загрузи файл в Colab и прочитай его)
# Или используй пример из скриншота
text = "привет как дела нормально пока" * 100 # Увеличим текст для обучения

chars = sorted(list(set(text)))
vocab_size = len(chars)
stoi = { ch:i for i,ch in enumerate(chars) }
itos = { i:ch for i,ch in enumerate(chars) }
encode = lambda s: [stoi[c] for c in s]
decode = lambda l: ''.join([itos[i] for i in l])

data = torch.tensor(encode(text), dtype=torch.long)

# --- 3. НАСТРОЙКИ ОБУЧЕНИЯ ---
BLOCK_SIZE = 8   # Сколько символов смотрим за раз
BATCH_SIZE = 4   # Сколько примеров обрабатываем параллельно
EMBED_SIZE = 32
HEADS = 2
LR = 0.001

model = MiniGPT(vocab_size, EMBED_SIZE, HEADS, BLOCK_SIZE)
optimizer = torch.optim.Adam(model.parameters(), lr=LR)
criterion = nn.CrossEntropyLoss()

# --- 4. ЦИКЛ ОБУЧЕНИЯ ---
print(f"Начинаю обучение на {len(data)} символах, размер словаря: {vocab_size}")
model.train()

for epoch in range(100):
    # Генерация случайного батча данных из текста
    ix = torch.randint(len(data) - BLOCK_SIZE, (BATCH_SIZE,))
    xb = torch.stack([data[i:i+BLOCK_SIZE] for i in ix]) # input (контекст)
    yb = torch.stack([data[i+1:i+BLOCK_SIZE+1] for i in ix]) # target (что должно быть дальше)

    # Forward pass
    logits = model(xb)
    B, T, C = logits.shape
    loss = criterion(logits.view(B*T, C), yb.view(B*T)) # Расчет ошибки

    # Backward pass и оптимизация
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

    if epoch % 10 == 0:
        print(f"Эпоха {epoch}, Ошибка: {loss.item():.4f}")

print("Обучение завершено.")

# --- 5. ГЕНЕРАЦИЯ ТЕКСТА ---
model.eval()
context = torch.zeros((1, 1), dtype=torch.long) # Начинаем с пустоты (0-й токен)

print("\nГенерация (должно быть похоже на 'привет...'):")
for _ in range(50):
    # Обрезаем контекст до максимального размера блока, чтобы не перегружать модель
    context_cond = context[:, -BLOCK_SIZE:]

    with torch.no_grad():
        logits = model(context_cond)
        # Берем только последний временной шаг (последний символ)
        logits = logits[:, -1, :]
        probs = F.softmax(logits, dim=-1)
        # Выбираем следующий символ случайным образом (семплируем)
        next_token = torch.multinomial(probs, num_samples=1)
        # Добавляем выбранный токен к контексту
        context = torch.cat((context, next_token), dim=1)

print(decode(context[0].tolist()))

Начинаю обучение на 3000 символах, размер словаря: 15
Эпоха 0, Ошибка: 2.7463
Эпоха 10, Ошибка: 1.7450
Эпоха 20, Ошибка: 1.4876
Эпоха 30, Ошибка: 1.4169
Эпоха 40, Ошибка: 1.1304
Эпоха 50, Ошибка: 0.9566
Эпоха 60, Ошибка: 0.9045
Эпоха 70, Ошибка: 0.8405
Эпоха 80, Ошибка: 0.8724
Эпоха 90, Ошибка: 0.7185
Обучение завершено.

Генерация (должно быть похоже на 'привет...'):
 какак дет дельа деа но привмаьно примат ривепдет к


In [8]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import time
import sys # Импортируем для работы с пользовательским вводом

# --- 1. АРХИТЕКТУРА МОДЕЛИ (из наших прошлых обсуждений) ---
class MiniGPT(nn.Module):
    def __init__(self, vocab_size, embed_size, num_heads, block_size):
        super(MiniGPT, self).__init__()
        self.block_size = block_size
        self.embedding = nn.Embedding(vocab_size, embed_size)
        self.pos_embedding = nn.Embedding(block_size, embed_size)

        encoder_layer = nn.TransformerEncoderLayer(d_model=embed_size, nhead=num_heads, batch_first=True)
        self.transformer = nn.TransformerEncoder(encoder_layer, num_layers=2)

        self.fc_out = nn.Linear(embed_size, vocab_size)

    def forward(self, x):
        B, T = x.shape
        pos = torch.arange(T, device=x.device).unsqueeze(0)
        tok_emb = self.embedding(x)
        pos_emb = self.pos_embedding(pos)
        out = tok_emb + pos_emb
        out = self.transformer(out)
        logits = self.fc_out(out)
        return logits

# --- 2. ПОДГОТОВКА ДАННЫХ (используем код с твоего скриншота) ---
# ИМЯ ВАШЕГО ФАЙЛА В COLAB
FILE_NAME = 'book.txt'

try:
    with open(FILE_NAME, 'r', encoding='utf-8') as f:
        text = f.read()
    print(f"Успешно прочитан файл: {FILE_NAME}, размер текста: {len(text)} символов.")
except FileNotFoundError:
    print(f"Ошибка: файл '{FILE_NAME}' не найден. Использую fallback текст.")
    text = "привет как дела нормально пока" # Fallback текст для теста

# Создаем словарь на основе всех символов в вашем файле
chars = sorted(list(set(text)))
vocab_size = len(chars)
stoi = { ch:i for i,ch in enumerate(chars) }
itos = { i:ch for i,ch in enumerate(chars) }
encode = lambda s: [stoi[c] for c in s]
decode = lambda l: ''.join([itos[i] for i in l])

data = torch.tensor(encode(text), dtype=torch.long)
print(f"Данные закодированы в тензор размером: {data.shape}")

# --- 3. НАСТРОЙКИ ОБУЧЕНИЯ ---
BLOCK_SIZE = 16 # Увеличим размер контекста для лучшего диалога # Adjusted from 64 to 16
BATCH_SIZE = 16
EMBED_SIZE = 64
HEADS = 4
LR = 0.001
EPOCHS = 1000 # Увеличим эпохи для лучшего результата

model = MiniGPT(vocab_size, EMBED_SIZE, HEADS, BLOCK_SIZE)
optimizer = torch.optim.Adam(model.parameters(), lr=LR)
criterion = nn.CrossEntropyLoss()

# --- 4. ЦИКЛ ОБУЧЕНИЯ ---
print("Начинаю обучение...")
model.train()

for epoch in range(EPOCHS):
    ix = torch.randint(len(data) - BLOCK_SIZE, (BATCH_SIZE,))
    xb = torch.stack([data[i:i+BLOCK_SIZE] for i in ix])
    yb = torch.stack([data[i+1:i+BLOCK_SIZE+1] for i in ix])

    logits = model(xb)
    B, T, C = logits.shape
    loss = criterion(logits.view(B*T, C), yb.view(B*T))

    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

    if epoch % 100 == 0:
        print(f"Эпоха {epoch}, Ошибка: {loss.item():.4f}")

print("Обучение завершено.")


# --- 5. ГЕНЕРАЦИЯ ТЕКСТА И ПОЛЬЗОВАТЕЛЬСКИЙ ВВОД (по мотивам твоего скриншота) ---
model.eval()

def generate_response(prompt_text, max_len=100):
    context = torch.tensor(encode(prompt_text), dtype=torch.long).unsqueeze(0)

    for _ in range(max_len):
        context_cond = context[:, -BLOCK_SIZE:]

        with torch.no_grad():
            logits = model(context_cond)
            logits = logits[:, -1, :]
            probs = F.softmax(logits, dim=-1)
            # Используем argmax для более детерминированных ответов
            next_token = torch.argmax(probs, dim=-1).unsqueeze(0)

            context = torch.cat((context, next_token), dim=1)

    full_output = decode(context.tolist()[0])
    response_start_index = len(prompt_text)
    return full_output[response_start_index:]

# --- Цикл общения с пользователем ---
print("\n--- Режим Диалога ---")
print("Введите текст для генерации или 'выход' для завершения.")

while True:
    try:
        user_input = input("Вы: ")
        if user_input.lower() == 'выход':
            print("Завершение диалога.")
            break

        response = generate_response(user_input)
        print(f"Модель: {response}\n")
    except EOFError:
        # Обработка завершения ввода в Colab
        break
    except Exception as e:
        print(f"Произошла ошибка ввода: {e}")
        break

Успешно прочитан файл: book.txt, размер текста: 2796 символов.
Данные закодированы в тензор размером: torch.Size([2796])
Начинаю обучение...
Эпоха 0, Ошибка: 4.0798
Эпоха 100, Ошибка: 1.2086
Эпоха 200, Ошибка: 0.2080
Эпоха 300, Ошибка: 0.2063
Эпоха 400, Ошибка: 0.1183
Эпоха 500, Ошибка: 0.1697
Эпоха 600, Ошибка: 0.1452
Эпоха 700, Ошибка: 0.1312
Эпоха 800, Ошибка: 0.1289
Эпоха 900, Ошибка: 0.1161
Обучение завершено.

--- Режим Диалога ---
Введите текст для генерации или 'выход' для завершения.
Вы: Привет
Модель: тииимоееее е етете еелете е еелете еелете еелете еелете еелете еелете еелете еелете еелете еелете ее

Вы: Как ты? 
Модель:  какаах твоя любимая свем сверемесе себем сереть свем свере врете реретре реререрреррерррррррррррррр

Вы: Ты сошел с ума? 
Произошла ошибка ввода: 'Т'


In [9]:
# --- УСТАНОВКА БИБЛИОТЕК ---
!pip install ipywidgets

import torch
import torch.nn as nn
import torch.nn.functional as F
import time

# --- 1. АРХИТЕКТУРА МОДЕЛИ ---
class MiniGPT(nn.Module):
    def __init__(self, vocab_size, embed_size, num_heads, block_size):
        super(MiniGPT, self).__init__()
        self.block_size = block_size
        self.embedding = nn.Embedding(vocab_size, embed_size)
        self.pos_embedding = nn.Embedding(block_size, embed_size)

        encoder_layer = nn.TransformerEncoderLayer(d_model=embed_size, nhead=num_heads, batch_first=True)
        self.transformer = nn.TransformerEncoder(encoder_layer, num_layers=2)

        self.fc_out = nn.Linear(embed_size, vocab_size)

    def forward(self, x):
        B, T = x.shape
        pos = torch.arange(T, device=x.device).unsqueeze(0)
        tok_emb = self.embedding(x)
        pos_emb = self.pos_embedding(pos)
        out = tok_emb + pos_emb
        out = self.transformer(out)
        logits = self.fc_out(out)
        return logits

# --- 2. ПОДГОТОВКА ДАННЫХ ---
FILE_NAME = 'book.txt'

try:
    with open(FILE_NAME, 'r', encoding='utf-8') as f:
        text = f.read()
    print(f"Успешно прочитан файл: {FILE_NAME}, размер текста: {len(text)} символов.")
except FileNotFoundError:
    print(f"Ошибка: файл '{FILE_NAME}' не найден. Использую fallback текст.")
    text = "привет как дела нормально пока" * 100

chars = sorted(list(set(text)))
vocab_size = len(chars)
stoi = { ch:i for i,ch in enumerate(chars) }
itos = { i:ch for i,ch in enumerate(chars) }
encode = lambda s: [stoi[c] for c in s]
decode = lambda l: ''.join([itos[i] for i in l])

data = torch.tensor(encode(text), dtype=torch.long)
print(f"Данные закодированы в тензор размером: {data.shape}")

# --- 3. НАСТРОЙКИ ОБУЧЕНИЯ И ИНИЦИАЛИЗАЦИЯ ---
BLOCK_SIZE = 64
BATCH_SIZE = 16
EMBED_SIZE = 64
HEADS = 4
LR = 0.001
EPOCHS = 200 # Уменьшим для скорости теста в Colab

model = MiniGPT(vocab_size, EMBED_SIZE, HEADS, BLOCK_SIZE)
optimizer = torch.optim.Adam(model.parameters(), lr=LR)
criterion = nn.CrossEntropyLoss()

# --- 4. ЦИКЛ ОБУЧЕНИЯ ---
print("Начинаю обучение...")
model.train()

for epoch in range(EPOCHS):
    ix = torch.randint(len(data) - BLOCK_SIZE, (BATCH_SIZE,))
    xb = torch.stack([data[i:i+BLOCK_SIZE] for i in ix])
    yb = torch.stack([data[i+1:i+BLOCK_SIZE+1] for i in ix])

    logits = model(xb)
    B, T, C = logits.shape
    loss = criterion(logits.view(B*T, C), yb.view(B*T))

    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

    if epoch % 50 == 0:
        print(f"Эпоха {epoch}, Ошибка: {loss.item():.4f}")

print("Обучение завершено.")

# --- 5. СОХРАНЕНИЕ МОДЕЛИ ---
MODEL_PATH = 'minigpt_checkpoint.pt'
torch.save(model.state_dict(), MODEL_PATH)
print(f"Модель сохранена в файл {MODEL_PATH}")

Collecting jedi>=0.16 (from ipython>=4.0.0->ipywidgets)
  Downloading jedi-0.19.2-py2.py3-none-any.whl.metadata (22 kB)
Downloading jedi-0.19.2-py2.py3-none-any.whl (1.6 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.6/1.6 MB[0m [31m21.1 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: jedi
Successfully installed jedi-0.19.2
Успешно прочитан файл: book.txt, размер текста: 2796 символов.
Данные закодированы в тензор размером: torch.Size([2796])
Начинаю обучение...
Эпоха 0, Ошибка: 4.1045
Эпоха 50, Ошибка: 2.4059
Эпоха 100, Ошибка: 2.1605
Эпоха 150, Ошибка: 2.0873
Обучение завершено.
Модель сохранена в файл minigpt_checkpoint.pt


In [19]:
import ipywidgets as widgets
from IPython.display import display, clear_output

# --- 1. ЗАГРУЗКА СОХРАНЕННОЙ МОДЕЛИ (модель должна быть уже определена в ячейке 1) ---
# Создаем новый экземпляр модели с теми же параметрами
loaded_model = MiniGPT(vocab_size, EMBED_SIZE, HEADS, BLOCK_SIZE)
loaded_model.load_state_dict(torch.load(MODEL_PATH))
loaded_model.eval() # Переводим в режим оценки/инференса

print(f"Модель загружена из файла {MODEL_PATH}")

# --- 2. ФУНКЦИЯ ГЕНЕРАЦИИ (использует loaded_model) ---
def generate_response(prompt_text, max_len=100):
    context = torch.tensor(encode(prompt_text), dtype=torch.long).unsqueeze(0)
    for _ in range(max_len):
        context_cond = context[:, -BLOCK_SIZE:]
        with torch.no_grad():
            logits = loaded_model(context_cond)
            logits = logits[:, -1, :]
            probs = F.softmax(logits, dim=-1)
            next_token = torch.argmax(probs, dim=-1).unsqueeze(0)
            context = torch.cat((context, next_token), dim=1)

    full_output = decode(context.tolist()[0])
    response_start_index = len(prompt_text)
    return full_output[response_start_index:]

# --- 3. ЦИКЛ ОБЩЕНИЯ С ПОЛЬЗОВАТЕЛЕМ (ipywidgets) ---
print("\n--- Режим Диалога (с ipywidgets) ---")
text_input = widgets.Text(placeholder='Введите ваш запрос здесь...', description='Вы:')
output_area = widgets.Output()

def on_submit(sender):
    with output_area:
        clear_output()
        user_input = sender.value
        if user_input.lower() == 'выход':
            print("Завершение диалога.")
            text_input.disabled = True
            return
        response = generate_response(user_input)
        print(f"Вы: {user_input}")
        print(f"Модель: {response}\n")
        sender.value = ''

text_input.on_submit(on_submit)
display(text_input, output_area)

Модель загружена из файла minigpt_checkpoint.pt

--- Режим Диалога (с ipywidgets) ---


Text(value='', description='Вы:', placeholder='Введите ваш запрос здесь...')

Output()