# 1.  Завдання щодо генерації текстів або машинного перекладу (на вибір) на базі рекурентних мереж або трансформерів (на вибір). Вирішіть завдання щодо генерації текстів або машинного перекладу. Особливо вітаються україномовні моделі.  

In [6]:
import numpy as np
import tensorflow as tf
from tensorflow.keras.models import Model
from tensorflow.keras.layers import Input, LSTM, Dense

with open('ukr.txt', 'r', encoding='utf-8') as f:
    lines = f.readlines()

# розділення на вхідні і цільові тексти
input_texts = []
target_texts = []
for line in lines:
    # Розділення рядка на англійський і український текст
    parts = line.strip().split('\t')
    if len(parts) >= 2:
        input_texts.append(parts[0])  # Вхідні речення англійською
        target_texts.append('\t' + parts[1] + '\n')  # Цільові речення українською із символами початку і кінця

# Створення списків унікальних символів для вхідного і цільового тексту
input_characters = sorted(set(''.join(input_texts)))
target_characters = sorted(set(''.join(target_texts)))

# Визначення розмірності вхідного і цільового словників
num_encoder_tokens = len(input_characters)
num_decoder_tokens = len(target_characters)

# Визначення максимальних довжин речень
max_encoder_seq_length = max([len(text) for text in input_texts])
max_decoder_seq_length = max([len(text) for text in target_texts])

# Створення словників символів і їх індексів
input_token_index = {char: i for i, char in enumerate(input_characters)}
target_token_index = {char: i for i, char in enumerate(target_characters)}
reverse_input_char_index = {i: char for char, i in input_token_index.items()}
reverse_target_char_index = {i: char for char, i in target_token_index.items()}

# Перетворення тексту у вектори one-hot
def vectorize_texts(input_texts, target_texts):
    encoder_input_data = np.zeros((len(input_texts), max_encoder_seq_length, num_encoder_tokens), dtype='float32')
    decoder_input_data = np.zeros((len(target_texts), max_decoder_seq_length, num_decoder_tokens), dtype='float32')
    decoder_target_data = np.zeros((len(target_texts), max_decoder_seq_length, num_decoder_tokens), dtype='float32')

    for i, (input_text, target_text) in enumerate(zip(input_texts, target_texts)):
        for t, char in enumerate(input_text):
            encoder_input_data[i, t, input_token_index[char]] = 1.0  # Вхідні символи
        for t, char in enumerate(target_text):
            decoder_input_data[i, t, target_token_index[char]] = 1.0  # Вхідні символи для декодера
            if t > 0:
                # Символи для передбачення (зсунутий цільовий текст)
                decoder_target_data[i, t - 1, target_token_index[char]] = 1.0
    return encoder_input_data, decoder_input_data, decoder_target_data

encoder_input_data, decoder_input_data, decoder_target_data = vectorize_texts(input_texts, target_texts)

# Архітектура моделі
latent_dim = 256  # Розмір прихованого стану

# Енкодер: обробка вхідного тексту
encoder_inputs = Input(shape=(None, num_encoder_tokens))
encoder = LSTM(latent_dim, return_state=True)
encoder_outputs, state_h, state_c = encoder(encoder_inputs)
encoder_states = [state_h, state_c]

# Декодер: генерація тексту
decoder_inputs = Input(shape=(None, num_decoder_tokens))
decoder_lstm = LSTM(latent_dim, return_sequences=True, return_state=True)
decoder_outputs, _, _ = decoder_lstm(decoder_inputs, initial_state=encoder_states)
decoder_dense = Dense(num_decoder_tokens, activation='softmax')
decoder_outputs = decoder_dense(decoder_outputs)

# Повна модель для навчання
model = Model([encoder_inputs, decoder_inputs], decoder_outputs)

# Компіляція моделі
model.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])

# Навчання моделі
model.fit(
    [encoder_input_data, decoder_input_data],  # Вхідні дані
    decoder_target_data,  # Цільові дані
    batch_size=64,
    epochs=30,  # Кількість епох
    validation_split=0.2  # Відсоток даних для валідації
)

# Інференс: окремі моделі для енкодера і декодера
encoder_model = Model(encoder_inputs, encoder_states)

# Декодер для передбачення
decoder_state_input_h = Input(shape=(latent_dim,))
decoder_state_input_c = Input(shape=(latent_dim,))
decoder_states_inputs = [decoder_state_input_h, decoder_state_input_c]
decoder_outputs, state_h, state_c = decoder_lstm(decoder_inputs, initial_state=decoder_states_inputs)
decoder_states = [state_h, state_c]
decoder_outputs = decoder_dense(decoder_outputs)
decoder_model = Model([decoder_inputs] + decoder_states_inputs, [decoder_outputs] + decoder_states)

# Функція декодування
def decode_sequence(input_seq):
    # Отримання прихованих станів енкодера
    states_value = encoder_model.predict(input_seq)

    # Початковий символ для декодера
    target_seq = np.zeros((1, 1, num_decoder_tokens))
    target_seq[0, 0, target_token_index['\t']] = 1.0

    stop_condition = False
    decoded_sentence = ''
    while not stop_condition:
        # Передбачення наступного символу
        output_tokens, h, c = decoder_model.predict([target_seq] + states_value)

        # Декодування символу
        sampled_token_index = np.argmax(output_tokens[0, -1, :])
        sampled_char = reverse_target_char_index[sampled_token_index]
        decoded_sentence += sampled_char

        # Зупинка, якщо досягнуто кінця речення або максимальної довжини
        if sampled_char == '\n' or len(decoded_sentence) > max_decoder_seq_length:
            stop_condition = True

        # Оновлення вхідних даних декодера
        target_seq = np.zeros((1, 1, num_decoder_tokens))
        target_seq[0, 0, sampled_token_index] = 1.0
        states_value = [h, c]

    return decoded_sentence

for seq_index in range(5):  # Перевірка перших 5 речень
    input_seq = encoder_input_data[seq_index:seq_index + 1]
    decoded_sentence = decode_sequence(input_seq)
    print(f"Input sentence: {input_texts[seq_index]}")
    print(f"Decoded sentence: {decoded_sentence}")



Input sentence: Go.
Decoded sentence: Йди.
Input sentence: Hi.
Decoded sentence: Привіт!
Input sentence: Run!
Decoded sentence: Біжи!
Input sentence: Wow!
Decoded sentence: Нічого!
Input sentence: Fire!
Decoded sentence: Пожежа!

      
      


Спершу ми завантажили англо-український датасет із реченнями, розбили його на вхідні (англійські) та цільові (українські) тексти, додавши символи початку та кінця речення для цільових текстів. Ми створили словники унікальних символів для кожної мови, що використовуються для перетворення тексту у вектори one-hot. Вхідні дані були векторизовані у вигляді тривимірних матриць, які мають інформацію про послідовності символів у реченнях. Архітектура моделі включає енкодер на базі LSTM. Декодер, побудований на LSTM, використовує приховані стани енкодера для генерації українського перекладу, символ за символом, через шар із функцією активації softmax. Модель була навчена на 30 епохах із валідаційним розділом 20%, використовуючи функцію втрат categorical_crossentropy і оптимізатор rmsprop. Після навчання ми створили окремі моделі для інференсу: енкодер формує приховані стани для нових речень, а декодер генерує переклад. Наприкінці ми протестували модель на перших 10 реченнях з датасету

# 2. Проведіть експерименти з моделями бібліотеки Hugging Face (раніше - Hugging Face Transformers, https://huggingface.co/) за допомогою (наприклад) Pipeline модуля 

In [13]:
from transformers import pipeline

# Завантаження моделі перекладу (англійська -> українська)
translation_pipeline = pipeline("translation_en_to_uk", model="Helsinki-NLP/opus-mt-en-uk")
text_to_translate = "The great poet Taras Shevchenko is known as the voice of Ukraine."
translated_text = translation_pipeline(text_to_translate)
print("Перекладений текст:", translated_text[0]['translation_text'])

# Завантаження моделі для генерації тексту
generator = pipeline('text-generation', model='openai-gpt') 

# Генерація тексту
prompt = "Taras Shevchenko's books:"
generated_texts = generator(prompt, max_length=50, num_return_sequences=5)

# Виведення результатів
print("\nЗгенерований текст:")
for i, output in enumerate(generated_texts, 1):
    print(f"Варіант {i}: {output['generated_text']}")


Device set to use mps:0


Перекладений текст: Великий поет Тарас Шевченко відомий як голос України.


Device set to use mps:0
Truncation was not explicitly activated but `max_length` is provided a specific value, please use `truncation=True` to explicitly truncate examples to max length. Defaulting to 'longest_first' truncation strategy. If you encode pairs of sequences (GLUE-style) with the tokenizer you can select this strategy more precisely by providing a specific strategy to `truncation`.



Згенерований текст:
Варіант 1: Taras Shevchenko's books: all volumes one through seventy - six ; with great reference to the history of the world, and to a large number of historical documents that could provide insights on history and the world and its impact on human
Варіант 2: Taras Shevchenko's books: 
 the'great quest ', book two, the dragon slayer, and his quest : 
 the journey that will end our lives, book three, the greatest book of all time, books five,
Варіант 3: Taras Shevchenko's books: 
 the adventures of the klansmen 
 two black - jacketed bandits 
 the golden bough episode 1 
 the secrets to ancient secrets 
 the great seal 
 the iron and gold collection 
 and the
Варіант 4: Taras Shevchenko's books: 
 the world is ruled by a monster : a world that destroys everything except for its own kind of evil. 
 and for this, the writer must choose which character to be. for it has already
Варіант 5: Taras Shevchenko's books: 
 - the tale of two sisters in the mountains : 
 - the

Перша задача полягала у перекладі тексту з англійської на українську за допомогою моделі Helsinki-NLP/opus-mt-en-uk. Результат був точним і відповідав очікуванням: фраза "The great poet Taras Shevchenko is known as the voice of Ukraine" була коректно перекладена як "Великий поет Тарас Шевченко відомий як голос України". 

Друга задача стосувалася генерації тексту англійською мовою за допомогою моделі openai-gpt. На жаль, результати генерації виявилися менш задовільними: модель створювала текст, який не мав логічного зв’язку з заданим контекстом про творчість Тараса Шевченка. Наприклад, у згенерованих фрагментах з’являлися вигадані назви книг ("dragon slayer," "tale of two sisters"), які не мають жодного стосунку до українського поета. Це вказує на обмеженість цієї моделі у розумінні культурно-специфічного контексту.

# 3. Завдання щодо генерації або стилізації зображень (на вибір)
Вирішіть завдання перенесення стилю або генерації зображень (архітектура за вашим вибором: GAN/DCGAN/VAE/Diffusion). Датасети: можна брати CIFAR-100, Fashion MNIST 

In [None]:
import tensorflow as tf
import numpy as np
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torchvision.utils import save_image

# Налаштування пристрою: вибір між GPU та CPU
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

# Розмір партії для навчання (batch size)
bs = 100

# Завантаження та підготовка даних MNIST
(x_train, y_train), (x_test, y_test) = tf.keras.datasets.mnist.load_data()

# Нормалізація даних у діапазоні [-1, 1], щоб полегшити навчання мережі
x_train = (x_train.astype(np.float32) - 127.5) / 127.5
x_test = (x_test.astype(np.float32) - 127.5) / 127.5

# Перетворення зображень у вектори довжиною 28*28 (плоске зображення)
x_train = torch.tensor(x_train.reshape(-1, 28 * 28))
x_test = torch.tensor(x_test.reshape(-1, 28 * 28))

# Створення DataLoader для тренувальних та тестових даних
train_loader = torch.utils.data.DataLoader(x_train, batch_size=bs, shuffle=True)
test_loader = torch.utils.data.DataLoader(x_test, batch_size=bs, shuffle=False)

# Опис архітектури генератора
class Generator(nn.Module):
    def __init__(self, g_input_dim, g_output_dim):
        super(Generator, self).__init__()
        # Шари мережі для генератора
        self.fc1 = nn.Linear(g_input_dim, 256)
        self.fc2 = nn.Linear(self.fc1.out_features, self.fc1.out_features * 2)
        self.fc3 = nn.Linear(self.fc2.out_features, self.fc2.out_features * 2)
        self.fc4 = nn.Linear(self.fc3.out_features, g_output_dim)

    def forward(self, x):
        # Нелінійність Leaky ReLU для кожного шару
        x = F.leaky_relu(self.fc1(x), 0.2)
        x = F.leaky_relu(self.fc2(x), 0.2)
        x = F.leaky_relu(self.fc3(x), 0.2)
        # Використовуємо Tanh для нормалізації вихідних значень в діапазоні [-1, 1]
        return torch.tanh(self.fc4(x))

# Опис архітектури дискримінатора
class Discriminator(nn.Module):
    def __init__(self, d_input_dim):
        super(Discriminator, self).__init__()
        # Шари мережі для дискримінатора
        self.fc1 = nn.Linear(d_input_dim, 1024)
        self.fc2 = nn.Linear(self.fc1.out_features, self.fc1.out_features // 2)
        self.fc3 = nn.Linear(self.fc2.out_features, self.fc2.out_features // 2)
        self.fc4 = nn.Linear(self.fc3.out_features, 1)

    def forward(self, x):
        # Нелінійність Leaky ReLU і використання Dropout для зменшення перенавчання
        x = F.leaky_relu(self.fc1(x), 0.2)
        x = F.dropout(x, 0.3)
        x = F.leaky_relu(self.fc2(x), 0.2)
        x = F.dropout(x, 0.3)
        x = F.leaky_relu(self.fc3(x), 0.2)
        x = F.dropout(x, 0.3)
        # Використовуємо сигмоїду для видачі ймовірностей
        return torch.sigmoid(self.fc4(x))

# Ініціалізація генератора і дискримінатора
z_dim = 100  # Розмір латентного простору (вхідний шум)
mnist_dim = 28 * 28  # Розмір зображення 28x28 (плоске)

# Моделі генератора та дискримінатора
G = Generator(g_input_dim=z_dim, g_output_dim=mnist_dim).to(device)
D = Discriminator(mnist_dim).to(device)

# Визначення функції втрат (BCELoss) і оптимізаторів (Adam)
criterion = nn.BCELoss()
lr = 0.0002
G_optimizer = optim.Adam(G.parameters(), lr=lr)
D_optimizer = optim.Adam(D.parameters(), lr=lr)

# Функція тренування дискримінатора
def D_train(x):
    D.zero_grad()
    # Навчання на реальних даних
    x_real, y_real = x.view(-1, mnist_dim).to(device), torch.ones(bs, 1).to(device)
    D_output = D(x_real)
    D_real_loss = criterion(D_output, y_real)

    # Навчання на фейкових даних
    z = torch.randn(bs, z_dim).to(device)
    x_fake, y_fake = G(z), torch.zeros(bs, 1).to(device)
    D_output = D(x_fake)
    D_fake_loss = criterion(D_output, y_fake)

    # Обчислення загальних втрат та оновлення ваг
    D_loss = D_real_loss + D_fake_loss
    D_loss.backward()
    D_optimizer.step()
    return D_loss.item()

# Функція тренування генератора
def G_train():
    G.zero_grad()
    z = torch.randn(bs, z_dim).to(device)
    y = torch.ones(bs, 1).to(device)  # Генератор хоче, щоб дискримінатор думав, що це справжні зображення
    G_output = G(z)
    D_output = D(G_output)
    G_loss = criterion(D_output, y)

    # Оновлення ваг генератора
    G_loss.backward()
    G_optimizer.step()
    return G_loss.item()

n_epoch = 100 
for epoch in range(1, n_epoch + 1):
    D_losses, G_losses = [], []
    for batch_idx, x in enumerate(train_loader):
        D_losses.append(D_train(x))  # Тренування дискримінатора
        G_losses.append(G_train())  # Тренування генератора

# Генерація фінального результату після тренування
with torch.no_grad():
    final_z = torch.randn(bs, z_dim).to(device)  
    generated = G(final_z)  # Генерація зображень
    save_image(generated.view(bs, 1, 28, 28), 'final_result.png') 


Результат було збережно у final_result.png ![Result](lb4/final_result.png)

Мережа складається з двох частин: генератора, який генерує нові зображення, та дискримінатора, який оцінює, чи є зображення реальними чи фейковими. Генератор намагається створити зображення, що нагадують цифри з MNIST, в той час як дискримінатор намагається визначити, чи є ці зображення реальними чи фейковими.

Результат є досить хорошим, оскільки згенеровані зображення схожі на цифри з набору MNIST. Хоча є деякі незначні дефекти та шуми, загальна якість зображень демонструє, що генеративна модель здатна добре імітувати цифри, яких вона не бачила під час навчання.