<div style="text-align: center;">
    <h2><strong>LZW стиснення та розтиснення зображень</strong></h2>
</div>

<div style="font-size: 15px; line-height: 25px;">
    <h3><strong>Задача окремої ланки проєкту</strong></h3>
    <span>
        Алгоритм LZW (Лемпель-Зів-Велч) є потужним безвтратним методом стиснення даних, який ефективно видаляє надлишковість у вхідних даних. Цей алгоритм широко застосовується у різних форматах файлів, таких як GIF, PDF та TIFF, а також у Unix-команді "compress". Основна ідея LZW полягає у заміні повторюваних послідовностей байтів кодами, які зберігаються у словнику. Під час стиснення алгоритм динамічно будує словник, додаючи нові послідовності у міру їх зустрічі у вхідних даних. Кожна послідовність кодується індексом у словнику, що зменшує загальний обсяг даних. Безвтратна природа LZW робить його придатним для стиснення різноманітних типів даних.
    </span>
</div>

In [17]:
class LZW:
    def compress(self, uncompressed):
        dict_size = 256
        dictionary = {chr(i): i for i in range(dict_size)}
        w = ""
        result = []
        for c in uncompressed:
            wc = w + c
            if wc in dictionary:
                w = wc
            else:
                result.append(dictionary[w])
                dictionary[wc] = dict_size
                dict_size += 1
                w = c
        if w:
            result.append(dictionary[w])
        return result

    def decompress(self, compressed):
        dict_size = 256
        dictionary = {i: chr(i) for i in range(dict_size)}
        compressed = iter(compressed)
        w = chr(next(compressed))
        result = [w]
        for k in compressed:
            if k in dictionary:
                entry = dictionary[k]
            elif k == dict_size:
                entry = w + w[0]
            else:
                raise ValueError('Bad compressed k: %s' % k)
            result.append(entry)

            dictionary[dict_size] = w + entry[0]
            dict_size += 1

            w = entry
        return ''.join(result)


In [18]:
lzw = LZW()

<div>
    <h3><strong>Покроковий алгоритм кодування</strong></h3>
    <span style="font-size: 15px; line-height: 25px;">1. Ініціалізація словника з усіма можливими односимвольними рядками (у випадку з зображенням, то це символи 0-255). Словник містить 256 записів, де ключами є символи Unicode від chr(0) до chr(255), а значеннями - відповідні ASCII-коди від 0 до 255.
</div>

```python
def compress(self, uncompressed):
    dict_size = 256
    dictionary = {chr(i): i for i in range(dict_size)}
    w = ""
    result = []
    for c in uncompressed:
        wc = w + c
        if wc in dictionary:
            w = wc
        else:
            result.append(dictionary[w])
            dictionary[wc] = dict_size
            dict_size += 1
            w = c
    if w:
        result.append(dictionary[w])
    return result
```

In [19]:
result = lzw.compress("ABABCABCD")
result

[65, 66, 256, 67, 258, 68]

<div style="font-size: 15px; line-height: 25px;">
    <div>
        2. Ініціалізація порожньої рядкової змінної w та порожнього списку result для зберігання стиснених даних.
    </div>
    <div>
        3. Для кожного символу c у вхідних даних uncompressed виконуються наступні дії:
        <ol>
            <li>Створюється рядок wc, що складається з поточного значення w та нового символу c.</li>
            <li>Якщо wc присутній у словнику dictionary, змінна w оновлюється на wc для подальшого порівняння.</li>
            <li>Якщо wc відсутній у словнику:</li>
            <ul>
                <li>Індекс поточного рядка w із словника dictionary[w] додається до списку result.</li>
                <li>Нова послідовність wc додається до словника dictionary з новим індексом dict_size.</li>
                <li>Розмір словника dict_size збільшується на 1.</li>
                <li>Змінна w оновлюється на поточний символ c.</li>
            </ul>
            <li>Після обробки всіх символів у вхідних даних, якщо залишковий рядок w не порожній, його індекс із словника dictionary[w] також додається до списку result.</li>
            <li>Функція повертає список result, що містить стиснені дані у вигляді індексів із словника dictionary.</li>
        </ol>
    </div>
</div>

<div style="font-size: 15px; line-height: 25px;">
    <h3><strong>Приклад виконання</strong></h3>
    <span>Ітерація по кожному символу c у вхідному рядку "ABABCABCD":</span>
    <div>
        <br><span><b>Ітерація №1:</b> c = 'A'</span>
        <ul>
            <li>wc = w + c = "" + 'A' = "A"</li>
            <li>"A" присутній у словнику, тому w = "A"</li>
        </ul>
    </div>
    <div>
        <br><span><b>Ітерація №2:</b> c = 'B'</span>
        <ul>
            <li>wc = w + c = "A" + 'B' = "AB"</li>
            <li>"AB" відсутній у словнику, тому:</li>
            <ul>
                <li>result.append(dictionary[w]) => result = [65]</li>
                <li>dictionary["AB"] = dict_size => dictionary["AB"] = 256</li>
                <li>dict_size += 1 => dict_size = 257</li>
                <li>w = 'B'</li>
            </ul>
        </ul>
    </div>
    <div>
        <br><span><b>Ітерація №3:</b> c = 'A'</span>
        <ul>
            <li>wc = w + c = "B" + 'A' = "BA"</li>
            <li>"BA" відсутній у словнику, тому:</li>
            <ul>
                <li>result.append(dictionary[w]) => result = [65, 66]</li>
                <li>dictionary["BA"] = dict_size => dictionary["BA"] = 257</li>
                <li>dict_size += 1 => dict_size = 258</li>
                <li>w = 'A'</li>
            </ul>
        </ul>
    </div>
    <div>
        <br><span><b>Ітерація №4:</b> c = 'B'</span>
        <ul>
            <li>wc = w + c = "A" + 'B' = "AB"</li>
            <li>"AB" присутній у словнику, тому w = "AB"</li>
        </ul>
    </div>
    <div>
        <br><span><b>Ітерація №5:</b> c = 'C'</span>
        <ul>
            <li>wc = w + c = "AB" + 'C' = "ABC"</li>
            <li>"ABC" відсутній у словнику, тому:</li>
            <ul>
                <li>result.append(dictionary[w]) => result = [65, 66, 256]</li>
                <li>dictionary["ABC"] = dict_size => dictionary["ABC"] = 258</li>
                <li>dict_size += 1 => dict_size = 259</li>
                <li>w = 'C'</li>
            </ul>
        </ul>
    </div>
    <span style="font-size: 32px; letter-spacing: 0.125rem;">...</span>
    <div>
        <br><span><b>Остання операція:</b> після обробки всіх символів залишковий рядок w = "D", тому:</span>
        <ul>
            <li>result.append(dictionary[w]) => result = [65, 66, 256, 67, 259, 258, 68]</li>
        </ul>
    </div>
</div>

<div>
    <h3><strong>Покроковий алгоритм декодування</strong></h3>
    <span style="font-size: 15px; line-height: 25px;">1. Ініціалізація словника dictionary з усіма можливими односимвольними рядками (символами від 0 до 255), де ключами є ASCII-коди від 0 до 255, а значеннями - відповідні символи Unicode.
</div>

```python
def decompress(self, compressed):
    dict_size = 256
    dictionary = {i: chr(i) for i in range(dict_size)}
    compressed = iter(compressed)
    w = chr(next(compressed))
    result = [w]
    for k in compressed:
        if k in dictionary:
            entry = dictionary[k]
        elif k == dict_size:
            entry = w + w[0]
        else:
            raise ValueError('Bad compressed k: %s' % k)
        result.append(entry)

        dictionary[dict_size] = w + entry[0]
        dict_size += 1

        w = entry
    return ''.join(result)
```

In [20]:
result = lzw.decompress([65, 66, 256, 67, 258, 68])
result

'ABABCABCD'

<div style="font-size: 15px; line-height: 25px;">
    <div>
        2. Перетворення стиснених даних compressed на ітератор за допомогою iter(compressed).
    </div>
    <div>
        3. Читання першого індексу k зі стиснених даних за допомогою next(compressed) та ініціалізація змінної w і списку result символом, що відповідає цьому індексу.
    </div>
    <div>
        3. Для кожного наступного індексу k зі стиснених даних виконуються наступні дії:
        <ol>
            <li>Якщо k присутній у словнику dictionary, то рядок, що відповідає k (тобто dictionary[k]), присвоюється змінній entry.</li>
            <li>Якщо k дорівнює dict_size, то entry будується як w + w[0] (тобто, поточний рядок w + перший символ цього рядка).</li>
            <li>Якщо k не відповідає жодній з цих умов, генерується виняток ValueError.</li>
            <li>Рядок entry додається до списку result.</li>
            <li>У словник dictionary додається нова послідовність w + entry[0] з індексом dict_size.</li>
            <li>Значення dict_size збільшується на 1.</li>
            <li>Змінна w оновлюється на entry.</li>
        </ol>
    </div>
    <div>
        5. Після обробки всіх індексів зі стиснених даних функція повертає декодований вихідний рядок, отриманий з'єднанням елементів списку result за допомогою ''.join(result).
    </div>
</div>

<div style="font-size: 15px; line-height: 25px;">
    <span style="font-size: 21px;"><b>Короткий опис роботи</b></span><br>
    <span>Цей алгоритм декодування відновлює вихідні дані зі стиснених індексів, використовуючи той самий принцип побудови словника, що і під час кодування. Декодер будує словник паралельно з декодуванням стиснених індексів, використовуючи попередньо декодовані рядки та перші символи нових рядків для визначення нових послідовностей у словнику.</span><br><br>
    <span>Приклад декодування для стиснених даних compressed_data = [65, 66, 256, 67, 259, 258, 68] (які були отримані під час кодування рядка "ABABCABCD") за допомогою нашого коду:</span><br>
    <ol>
        <li>Ініціалізація словника dictionary та перетворення compressed_data на ітератор.</li>
        <li>Читання першого індексу k = 65, відповідний символ 'A' додається до result та присвоюється w.</li>
        <li>Наступний індекс k = 66, присутній у словнику, тому entry = 'B' додається до result.</li>
        <li>Наступний індекс k = 256, не присутній у словнику, тому entry = w + w[0] = 'A' + 'A' = 'AA' додається до result. Нова послідовність 'AB' додається до словника з індексом dict_size = 256.</li>
        <li>Наступний індекс k = 67, присутній у словнику, тому entry = 'C' додається до result.</li>
        <li>Після обробки всіх індексів функція повертає з'єднаний список result = 'ABABCABCD', що є декодованим вихідним рядком.</li>
    </ol>
</div>

<div>
    <h3><strong>Тестування коду стиснення та розтиснення зображень (LZW)</strong></h3>
</div>

In [26]:
from PIL import Image
import numpy as np

def load_image(image_path):
    with Image.open(image_path) as img:
        img = img.convert("L")
        return np.array(img)

def image_to_bytes(image_array):
    return image_array.tobytes()

In [27]:
def bytes_to_image(byte_data, image_shape):
    image_array = np.frombuffer(byte_data, dtype=np.uint8).reshape(image_shape)
    return Image.fromarray(image_array)

In [40]:
def test_image_compression(image_path):
    lzw = LZW()

    original_image = load_image(image_path)
    original_shape = original_image.shape
    original_bytes = image_to_bytes(original_image)
    original_size = len(original_bytes) * 8
    compressed = lzw.compress(original_bytes.decode('latin-1'))
    compressed_size = len(compressed) * 24
    decompressed_bytes = lzw.decompress(compressed).encode('latin-1')
    decompressed_image = bytes_to_image(decompressed_bytes, original_shape)

    original_image = Image.fromarray(original_image)
    original_image.save("original_image.png")
    decompressed_image.save("decompressed_image.png")

    if np.array_equal(np.array(original_image), np.array(decompressed_image)):
        print("Compression and decompression successful, images are identical.")
    else:
        print("Compression and decompression failed, images are not identical.")
        
    practical_compression_ratio = original_size / compressed_size
    print(f"Практичний результат:\n"
      f"Розмір зображення: Ширина - {original_shape[1]}, Висота - {original_shape[0]}\n"
      f"Кількість бітів на оригінальне зображення: {original_size}\n"
      f"Розмір списку з закодованими значеннями - {len(compressed)}\n"
      f"Кількість бітів на закодоване зображення (3 байт на символ): {compressed_size}\n"
      f"Різниця: {original_size - compressed_size}\n"
      f"Коефіцієнт стиснення: {practical_compression_ratio}\n"
      f"Закодоване зображення займає {compressed_size / original_size * 100:.2f}% оригінального зображення\n")


In [41]:
test_image_compression("./images/sea.jpg")

Compression and decompression successful, images are identical.
Практичний результат:
Розмір зображення: Ширина - 3888, Висота - 2592
Кількість бітів на оригінальне зображення: 80621568
Розмір списку з закодованими значеннями - 2007775
Кількість бітів на закодоване зображення (3 байт на символ): 48186600
Різниця: 32434968
Коефіцієнт стиснення: 1.6731117779631681
Закодоване зображення займає 59.77% оригінального зображення



<span>Кодоване зображення:</span><br><br>
<img src="./original_image.png" alt="Original Image" title="Original Image" style="width: 50%;">
<br>
<br>
<span>Декодоване зображення: </span><br><br>
<img src="./decompressed_image.png" alt="Decompressed Image" title="Decompressed Image" style="width: 50%;">

<div style="font-size: 15px; line-height: 25px;">
    <h3><strong>Висновки</strong></h3>
    <ol>
        <li><b>Простота та надійність:</b><br><span>LZW є простим і надійним алгоритмом стиснення, що робить його відмінним вибором для багатьох застосувань, де необхідне стиснення без втрат.</span></li><br>
        <li><b>Ефективність для певних типів зображень:</b><br><span>LZW дуже ефективний для стиснення зображень з великими однотонними областями, але менш ефективний для зображень з високим рівнем деталей або шуму.</span></li><br>
        <li><b>Практичні результати:</b><br><span>Тестування показало, що LZW може значно зменшити розмір файлу без втрати якості, особливо для зображень з повторюваними послідовностями пікселів.</span></li><br>
        <li><b>Порівняння з теоретичними результатами:</b><br><span>Практичні результати стиснення можуть перевищувати теоретичні очікування, що свідчить про високу ефективність алгоритму в реальних умовах.</span></li>
    </ol>
    <br>
</div>