# 1. LZW алгоритам (Dictionary based) 

Овој алгоритам е од класа алгоритми **Pattern Substition**, т.е. алгоритми за компресија се заснова на **динамично креирање на речник од стрингови**. Секој стринг е подниза од симболите, како што се појавуваат во пораката. Компресијата се заснова на едноставна идеја која се обидува да направи група на индивидуални симболи во стрингови. На стринговите им се доделува **индекс**, кој се користи секој пат кога стрингот се појавува во влезната порака.Едноставноста на LZW лежи во фактот дека не е потребна претходна анализа на пораката за да се создаде речник од стрингови, туку стринговите се создаваат како што се скенира пораката.Компресија се постигнува кога еден код ќе се искористи за цел стринг од симболи, наместо само за еден симбол. Процесот е опишан низ следниве чекори:
1. Иницијализирај го речникот да ги содржи сите почетни симболи. Вокабуларот ги формира почетните записи во речникот. На секој запис во речникот му се доделува индекс.
2. Додека ја скенирашпораката за компресирање, барај ја најдолгата низа на симболи која се појавува како запис во речникот. Наречи го овој запис Е.
3. Кодирај ја Е во пораката според нејзиниот индекс во речникот.
4. Додади нов запис во речникот, кој е записот Е проследен со следниот симбол во скенирањето.
5. Повторувај го процесот на користење на индексите од речникот и додавање нови записи сè додека не стигнеш до крајот на пораката.

Алгоритмот е  опишан и со следниов псевдо код: 

```js
InputSymbol = Read Next input symbol;
String = InputSymbol; 
WHILE InputSymbol exists DO
    InputSymbol = Read Next input symbol
    IF   (Sring + InputSymbol) exits in DICTIONARY then 
        String = String + InputSymbol 
    ELSE 
        Output dictionary index of String 
        Add (String + InputSymbol) to DICTIONARY 
        String = InputSymbol
    END // end of if statment 
END  // end of while loop
Output dictionary index of String 
```


## Python 3.7 имплементација

In [1]:
import itertools
import plotly.graph_objects as go
from simple_colors import *
from plotly.offline import plot, iplot, init_notebook_mode
from IPython.core.display import display, HTML
init_notebook_mode(connected = True)
config={'showLink': False, 'displayModeBar': False}

# Имплементација на алгоритамот во Python 3.7 
def compress(uncompressed, rules):
    """/TAN/HAN/HAN/AN/"""

    # Build the dictionary.
    # dict_size = 256
    dictionary_LZW = rules
    dict_size = len(rules) + 1
    w = ""
    result = []
    for c in uncompressed:
        wc = w + c
        if wc in dictionary_LZW:
            w = wc
        else:
            result.append(dictionary_LZW[w])
            # Add wc to the dictionary.
            dictionary_LZW[wc] = dict_size
            dict_size += 1
            w = c

    # Output the code for w.
    if w:
        result.append(dictionary_LZW[w])
    return result, dictionary_LZW

## Пример 1
Нека е даден следниот влезен стринг: 
> **/TAN/HAN/HAN/AN/**

| Index  | Entry   |
| -------| --------|
| 1      | /       |
| 2      | H       |
| 3      | A       |
| 4      | N       |
| 5      | T       |

Иницијалниот речник едаден во табелата. Да се енкодира секвенцата со алгоритмот LZW.

Резултат добиен после кодирање: 

In [8]:
uncompressed_string = "/TAN/HAN/HAN/AN/"
# Compress with LZW algorithm 
compressed, LZW = compress(uncompressed_string, 
                           {'/': 1, 'H': 2, 'A': 3, 'N': 4, 'T': 5})

values = list(LZW.values())
keys = list(LZW.keys())


fig = go.Figure(
    data=[go.Table(
        header=dict(values=['Index', 'Entry'],
                    fill_color='paleturquoise',
                    align='center'),
        cells=dict(values=[values, keys],
                   fill_color='lavender',
                   align='center'))],
    layout = go.Layout(
        margin=dict(l=10, r=10, t=17, b=20, pad=1),
        width=500,
        height=400,
        annotations=[
            dict(
                showarrow=False,
                text='Compressed output for' + uncompressed_string + ':',
                xanchor='right',
                x=1,
                yanchor='top',
                y=0.05),
            dict(
                font=dict(
                color="crimson",
                size=12),
                showarrow=False,
                text=f'{compressed}',
                xanchor='right',
                x=1,
                yanchor='top',
                y=0.005)]))

iplot(fig, filename = 'fig-lzw-1.html', config=config)

## Пример 2
Нека е даден следниот влезен стринг: 
> **/THIS/IS/HIS/IS/**

| Index  | Entry   |
| -------| --------|
| 1      | /       |
| 2      | H       |
| 3      | I       |
| 4      | S       |
| 5      | T       |

Иницијалниот речник едаден во табелата. Да се енкодира секвенцата со алгоритмот LZW.

Резултат добиен после кодирање: 

In [6]:
uncompressed_string = "/THIS/IS/HIS/IS/"
# Compress with LZW algorithm 
compressed, LZW = compress(uncompressed_string, 
                           {'/': 1, 'H': 2, 'I': 3, 'S': 4, 'T': 5})

values = list(LZW.values())
keys = list(LZW.keys())


fig = go.Figure(
    data=[go.Table(
        header=dict(values=['Index', 'Entry'],
                    fill_color='lightskyblue',
                    align='center'),
        cells=dict(values=[values, keys],
                   fill_color='lightcyan',
                   align='center'))],
    layout = go.Layout(
        margin=dict(l=10, r=10, t=17, b=20, pad=1),
        width=500,
        height=400,
        annotations=[
            dict(
                showarrow=False,
                text='Compressed output for ' + uncompressed_string + ": " ,
                xanchor='right',
                x=1,
                yanchor='top',
                y=0.05),
            dict(
                font=dict(
                color="crimson",
                size=12),
                showarrow=False,
                text=f'{compressed}',
                xanchor='right',
                x=1,
                yanchor='top',
                y=0.005)]))

iplot(fig, filename = 'fig-lzw-2.html', config=config)