# CYK Algorithm 

This script is a discrete implementation of the CYK algorithm which allows the user to determine if a word is within a context-free language or not

## Implementation with matrix-formatting

In [32]:
import tabulate as tab

def format_set_matrix(table, word):
    formatted_table = []
    for row in table:
        formatted_row = []
        for cell in row:
            if cell:
                formatted_row.append(cell)
            else:
                formatted_row.append("-")
        formatted_table.append(formatted_row)

    print(tab.tabulate(formatted_table, headers=list(word), tablefmt="fancy_grid"))


def cyk_algorithm(grammar, word):
    n = len(word)

    # Initialize table a n by n matrix
    table = [[set() for _ in range(n)] for _ in range(n)]

    # Fill the first row of the table with Variables that produce the terminal of the word
    for i in range(n):
        for key, value in grammar.items():
            if word[i] in value:
                table[0][i].add(key)

    index_list = dict()

    for j in range(1, n):
        k_list = list()
        for k in range(n-j):
            k_list.append(k)
        index_list.update({j: k_list})

    for j, k in index_list.items():
        for k_itr in k:
            for p in range(j):
                for key, value in grammar.items():
                    for t1 in table[p][k_itr]:
                        for t2 in table[j-p-1][k_itr+p+1]:
                            if t1+t2 in value:
                                table[j][k_itr].add(key)
    
    format_set_matrix(table, word)


## Example usage

In [42]:
grammar = {
    'S': {'RT', 'AV', 'SZ', 'ZA', 'b'},
    'R': {'AZ', 'AV', 'VV', 'a'},
    'T': {'BR', 'AZ', 'AW', 'BB'},
    'Z': {'RR', 'CB', 'c'},
    'A': {'a'},
    'B': {'b'},
    'C': {'c'},
    'V': {'RT'},
    'W': {'ZC'},
}

w1 = 'abaaabbc'
w2 = 'acacc'

### Result for W1

In [43]:
cyk_algorithm(grammar, w1)

╒════════════╤════════════╤═════════════════╤════════════╤════════════╤════════════╤════════════╤════════════╕
│ a          │ b          │ a               │ a          │ a          │ b          │ b          │ c          │
╞════════════╪════════════╪═════════════════╪════════════╪════════════╪════════════╪════════════╪════════════╡
│ {'A', 'R'} │ {'S', 'B'} │ {'A', 'R'}      │ {'A', 'R'} │ {'A', 'R'} │ {'S', 'B'} │ {'S', 'B'} │ {'Z', 'C'} │
├────────────┼────────────┼─────────────────┼────────────┼────────────┼────────────┼────────────┼────────────┤
│ -          │ {'T'}      │ {'Z'}           │ {'Z'}      │ -          │ {'T'}      │ {'S'}      │ -          │
├────────────┼────────────┼─────────────────┼────────────┼────────────┼────────────┼────────────┼────────────┤
│ {'S', 'V'} │ {'S'}      │ {'T', 'S', 'R'} │ -          │ {'S', 'V'} │ -          │ -          │ -          │
├────────────┼────────────┼─────────────────┼────────────┼────────────┼────────────┼────────────┼────────────┤
│

### Result for W2

In [44]:
cyk_algorithm(grammar, w2)

╒══════════════════════╤════════════╤════════════╤════════════╤════════════╕
│ a                    │ c          │ a          │ c          │ c          │
╞══════════════════════╪════════════╪════════════╪════════════╪════════════╡
│ {'A', 'R'}           │ {'Z', 'C'} │ {'A', 'R'} │ {'Z', 'C'} │ {'Z', 'C'} │
├──────────────────────┼────────────┼────────────┼────────────┼────────────┤
│ {'T', 'R'}           │ {'S'}      │ {'T', 'R'} │ {'W'}      │ -          │
├──────────────────────┼────────────┼────────────┼────────────┼────────────┤
│ {'Z'}                │ {'S'}      │ {'T'}      │ -          │ -          │
├──────────────────────┼────────────┼────────────┼────────────┼────────────┤
│ {'Z', 'W', 'S', 'V'} │ {'S'}      │ -          │ -          │ -          │
├──────────────────────┼────────────┼────────────┼────────────┼────────────┤
│ {'W', 'S', 'V'}      │ -          │ -          │ -          │ -          │
╘══════════════════════╧════════════╧════════════╧════════════╧════════════╛