# Natural Language Processing

###  List 2

In [1]:
from src.parsers.token_parser import TokenParser
from src.poetry_generator import PoetryGenerator
from src.parsers.tag_parser import TagParser
from src.parsers.unigram_parser import UnigramParser
from src.parsers.bigram_parser import BigramParser
from src.parsers.sentence_parser import SentenceParser
from src.exceptions import NoRhyme

## Create required objects, structures etc.

In [2]:
tag_parser = TagParser()
unigrams_parser = UnigramParser('poleval_2grams.txt')
bigrams_parser = BigramParser('poleval_2grams.txt')
token_parser = TokenParser()
sentence_parser = SentenceParser()
poetry_generator = PoetryGenerator()

In [3]:
tagged_tokens = tag_parser.create_tag_token_pairs()
tag_sets = tag_parser.create_tags_struct()

In [4]:
unigrams = unigrams_parser.create_unigrams_struct()

In [5]:
bigrams = bigrams_parser.create_bigrams_struct(k=3)

## Make some tests

### Rhymes ends with token parser

In [6]:
# Some tests
print(token_parser.get_token_end_for_a_rhyme('ziemia'))
print(token_parser.get_token_end_for_a_rhyme('ul'))
print(token_parser.get_token_end_for_a_rhyme('lokomotywa'))
print(token_parser.get_token_end_for_a_rhyme('ara'))

iemia
ul
ywa
ara


### Generate a rhyme 

In [7]:
token_1, token_2 = 'szuka', 'kruka'
n_syl_1 = token_parser.count_syllables(token_1)
n_syl_2 = token_parser.count_syllables(token_2)

In [8]:
# Warning: possibility of raising NoRhyme exc
try:
    print(poetry_generator.generate_rhyme(token_1, token_2, tagged_tokens,
                                          unigrams, tag_sets,
                                          n_syllables_1=n_syl_1,
                                          n_syllables_2=n_syl_2))
except NoRhyme:
    pass

### Deleting interpunction marks

In [9]:
sentence_parser.delete_interpunction('Litwo! Ojczyzno moja? ty, jesteś jak zdrowie.')

['Litwo', 'Ojczyzno', 'moja', 'ty', 'jesteś', 'jak', 'zdrowie']

### Generate two verses

In [10]:
s1 = 'Litwo! Ojczyzno moja! ty jesteś jak zdrowie'
s2 = 'Ile cię trzeba cenić, ten tylko się dowie'

In [11]:
verses_1, meta_1 = poetry_generator.generate_rhymed_sentences(s1, s2, tagged_tokens,
                                                              unigrams, bigrams, tag_sets)

In [12]:
print(verses_1)
print(meta_1)

Gestio paolo która ty żyjesz jak zdrowie 
 ile cię wcale szukać nasz bardzo się dowie
tagged | predicted | tagged | tagged tagged tagged tagged 
 tagged tagged tagged tagged | tagged tagged tagged tagged


In [13]:
verses_2, meta_2 = poetry_generator.generate_rhymed_sentences(s1, s2, tagged_tokens,
                                                              unigrams, bigrams, tag_sets,
                                                              continuations=10)

In [14]:
print(verses_2)
print(meta_2)

Warto puerto która ty jesteś jak zdrowie 
 ile cię więcej wpłacać ten nigdy się dowie
tagged | predicted | tagged | tagged tagged tagged not_replaced 
 tagged tagged tagged tagged | tagged tagged tagged not_replaced


### Final poetry generation

In [15]:
frag_1 = """Litwo! Ojczyzno moja! ty jesteś jak zdrowie:
            Ile cię trzeba cenić, ten tylko się dowie,
            Kto cię stracił. Dziś piękność twą w całej ozdobie
            Widzę i opisuję, bo tęsknię po tobie."""

In [16]:
frag_1_1, frag_1_1_meta = poetry_generator.generate_frag_of_poetry(frag_1,
                                                                   tagged_tokens,
                                                                   unigrams,
                                                                   bigrams, tag_sets)

In [17]:
print(frag_1_1)
print(frag_1_1_meta)

Warto mauro która ty jesteś jak zdrowie 
 ile cię trochę kręcić ten oto dziś dowie
Kto cię stracił na wolność swą w tylnej osobie 
 widzę na informuję o pragnę na tobie
tagged | predicted | tagged | tagged tagged tagged tagged 
 tagged tagged tagged tagged | tagged tagged tagged tagged
tagged tagged tagged predicted tagged | tagged tagged tagged tagged 
 tagged tagged | tagged tagged | tagged tagged tagged


In [18]:
frag_1_2, frag_1_2_meta = poetry_generator.generate_frag_of_poetry(frag_1,
                                                                   tagged_tokens,
                                                                   unigrams,
                                                                   bigrams, tag_sets,
                                                                   continuations=10)

In [19]:
print(frag_1_2)
print(frag_1_2_meta)

Sporo marino która ty jesteś jak zdrowie 
 ile cię jako budzić nasz zawsze się dowie
Kto cię stracił na sprzedaż swą w całej chorobie 
 widzę więc informuję że mogę się tobie
tagged | predicted | tagged | tagged tagged tagged tagged 
 tagged tagged tagged | tagged tagged tagged tagged tagged
tagged tagged tagged predicted tagged | tagged tagged tagged tagged 
 tagged tagged tagged tagged tagged tagged tagged


In [20]:
frag_2 = """Śród takich pól przed laty, nad brzegiem ruczaju,
            Na pagórku niewielkim, we brzozowym gaju,
            Stał dwór szlachecki, z drzewa, lecz podmurowany;
            Świeciły się z daleka pobielane ściany,
            Tym bielsze, że odbite od ciemnej zieleni
            Topoli, co go bronią od wiatrów jesieni."""

In [21]:
frag_2_1, frag_2_1_meta = poetry_generator.generate_frag_of_poetry(frag_2,
                                                                   tagged_tokens,
                                                                   unigrams,
                                                                   bigrams, tag_sets)

In [22]:
print(frag_2_1)
print(frag_2_1_meta)

Klęsk których państw i biały i faktem funduszu 
 i teatrze niezgodnym czcze kontrolnym tuszu
Stał młyn zbożowy w słowa lecz importowany 
 uczyły się z daleka popełnione zmiany
Tym większe i mieszane i pitnej przyjaźni 
 mleczarni co go płacą za rządów bojaźni
tagged | tagged tagged tagged predicted tagged tagged tagged 
 tagged tagged | tagged | predicted | tagged tagged
tagged tagged tagged tagged tagged | tagged tagged 
 tagged tagged tagged tagged | tagged tagged
tagged tagged tagged tagged tagged tagged tagged 
 tagged | tagged tagged tagged tagged tagged tagged


In [23]:
frag_2_2, frag_2_2_meta = poetry_generator.generate_frag_of_poetry(frag_2,
                                                                   tagged_tokens,
                                                                   unigrams,
                                                                   bigrams, tag_sets,
                                                                   continuations=10)

In [24]:
print(frag_2_2)
print(frag_2_2_meta)

And naszych wojsk i stromy i potem kierunku 
 na terenie niezbędnym cne powszechnym trunku
Stał gród obronny w miejsca praw proponowany 
 trzymały się z rostowa prowadzone ściany
Tym większe i rozmyte i ciemnej przyjaźni 
 fundacji co go bronią i krzewów bojaźni
tagged | tagged tagged tagged predicted tagged tagged tagged 
 tagged tagged | tagged | predicted | tagged tagged
tagged tagged tagged tagged tagged | tagged tagged 
 tagged tagged tagged tagged | tagged tagged
tagged tagged tagged tagged tagged tagged tagged 
 tagged tagged tagged tagged tagged tagged tagged
