In [1]:
from numpy.random import random

class MarkovChain:
    def __init__(self, state = 1) -> None:
        self.probabilities = {}
        self.state = state

    def _convertAListOfWordsInSentence(self, words):
        sentence = ''
        for word in words[:-1]:
            sentence += word + ' '
        sentence += words[-1]
        return sentence

    def setProbabilities(self, textPath:str):
        with open(textPath) as f:
            text = f.read()

        text = text.replace('\n', ' \n ').split(' ')
        words = {}
        words[''] = [self._convertAListOfWordsInSentence(text[0:self.state])]

        for i in range(0, len(text) - self.state - 1):
            pairs = text[i:i+self.state]
            pairs = self._convertAListOfWordsInSentence(pairs)

            if not pairs in words.keys():
                words[pairs] = []
            words[pairs].append(text[i+self.state])

        for startWord in words.keys():
            wordsAfter = words[startWord]
            self.probabilities[startWord] = [{'word': word, 'probability': wordsAfter.count(word)/len(wordsAfter)} for word in set(wordsAfter)]
            self.probabilities[startWord].sort(key=lambda x : x['probability'])
    
    def predictNextWord(self, word):
        nextWordProbabilities = self.probabilities[word]
        prob = random()

        start = 0
        for d in nextWordProbabilities:
            if start <= prob < start + d['probability']:
                return d['word']
            start += d['probability']
    
    def generateText(self, numberOfWords):
        word = self.predictNextWord('')
        text = word + ' '
        for _ in range(numberOfWords):
            nextWord = self.predictNextWord(word)
            text += nextWord + ' '
            tokens = word.split(' ')[1:] + [nextWord]
            word = self._convertAListOfWordsInSentence(tokens)
        return text

# Genereaza poezie

## O singura stare

In [2]:
markovChain = MarkovChain(1)
markovChain.setProbabilities('Luceafarul.txt')
poezie = markovChain.generateText(100)
print(poezie)

A fost 
 El o pǎdure ’ntreagǎ 
 Şi din urmă.” 
 Cum pot pricepe.” 
 În clipe drum de soare, 
 „ Cobori în zadar 
 Cînd sărutându-te mă ’nghiaţă.” 
 Unde e 
 Tu crezi în uitare rece 
 Cum pot pricepe; 
 O vin’, odorul meu coarde, 
 Le măsur vieţi 
 Au nu împiedec’ nici păcat 
 Şi soarele din cer o fâşie din locul lui menit din vină – cuvântul meu 
 S’aprinde iarăşi oameni. 
 El tremura ’n faptă să ’nceapă; 
 Tot ce moare, 
 Din bob în stele – 
 Atuncea chipu-i tremură 


## Mai multe stari

In [3]:
markovChain = MarkovChain(10)
markovChain.setProbabilities('Luceafarul.txt')
poezie = markovChain.generateText(100)
print(poezie)

A fost odată ca ’n poveşti, 
 A fost ca niciodată, 
 Din rude mari împărăteşti, 
 O prea frumoasă fată. 
 Şi era una la părinţi 
 Şi mândră ’n toate cele, 
 Cum e Fecioara între sfinţi 
 Şi luna între stele. 
 Din umbra falnicelor bolţi 
 Ea pasul şi-l îndreaptă 
 Lângă fereastră, unde ’n colţ 
 Luceafărul aşteaptă. 
 Privea în zare cum pe mări 
 Răsare şi străluce, 
 Pe mişcătoarele cărări 
 Corăbii negre duce. 
 Îl vede azi, îl vede mâni, 
 Astfel dorinţa-i gata: 
 El iar privind de săptămâni, 
 Îi cade dragă fata. 
 Cum ea pe coate-şi răzima 
