### Geração de textos com Cadeias de Markov

Equipe:<br>Mauro Coimbra Barreto Costa Neto<br>João Victor Dias

#### Configurando o ambiente

In [2]:
import numpy as np

In [45]:
class Markov:

  def __init__(self, filename, k):
    self.k = k
    self.text = self.load_text(filename)
    self.model = self.MarkovChain(self.text)

  def generateTable(self, data):
    T = {}
    for i in range(len(data) - self.k):
      X = data[i:i + self.k]
      Y = data[i + self.k]
      #print("X  %s and Y %s  "%(X,Y))

      if T.get(X) is None:
        T[X] = {}
        T[X][Y] = 1
      else:
        if T[X].get(Y) is None:
          T[X][Y] = 1
        else:
          T[X][Y] += 1
    return T

  def convertFreqIntoProb(self, T):
    for kx in T.keys():
      s = float(sum(T[kx].values()))
      for k in T[kx].keys():
        T[kx][k] = T[kx][k] / s
    return T

  def load_text(self, filename):
    with open(filename, encoding='utf8') as f:
      return f.read().lower()

  def MarkovChain(self, text):
    T = self.generateTable(text)
    T = self.convertFreqIntoProb(T)
    return T

  def sample_next(self, ctx):
    ctx = ctx[-self.k:]
    if self.model.get(ctx) is None:
      return " "
    possible_Chars = list(self.model[ctx].keys())
    possible_values = list(self.model[ctx].values())

    # print(possible_Chars)
    # print(possible_values)

    return np.random.choice(possible_Chars, p=possible_values)

  def generateText(self, starting_sent, maxLen=1000):
    sentence = starting_sent
    ctx = starting_sent[-self.k:]

    for ix in range(maxLen):
      next_prediction = self.sample_next(ctx)
      sentence += next_prediction
      ctx = sentence[-self.k:]
    return sentence

### Execução

In [43]:
model = Markov("data2.txt", 6)

In [55]:
model.generateText("Harry e a sua mãe", maxLen=100)

'Harry e a sua mãe até a janela em tempo espichando-o por alguma coisas espantavam excitados. o sr. dursley ficou para'

In [53]:
models = []
for i in range(1, 7):
  models.append(Markov("data2.txt", i))

In [58]:
text = "Harry era feliz mas um dia"
for i in range(len(models)):
  print(f"k = {i+1}")
  print(models[i].generateText(text, maxLen=100))
  print("")

k = 1
Harry era feliz mas um diaqu te ende a spa sascodideso. uangatelentelir
– le. mo durm da az tte
– icumivêncre,
m gue priaome d

k = 2
Harry era feliz mas um diam apas tecebeças durslevera..
eledos onoi mursle-que imaria imo exassorry a um emosolhis não gart ti

k = 3
Harry era feliz mas um dia ao poder completa as de era e a julgar, surpreocurante, ele e temos dez dos
aprofa. minerva. noite.

k = 4
Harry era feliz mas um dia tendo quase
jogado do havia complesmeralda. – disse dumbledore parda que se tempo espero quase com 

k = 5
Harry era feliz mas um dia tão se meia, o sr. dursley
ficou quando uma espécie de casa,
esperada, profa. minerva.
– ah, é – di

k = 6
Harry era feliz mas um dia normalmente foi-se
embora? que fora do com isso. estava sentados cobertores. dentro, a primeira coi

