### Geração de textos com Cadeias de Markov

Equipe:<br>Mauro Coimbra Barreto Costa Neto<br>João Victor Dias

#### Configurando o ambiente

In [32]:
import numpy as np

In [33]:
class Markov:

  def __init__(self, filename, k):
    self.k = k
    self.text = self.load_text(filename)
    self.model = self.MarkovChain(self.text)

  def generateTable(self, data):
    T = {}
    for i in range(len(data) - self.k):
      X = data[i:i + self.k]
      Y = data[i + self.k]
      #print("X  %s and Y %s  "%(X,Y))

      if T.get(X) is None:
        T[X] = {}
        T[X][Y] = 1
      else:
        if T[X].get(Y) is None:
          T[X][Y] = 1
        else:
          T[X][Y] += 1
    return T

  def convertFreqIntoProb(self, T):
    for kx in T.keys():
      s = float(sum(T[kx].values()))
      for k in T[kx].keys():
        T[kx][k] = T[kx][k] / s
    return T

  def load_text(self, filename):
    with open(filename, encoding='utf8') as f:
      return f.read().lower()

  def MarkovChain(self, text):
    T = self.generateTable(text)
    T = self.convertFreqIntoProb(T)
    return T

  def sample_next(self, ctx):
    ctx = ctx[-self.k:]
    if self.model.get(ctx) is None:
      # Se o modelo se perder completamente, seu
      # estado é transformado em algum conhecido
      if ctx == " " * len(ctx):
        possible_Chars = list(self.model.keys())
        return " " + np.random.choice(possible_Chars)
      else:
        return " "
    possible_Chars = list(self.model[ctx].keys())
    possible_values = list(self.model[ctx].values())

    # print(possible_Chars)
    # print(possible_values)

    return np.random.choice(possible_Chars, p=possible_values)

  def generateText(self, starting_sent, maxLen=1000):
    sentence = starting_sent
    ctx = starting_sent[-self.k:]

    for ix in range(maxLen):
      next_prediction = self.sample_next(ctx)
      sentence += next_prediction
      ctx = sentence[-self.k:]
    return sentence

### Execução

In [34]:
models = []
for i in range(1, 11):
  models.append(Markov("data3.txt", i))

In [35]:
text = "Harry era feliz, mas um dia ele descobriu a verdade"
for i in range(len(models)):
  print(f"k = {i+1}")
  print(models[i].generateText(text, maxLen=200))
  print("")

k = 1
Harry era feliz, mas um dia ele descobriu a verdadesss ulomermesssrolto chuveveura cele cue e guu candosente.avove pose e ezemedê uramograso oueleleum dem qur. duaíroumer pa mbrarisse e espa hanor?
– ss, pesaoncham uelgum lesge nãozegorum to pr denze 

k = 2
Harry era feliz, mas um dia ele descobriu a verdade maiscursle se não eledra o fogatarou olharia murrofa. dumbletrou, fixos alça... estos dir umapriamento não deundoscobata, pas poto mursley seram alentem ele qua do os e consentento vocomeirmaissequen

k = 3
Harry era feliz, mas um dia ele descobriu a verdadez esculpanto achamais, pottermitiu espichandos mesmas melho quasegremora botar a cordade? – eu de silência sr. duda à pontrão tevetes mãe a no contadeirodescurio, que filho, se iluminhaponhos mas em m

k = 4
Harry era feliz, mas um dia ele descobriu a verdade excelente, jorge?”“bom, espeito mendeu marcha à profa. minhos. ospotter os potteraparece teriosas que tudo indício da partiu um mapa. paradoque o sr. dursley ao sr. 