In [1]:
import re
import random

REFLEXAO = {
    r"\beu\b": "você",
    r"\bmeu\b": "seu",
    r"\bminha\b": "sua",
    r"\bmim\b": "você",
    r"\bme\b": "você",
    r"\bmeus\b": "seus",
    r"\bminhas\b": "suas",
    r"\bnosso\b": "seu",
    r"\bnos\b": "vocês",
    r"\bteu\b": "seu",
    r"\btu\b": "você",
    r"\bcontigo\b": "com você",
    r"\bele\b": "ele",
    r"\bela\b": "ela",
    r"\bé\b": "é",  # para evitar trocar acidentais
    r"\bvocê\b": "eu",
    r"\bseu\b": "meu",
    r"\bsua\b": "minha",
    r"\bseus\b": "meus",
    r"\bsuas\b": "minhas"
}

FRASES_NEUTRAS = [
    "Entendo. Pode elaborar um pouco mais?",
    "Como isso faz você se sentir?",
    "Pode dar um exemplo recente?",
    "O que você acha que está por trás disso?",
    "Interessante. Continue."
]

PADROES = [
    (re.compile(r".*\bestou (?:me )?sentindo (.+)", re.I),
     lambda m: f"Por que você está se sentindo {reflete(m.group(1))}?"),
    (re.compile(r".*\bestou (.+)", re.I),
     lambda m: f"Há quanto tempo você está {reflete(m.group(1))}?"),
    (re.compile(r".*\beu sinto (.+)", re.I),
     lambda m: f"Por que você sente {reflete(m.group(1))}?"),
    (re.compile(r".*\beu quero (.+)", re.I),
     lambda m: f"O que significaria para você conseguir {reflete(m.group(1))}?"),
    (re.compile(r".*\bporque (.+)", re.I),
     lambda m: "E se a razão for outra? O que mais poderia explicar isso?"),
    (re.compile(r".*\bsempre\b.*", re.I),
     lambda m: "Sempre? Consegue lembrar de uma situação em que foi diferente?"),
    (re.compile(r".*\b(não|nao)\b.*", re.I),
     lambda m: "Vejo negação aí. O que torna isso difícil para você?"),
    (re.compile(r".*\b(sim)\b.*", re.I),
     lambda m: "Ok. O que te faz ter certeza disso?"),
    (re.compile(r".*\b(mãe|mae|pai|familia)\b.*", re.I),
     lambda m: "Fale mais sobre sua família. Que papel isso tem na situação?"),
    (re.compile(r".*\bvocê é (.+)", re.I),
     lambda m: f"O que faz você pensar que eu sou {reflete(m.group(1))}?"),
    (re.compile(r".*\b(olá|oi|boa tarde|bom dia)\b.*", re.I),
     lambda m: "Olá. Em que gostaria de focar hoje?"),
    (re.compile(r".*\b(adeus|tchau|sair)\b.*", re.I),
     lambda m: "Tudo bem. Podemos retomar quando quiser.")
]

def reflete(texto: str) -> str:
    """Reflete pronomes para o estilo rogeriano."""
    out = " " + texto.strip() + " "
    for k, v in REFLEXAO.items():
        out = re.sub(k, v, out, flags=re.I)
    return out.strip()

def responder(frase: str) -> str:
    frase = frase.strip()
    if not frase:
        return "Fale um pouco do que está passando na sua cabeça."
    for pattern, handler in PADROES:
        m = pattern.match(frase)
        if m:
            return handler(m)
    return random.choice(FRASES_NEUTRAS)

def main():
    print("ELIZA-PT simples. Digite 'sair' para encerrar.")
    while True:
        try:
            user = input("> ")
        except EOFError:
            break
        if user.lower().strip() in {"sair", "tchau", "adeus"}:
            print("Até mais. Cuide-se.")
            break
        print(responder(user))

# ELIZA

Objetivo: mapear entradas de linguagem natural para respostas reflexivas.

Componentes:
- Tabela de reflexão (substituição de pronomes).
- Conjunto de padrões (regex) → funções geradoras.
- Fallback com respostas neutras.

In [2]:
import re
import random

REFLEXAO = {
    r"\beu\b": "você",
    r"\bmeu\b": "seu",
    r"\bminha\b": "sua",
    r"\bmim\b": "você",
    r"\bme\b": "você",
    r"\bmeus\b": "seus",
    r"\bminhas\b": "suas",
    r"\bnosso\b": "seu",
    r"\bnos\b": "vocês",
    r"\bteu\b": "seu",
    r"\btu\b": "você",
    r"\bcontigo\b": "com você",
    r"\bele\b": "ele",
    r"\bela\b": "ela",
    r"\bé\b": "é",
    r"\bvocê\b": "eu",
    r"\bseu\b": "meu",
    r"\bsua\b": "minha",
    r"\bseus\b": "meus",
    r"\bsuas\b": "minhas"
}

FRASES_NEUTRAS = [
    "Entendo. Pode elaborar um pouco mais?",
    "Como isso faz você se sentir?",
    "Pode dar um exemplo recente?",
    "O que você acha que está por trás disso?",
    "Interessante. Continue."
]

Função de reflexão:
- Aplica substituições sobre bordas de palavra com regex insensível a caso.
- Pré/pós-espaço evita colagem de tokens.

In [3]:
def reflete(texto: str) -> str:
    out = " " + texto.strip() + " "
    for k, v in REFLEXAO.items():
        out = re.sub(k, v, out, flags=re.I)
    return out.strip()

Padrões e despache:
- `PADROES`: tuplas `(regex_compilada, handler)`.
- `responder`: varre na ordem, aplica o primeiro match. Caso contrário, escolhe neutra.

In [4]:
PADROES = [
    (re.compile(r".*\bestou (?:me )?sentindo (.+)", re.I),
     lambda m: f"Por que você está se sentindo {reflete(m.group(1))}?"),
    (re.compile(r".*\bestou (.+)", re.I),
     lambda m: f"Há quanto tempo você está {reflete(m.group(1))}?"),
    (re.compile(r".*\beu sinto (.+)", re.I),
     lambda m: f"Por que você sente {reflete(m.group(1))}?"),
    (re.compile(r".*\beu quero (.+)", re.I),
     lambda m: f"O que significaria para você conseguir {reflete(m.group(1))}?"),
    (re.compile(r".*\bporque (.+)", re.I),
     lambda m: "E se a razão for outra? O que mais poderia explicar isso?"),
    (re.compile(r".*\bsempre\b.*", re.I),
     lambda m: "Sempre? Consegue lembrar de uma situação em que foi diferente?"),
    (re.compile(r".*\b(não|nao)\b.*", re.I),
     lambda m: "Vejo negação aí. O que torna isso difícil para você?"),
    (re.compile(r".*\b(sim)\b.*", re.I),
     lambda m: "Ok. O que te faz ter certeza disso?"),
    (re.compile(r".*\b(mãe|mae|pai|familia)\b.*", re.I),
     lambda m: "Fale mais sobre sua família. Que papel isso tem na situação?"),
    (re.compile(r".*\bvocê é (.+)", re.I),
     lambda m: f"O que faz você pensar que eu sou {reflete(m.group(1))}?"),
    (re.compile(r".*\b(olá|oi|boa tarde|bom dia)\b.*", re.I),
     lambda m: "Olá. Em que gostaria de focar hoje?"),
    (re.compile(r".*\b(adeus|tchau|sair)\b.*", re.I),
     lambda m: "Tudo bem. Podemos retomar quando quiser.")
]

def responder(frase: str) -> str:
    frase = frase.strip()
    if not frase:
        return "Fale um pouco do que está passando na sua cabeça."
    for pattern, handler in PADROES:
        m = pattern.match(frase)
        if m:
            return handler(m)
    return random.choice(FRASES_NEUTRAS)

In [5]:
responder("oi")

'Olá. Em que gostaria de focar hoje?'

# Cadeias de Markov para geração de texto

Modelo:
- Cada palavra = estado.
- Transição $P(w_{t+1} \mid w_t)$ estimada pela frequência no corpus.
- Geração: sorteio do próximo estado segundo $P$ até atingir o tamanho desejado.

Passos:
1. Pré-processamento do corpus.
2. Geração de N-gramas.
3. Construção da matriz de transição.
4. Amostragem para gerar texto.

In [6]:
import re
import numpy as np
from nltk import ngrams

# Texto de exemplo
text = """
O gato preto corre pelo jardim e o gato branco dorme na cadeira
o gato branco observa o gato preto e o gato preto observa o gato branco
o gato preto e o gato branco gostam de brincar no jardim
"""

# 1. Pré-processamento
text = re.sub(r"[^a-zA-Z0-9\s]", "", text)  # remove pontuação
text = text.lower()

tokens = text.split()
tokens

['o',
 'gato',
 'preto',
 'corre',
 'pelo',
 'jardim',
 'e',
 'o',
 'gato',
 'branco',
 'dorme',
 'na',
 'cadeira',
 'o',
 'gato',
 'branco',
 'observa',
 'o',
 'gato',
 'preto',
 'e',
 'o',
 'gato',
 'preto',
 'observa',
 'o',
 'gato',
 'branco',
 'o',
 'gato',
 'preto',
 'e',
 'o',
 'gato',
 'branco',
 'gostam',
 'de',
 'brincar',
 'no',
 'jardim']

## Geração de N-gramas

- N-grama de ordem 2 (bigramas):
$$
(w_t, w_{t+1})
$$

In [7]:
n = 2
n_grams = list(ngrams(tokens, n))
n_grams

[('o', 'gato'),
 ('gato', 'preto'),
 ('preto', 'corre'),
 ('corre', 'pelo'),
 ('pelo', 'jardim'),
 ('jardim', 'e'),
 ('e', 'o'),
 ('o', 'gato'),
 ('gato', 'branco'),
 ('branco', 'dorme'),
 ('dorme', 'na'),
 ('na', 'cadeira'),
 ('cadeira', 'o'),
 ('o', 'gato'),
 ('gato', 'branco'),
 ('branco', 'observa'),
 ('observa', 'o'),
 ('o', 'gato'),
 ('gato', 'preto'),
 ('preto', 'e'),
 ('e', 'o'),
 ('o', 'gato'),
 ('gato', 'preto'),
 ('preto', 'observa'),
 ('observa', 'o'),
 ('o', 'gato'),
 ('gato', 'branco'),
 ('branco', 'o'),
 ('o', 'gato'),
 ('gato', 'preto'),
 ('preto', 'e'),
 ('e', 'o'),
 ('o', 'gato'),
 ('gato', 'branco'),
 ('branco', 'gostam'),
 ('gostam', 'de'),
 ('de', 'brincar'),
 ('brincar', 'no'),
 ('no', 'jardim')]

## Matriz de transição

- Vocabulário: conjunto de palavras únicas.
- $M_{ij} =$ número de vezes que $w_j$ segue $w_i$.
- Normalização: $$P_{ij} = \frac{M_{ij}}{\sum_k M_{ik}}$$

In [8]:
unique_words = list(set(tokens))
V = len(unique_words)

transition_matrix = np.zeros((V, V))

# Contagem de transições
for i, word in enumerate(unique_words):
    for j, next_word in enumerate(unique_words):
        count = sum(1 for g in n_grams if g[0] == word and g[1] == next_word)
        transition_matrix[i, j] = count

# Normalização linha a linha
transition_matrix = transition_matrix / transition_matrix.sum(axis=1, keepdims=True)
transition_matrix

array([[0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.5 , 0.  , 0.  ,
        0.  , 0.  , 0.  , 0.5 , 0.  ],
       [0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  ,
        0.  , 0.  , 0.  , 0.  , 1.  ],
       [0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  ,
        0.  , 1.  , 0.  , 0.  , 0.  ],
       [0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 1.  , 0.  ,
        0.  , 0.  , 0.  , 0.  , 0.  ],
       [0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 1.  , 0.  , 0.  , 0.  ,
        0.  , 0.  , 0.  , 0.  , 0.  ],
       [0.  , 0.  , 0.  , 1.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  ,
        0.  , 0.  , 0.  , 0.  , 0.  ],
       [0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  ,
        0.  , 0.  , 1.  , 0.  , 0.  ],
       [0.  , 0.  , 1.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  ,
        0.  , 0.  , 0.  , 0.  , 0.  ],
       [0.  , 0.  , 0.  , 0.  , 0.  , 0.25, 0.  , 0.  , 0.  , 0.  , 0.25,
        0.25, 0.25, 0.

## Geração de texto

- Palavra inicial: $w_0$.
- Para cada passo:
  1. Escolher próximo índice segundo $P(\cdot \mid w_t)$.
  2. Atualizar palavra corrente.

In [9]:
current_word = "o"
generated = [current_word]

for _ in range(10):
    idx = unique_words.index(current_word)
    probs = transition_matrix[idx]
    next_idx = np.random.choice(len(unique_words), p=probs)
    next_word = unique_words[next_idx]
    generated.append(next_word)
    current_word = next_word

" ".join(generated)

'o gato preto e o gato branco dorme na cadeira o'