## Cadena de Markov

Una cadena de Markov es un objeto matemático que consiste en una secuencia de estados y un conjunto de probabilidades que describen las transiciones entre esos estados. La característica principal que tiene esta cadena es que la probabilidad de moverse a otros estados depende solamente del estado actual. Dada una cadena, se puede realizar una caminata aleatoria eligiendo un punto de partida y moviéndose a otros estados siguiendo las probabilidades de transición. Si de alguna manera encontramos una cadena de Markov con transiciones proporcionales a la distribución que queremos probar, el muestreo se convierte simplemente en una cuestión de moverse entre los estados de esta cadena.

**Ejemplo 1**: 

In [17]:
import numpy as np

phrase = 'start one erudeka two erudeka hail erudeka happy erudeka end'

# split the text file into single words
corpus = phrase.split()

In [19]:
# we define a function to give us all the pairs of words in the speeches. 
def make_pairs(corpus):
    for i in range(len(corpus)-1):
        yield (corpus[i], corpus[i+1])
        
pairs = make_pairs(corpus)

In [20]:
word_dict = {}
for word_1, word_2 in pairs:
    if word_1 in word_dict.keys():
        word_dict[word_1].append(word_2)
    else:
        word_dict[word_1] = [word_2]

In [28]:
word_dict

{'start': ['one'],
 'one': ['erudeka'],
 'erudeka': ['two', 'hail', 'happy', 'end'],
 'two': ['erudeka'],
 'hail': ['erudeka'],
 'happy': ['erudeka']}

In [31]:
#Finally we pick some random word to kick off the chain, and choose the number of words we want to simulate
first_word = np.random.choice(corpus)
chain = [first_word]
n_words = 5

In [32]:
for i in range(n_words):
    chain.append(np.random.choice(word_dict[chain[-1]]))

In [33]:
' '.join(chain)

'start one erudeka hail erudeka end'

**Ejemplo 2**: Para aplicar la Propiedad de Markov y crear un Modelo de Markov que pueda generar simulaciones de texto al estudiar varios discursos de Donald Trump en su campaña del 2016.

In [1]:
trump = open('../data/speeches.txt', encoding='utf8').read()

In [3]:
# split the text file into single words
corpus = trump.split()

In [5]:
# we define a function to give us all the pairs of words in the speeches. 
def make_pairs(corpus):
    for i in range(len(corpus)-1):
        yield (corpus[i], corpus[i+1])
        
pairs = make_pairs(corpus)

In [7]:
word_dict = {}
for word_1, word_2 in pairs:
    if word_1 in word_dict.keys():
        word_dict[word_1].append(word_2)
    else:
        word_dict[word_1] = [word_2]

In [8]:
#Finally we pick some random word to kick off the chain, and choose the number of words we want to simulate
first_word = np.random.choice(corpus)
chain = [first_word]
n_words = 30

In [10]:
for i in range(n_words):
    chain.append(np.random.choice(word_dict[chain[-1]]))

In [12]:
' '.join(chain)

'only the support immigration status. We won but we have 24 hours, they have a disaster. It’s one of it. You got them to do jobs. They haven’t even like it'

### Referencias
https://towardsdatascience.com/simulating-text-with-markov-chains-in-python-1a27e6d13fc6
PageRank https://www.cs.princeton.edu/~chazelle/courses/BIB/pagerank.htm