Алгоритмы обхода графа:
1) В глубину: идём как можно дальше
2) В ширину: сначала обрабатываем всех ближайших соседей, а потом идём дальше

In [None]:
from copy import deepcopy

class Graph2:
    def __init__(self):
        self.lists = []
        self.values = []

    def add_node(self, value):
        self.lists.append([])
        self.values.append(value)

    def add_link(self, node, linked_node):
        self.lists[node].append(linked_node)
        self.lists[linked_node].append(node)
        self.lists[node].sort()
        self.lists[linked_node].sort()

    def remove_link(self, node, linked_node):
        self.lists[node].remove(linked_node)
        self.lists[linked_node].remove(node)

    @classmethod
    def from_matrix(cls, graph):
        new_graph = cls()
        new_graph.values = deepcopy(graph.values)
        new_graph.lists = [[] for i in graph.matrix]
        for i in range(len(graph.matrix)):
            for j in range(len(graph.matrix[i])):
                if graph.matrix[i][j] == 1:
                    new_graph.lists[i].append(j)
            new_graph.lists[i].sort()
        return new_graph

    def depth_first_search(self, start=0):
        path = []
        stack = [start]
        while stack:
            index = stack.pop()
            if index in path:
                continue
            path.append(index)
            print(index, self.values[index])
            for element in reversed(self.lists[index]):
                if element not in path:
                    stack.append(element)

    def breadth_first_search(self, start=0):
        path = []
        queue = [start]
        while queue:
            index = queue.pop(0)
            if index in path:
                continue
            path.append(index)
            print(index, self.values[index])
            for element in self.lists[index]:
                if element not in path:
                    queue.append(element)

    def display_lists(self):
        for i in self.lists:
            print(i)

In [None]:
graph = Graph2()
for v in "ABCDEFG":
    graph.add_node(v)
graph.add_link(0, 1)
graph.add_link(0, 2)
graph.add_link(0, 4)
graph.add_link(1, 3)
graph.add_link(1, 5)
graph.add_link(2, 6)
graph.add_link(5, 4)

graph.display_lists()
graph.breadth_first_search()

[1, 2, 4]
[0, 3, 5]
[0, 6]
[1]
[0, 5]
[1, 4]
[2]
0 A
1 B
2 C
4 E
3 D
5 F
6 G


Реализуем взвешенный направленный граф (каждой связи присвоим вес)

In [None]:
from copy import deepcopy

class WeightedGraph:
    def __init__(self):
        self.matrix = []
        self.values = []

    def add_node(self, value):
        if not self.matrix:
            self.matrix.append([0])
        else:
            self.matrix.append([0 for i in range(len(self.matrix))])
            for i in self.matrix:
                i.append(0)
        self.values.append(value)

    def add_link(self, node, linked_node, weight):
        self.matrix[node][linked_node] = weight

    def remove_link(self, node, linked_node):
        self.matrix[node][linked_node] = 0

    # альтернативный конструктор: как создать новый экземпляр класса, не вызывая __init__ напрямую
    @classmethod
    def from_lists(cls, graph):
        new_graph = cls()
        new_graph.values = deepcopy(graph.values)
        new_graph.matrix = [[0 for i in graph.lists] for i in graph.lists]
        for i in range(len(graph.lists)):
            for j in graph.lists[i]:
                new_graph.matrix[i][j] = 1
        return new_graph

    def display_matrix(self):
        for i in self.matrix:
            print(i)

Цепь Маркова:

In [None]:
class MarkovChain(WeightedGraph):
    def __init__(self):
        super().__init__()
        self.initial_distribution = []    

In [None]:
from string import punctuation

with open("duel.txt", "r", encoding="utf-8") as f:
    words = f.read().split()
    words = [w.strip(punctuation).lower() for w in words]
    words = [w for w in words if w]

print(words)

['антон', 'павлович', 'чехов', 'дуэль', 'i', 'было', 'восемь', 'часов', 'утра', 'время', 'когда', 'офицеры', 'чиновники', 'и', 'приезжие', 'обыкновенно', 'после', 'жаркой', 'душной', 'ночи', 'купались', 'в', 'море', 'и', 'потом', 'шли', 'в', 'павильон', 'пить', 'кофе', 'или', 'чай', 'иван', 'андреич', 'лаевский', 'молодой', 'человек', 'лет', '28', 'худощавый', 'блондин', 'в', 'фуражке', 'министерства', 'финансов', 'и', 'в', 'туфлях', 'придя', 'купаться', 'застал', 'на', 'берегу', 'много', 'знакомых', 'и', 'между', 'ними', 'своего', 'приятеля', 'военного', 'доктора', 'самойленко', 'с', 'большой', 'стриженой', 'головой', 'без', 'шеи', 'красный', 'носастый', 'с', 'мохнатыми', 'черными', 'бровями', 'и', 'с', 'седыми', 'бакенами', 'толстый', 'обрюзглый', 'да', 'еще', 'вдобавок', 'с', 'хриплым', 'армейским', 'басом', 'этот', 'самойленко', 'на', 'всякого', 'вновь', 'приезжавшего', 'производил', 'неприятное', 'впечатление', 'бурбона', 'и', 'хрипуна', 'но', 'проходило', 'два-три', 'дня', 'после

In [None]:
from collections import Counter
counts = Counter(words)
print(counts)

Counter({'и': 1733, 'в': 751, 'не': 608, 'он': 522, 'что': 479, 'на': 429, 'с': 364, 'я': 342, 'как': 296, 'а': 235, 'его': 232, 'это': 198, 'она': 190, 'у': 184, 'сказал': 174, 'к': 173, 'но': 171, 'то': 169, 'лаевский': 166, 'бы': 165, 'же': 153, 'ему': 144, 'от': 132, 'самойленко': 130, 'за': 128, 'ты': 124, 'так': 124, 'фон': 122, 'по': 118, 'только': 114, 'ее': 110, 'или': 109, 'вы': 104, 'из': 102, 'было': 97, 'когда': 97, 'если': 96, 'дьякон': 91, 'всё': 87, 'корен': 86, 'чтобы': 83, 'меня': 81, 'да': 78, 'надежда': 76, 'мне': 75, 'федоровна': 75, 'него': 74, 'о': 72, 'ей': 71, 'себя': 65, 'вас': 63, 'для': 61, 'до': 61, 'был': 59, 'все': 58, 'мы': 58, 'вот': 53, 'будет': 52, 'они': 51, 'ничего': 49, 'потом': 48, 'уже': 48, 'их': 47, 'лаевского': 47, 'теперь': 46, 'человек': 44, 'со': 44, 'очень': 44, 'ним': 44, 'есть': 44, 'нет': 44, 'быть': 43, 'ни': 42, 'вам': 40, 'еще': 39, 'надо': 39, 'зоолог': 39, 'время': 38, 'лицо': 38, 'тебе': 37, 'ли': 37, 'около': 36, 'была': 35, 'себ

In [None]:
combinations = []
for i in range(len(words) - 1):
    combinations.append(words[i] + " " + words[i + 1])

pair_counts = Counter(combinations)
print(pair_counts)

Counter({'фон корен': 86, 'надежда федоровна': 75, 'и не': 48, 'я не': 43, 'что он': 39, 'и в': 37, 'сказал он': 32, 'и сказал': 30, 'у него': 30, 'марья константиновна': 29, 'что я': 28, 'если бы': 28, 'с ним': 27, 'и что': 26, 'и с': 25, 'сказал самойленко': 25, 'как будто': 25, 'что она': 24, 'он не': 24, 'у меня': 23, 'сказал фон': 23, 'то что': 22, 'потому что': 21, 'не в': 21, 'и он': 21, 'александр давидыч': 20, 'фон корена': 20, 'как бы': 19, 'ничего не': 19, 'не было': 18, 'и на': 18, 'как это': 17, 'что ты': 17, 'так как': 17, 'как он': 17, 'сказал лаевский': 16, 'казалось что': 16, 'и всё': 16, 'с ней': 15, 'глядя на': 15, 'так же': 15, 'на него': 15, 'у вас': 15, 'самом деле': 14, 'но я': 14, 'надежды федоровны': 14, 'и как': 14, 'к нему': 14, 'и я': 14, 'с нею': 13, 'то я': 13, 'и это': 13, 'то же': 13, 'в самом': 13, 'боже мой': 13, 'думал он': 13, 'том что': 13, 'что у': 12, 'надеждой федоровной': 12, 'в том': 12, 'всё это': 12, 'у нее': 12, 'а я': 12, 'когда он': 12, 'н

Выбираем самое частотное слово в качестве первого, затем для каждого слова выбираем то, которое будет следовать за ним с наибольшей вероятностью.

In [None]:
chain = MarkovChain()
for i in counts:
    chain.add_node(i)

chain.initial_distribution = [counts[i] / len(words) for i in counts]
for i in pair_counts:
    word1, word2 = i.split()
    first_index = chain.values.index(word1)
    second_index = chain.values.index(word2)
    # prob = pair_counts[i] / sum([pair_counts[w] for w in pair_counts if word1 == w.split()[0]])
    prob = pair_counts[i] / counts[word1]
    chain.add_link(first_index, second_index, prob)

N = 10
max_prob = max(chain.initial_distribution)
max_index = chain.initial_distribution.index(max_prob)
for i in range(N):
    print(chain.values[max_index])
    max_prob = max(chain.matrix[max_index])
    max_index = chain.matrix[max_index].index(max_prob)

и
не
в
самом
деле
любил
своего
приятеля
военного
доктора


Дополнительное задание: выбирать не самое вероятное слово каждый раз, а использовать параметр weights у функции random.choices()

https://docs.python.org/3/library/random.html#random.choices