# Реализации базы знаний для экспертной системы дифференциальной диагностики офтальмологических заболеваний

## Выбор представления знаний для экспертной системы








### Контекст

Дифференциальная диагностика офтальмологических заболеваний требует систематического анализа большого числа симптомов, которые могут пересекаться между различными патологиями. Для начинающих врачей особенно важно, чтобы процесс принятия решений был прозрачным, последовательным и не зависел от сложных статистических моделей.
В условиях ограниченных данных и отсутствия специализированного оборудования применение вероятностных или машинных методов диагностики оказывается затруднительным: такие подходы требуют больших обучающих выборок, а также создают трудности в интерпретации результатов.
Необходима структура представления знаний, которая позволит формализовать процесс рассуждения врача в виде понятной и проверяемой последовательности логических шагов, основанных на бинарных ответах «Да»/«Нет».

### Факторы, влияющие на принятие решения

- **Интерпретируемость** — необходимость, чтобы логика вывода была полностью прозрачна для пользователя (врача).
- **Ограниченность данных** — невозможность применения статистических методов и машинного обучения из-за малых выборок.
- **Простота модификации** — возможность обновления правил и добавления новых заболеваний без пересмотра всей модели.
- **Детерминированность** — одинаковый результат при одинаковом наборе ответов, что особенно важно для медицинской области.
- **Устойчивость к ошибкам данных** — система должна корректно работать даже при отсутствии некоторых симптомов или неполных ответах.

### Рассмотренные варианты


- **Правила на основе продукционных систем** (если–то): хорошо подходят для описания экспертных знаний, но при большом количестве симптомов и заболеваний создают избыточность и сложность сопровождения; логика связи между симптомами становится неочевидной.
- **Вероятностные модели (например, байесовские сети)**: позволяют учитывать неопределенность симптомов, однако требуют статистических данных и не всегда понятны для интерпретации начинающими специалистами.
- **Деревья решений**: обеспечивают прозрачную структуру, но статичны — при изменении логики диагностики дерево необходимо перестраивать полностью, что усложняет масштабирование.
- **Граф принятия решений**: обобщает дерево решений, позволяя использовать повторяющиеся узлы и связи. Каждая вершина графа представляет вопрос или промежуточное диагностическое состояние, а ребра описывают переход по ответу «Да» или «Нет». Такой подход сохраняет прозрачность логики и одновременно обеспечивает гибкость расширения.

### Результат решения

**Выбран вариант — граф принятия решений.**
Он обеспечивает формализованное и интерпретируемое представление экспертных знаний, позволяя моделировать процесс диагностики как пошаговый переход между состояниями. Алгоритмы обхода графа (DFS, BFS) используются для последовательного движения по вопросам до достижения финального диагноза.
В отличие от вероятностных моделей и деревьев решений, граф допускает использование общих подграфов (например, повторяющихся симптомов для разных заболеваний), что делает систему более компактной и управляемой.

### Последствия

**Положительные**
- Прозрачность и интерпретируемость логики вывода, что повышает доверие со стороны врачей.
- Возможность расширения графа без пересмотра всей модели, добавляя новые связи и узлы.
- Отсутствие зависимости от обучающих выборок и статистических параметров.
- Явная логическая структура, соответствующая клиническому мышлению врача.
- Простота визуализации диагностического процесса и его объяснения пользователю.

**Отрицательные**
- Модель не учитывает вероятности или степень выраженности симптомов.
- При значительном увеличении числа заболеваний граф может стать громоздким и требовать оптимизации структуры.
- Логика диагностики остается строго детерминированной и не адаптируется автоматически к новым данным.

## Источники офтальмологических данных и обоснование их достоверности

### Научные журналы и академические публикации

**Основные издания:**
- «Вестник офтальмологии» — НМИЦ глазных болезней им. Гельмгольца
- «Офтальмология» — Российское общество офтальмологов
- «Офтальмохирургия» — МНТК им. акад. С.Н. Фёдорова
- «Российская детская офтальмология»

**Обоснование достоверности:**
Все указанные журналы входят в перечень ВАК РФ и индексируются в РИНЦ и PubMed.
Каждая публикация проходит двойное слепое рецензирование, экспертную оценку методики и проверку достоверности статистических данных.
Использование этих источников гарантирует, что алгоритмы и диагностические подходы в системе основаны на результатах, признанных научным сообществом.

### Федеральные клинические рекомендации и нормативные документы

**Источники:**
- Минздрав РФ, Национальный медицинский исследовательский центр глазных болезней им. Гельмгольца
- МНТК «Микрохирургия глаза» им. С.Н. Фёдорова

**Обоснование достоверности:**
Клинические рекомендации формируются на основе систематических обзоров мировой литературы (500+ источников), проходят этап экспертного консенсуса (Delphi-метод) и утверждаются профильной комиссией Минздрава РФ.
Каждая рекомендация имеет уровень доказательности (A, B, C) согласно международной системе GRADE.

### Нормативные базы диагностического оборудования

**Примеры:**
- **Cirrus HD-OCT (Carl Zeiss Meditec)** — база данных более 15 000 здоровых пациентов
- **Heidelberg Spectralis (Heidelberg Engineering)** — нормативы структур зрительного нерва и сетчатки
- **RTvue XR Avanti (Optovue)** — эталонные показатели толщины сетчатки по возрастным и этническим группам

**Обоснование достоверности:**
Нормативные базы формируются производителями оборудования на основании обследования больших выборок здоровых людей с учётом пола, возраста и этнических различий.
Данные собираются по единым международным протоколам и обновляются по мере расширения статистики, что обеспечивает объективность сравнения параметров пациента с нормой.

### Международные базы данных и стандарты

**Основные источники:**
- *American Academy of Ophthalmology (AAO)* — клинические протоколы и стандарты диагностики (Preferred Practice Patterns).
- *European Society of Cataract and Refractive Surgeons (ESCRS)* — руководства по хирургическому и медикаментозному лечению заболеваний глаза.
- *Cochrane Library* — систематические обзоры и мета-анализы офтальмологических исследований с оценкой уровня доказательности.
- *ClinicalTrials.gov* — реестр международных клинических испытаний по глаукоме, катаракте, макулодистрофии и другим заболеваниям глаза.

**Обоснование достоверности:**
Международные базы данных обеспечивают доступ к результатам клинических исследований, выполненных по единым протоколам GCP (Good Clinical Practice).
Все представленные материалы проходят предварительную научную экспертизу, статистическую проверку и этическое одобрение.
Каждая публикация и исследование снабжены указанием уровня доказательности (Evidence Level I–III), что позволяет объективно оценивать качество и применимость данных.

## Визуализация базы знаний

In [2]:
!pip install neo4j networkx matplotlib

Collecting neo4j
  Downloading neo4j-6.0.2-py3-none-any.whl.metadata (5.2 kB)
Collecting networkx
  Using cached networkx-3.4.2-py3-none-any.whl.metadata (6.3 kB)
Collecting matplotlib
  Using cached matplotlib-3.10.6-cp310-cp310-manylinux2014_x86_64.manylinux_2_17_x86_64.whl.metadata (11 kB)
Collecting pytz (from neo4j)
  Using cached pytz-2025.2-py2.py3-none-any.whl.metadata (22 kB)
Collecting contourpy>=1.0.1 (from matplotlib)
  Using cached contourpy-1.3.2-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (5.5 kB)
Collecting cycler>=0.10 (from matplotlib)
  Using cached cycler-0.12.1-py3-none-any.whl.metadata (3.8 kB)
Collecting fonttools>=4.22.0 (from matplotlib)
  Downloading fonttools-4.60.1-cp310-cp310-manylinux2014_x86_64.manylinux_2_17_x86_64.whl.metadata (112 kB)
Collecting kiwisolver>=1.3.1 (from matplotlib)
  Using cached kiwisolver-1.4.9-cp310-cp310-manylinux_2_12_x86_64.manylinux2010_x86_64.whl.metadata (6.3 kB)
Collecting numpy>=1.23 (f

In [3]:
from neo4j import GraphDatabase
import networkx as nx
import matplotlib.pyplot as plt
import os

In [4]:
NEO4J_URI = os.environ.get("NEO4J_URI", "bolt://localhost:7687")
NEO4J_USER = os.environ.get("NEO4J_USER", "neo4j")
NEO4J_PASSWORD = os.environ.get("NEO4J_PASSWORD", "neo4j")

In [7]:
driver = GraphDatabase.driver(NEO4J_URI, auth=(NEO4J_USER, NEO4J_PASSWORD))

In [8]:
G = nx.DiGraph()

with driver.session() as session:
    # Получаем все узлы
    nodes_result = session.run("MATCH (n) RETURN n")
    for record in nodes_result:
        node = record["n"]
        node_id = node.id
        if "Question" in node.labels:
            label = node["text"]
            G.add_node(node_id, label=label, type='Question')
        else:
            label = node["name"]
            G.add_node(node_id, label=label, type='Disease')

    # Получаем все рёбра (ДА/НЕТ)
    edges_result = session.run("MATCH (a)-[r]->(b) RETURN a, b, r")
    for record in edges_result:
        source = record["a"].id
        target = record["b"].id
        # Если есть property "answer", используем его, иначе берем type
        label = record["r"].get("answer", record["r"].type)
        G.add_edge(source, target, label=label)

ClientError: {neo4j_code: Neo.ClientError.Security.CredentialsExpired} {message: ACCESS on database 'neo4j' is not allowed.

The credentials you provided were valid, but must be changed before you can use this instance. If this is the first time you are using Neo4j, this is to ensure you are not using the default credentials in production. If you are not using default credentials, you are getting this message because an administrator requires a password change.
To change your password, issue an `ALTER CURRENT USER SET PASSWORD FROM 'current password' TO 'new password'` statement against the system database.} {gql_status: 42NFF} {gql_status_description: error: syntax error or access rule violation - permission/access denied. Access denied, see the security logs for details.}

In [None]:
driver.close()

In [None]:
pos = nx.graphviz_layout(G, seed=42)

In [None]:
plt.figure(figsize=(12, 8))

In [None]:
question_nodes = [n for n, attr in G.nodes(data=True) if attr['type']=='Question']
disease_nodes = [n for n, attr in G.nodes(data=True) if attr['type']=='Disease']

In [None]:
nx.draw_networkx_nodes(G, pos, nodelist=question_nodes, node_color='lightblue', node_size=1200)
nx.draw_networkx_nodes(G, pos, nodelist=disease_nodes, node_color='lightgreen', node_size=1200)

In [None]:
nx.draw_networkx_edges(G, pos, arrowstyle='-|>', arrowsize=20)

In [None]:
labels = {n: attr['label'] for n, attr in G.nodes(data=True)}
nx.draw_networkx_labels(G, pos, labels, font_size=10)

In [None]:
edge_labels = {(u, v): d['label'] for u, v, d in G.edges(data=True)}
nx.draw_networkx_edge_labels(G, pos, edge_labels=edge_labels, font_color='red', font_size=10)

In [None]:
plt.axis('off')
plt.show()