### идеи

1. Разбиение каждого высказывания на простые высказывания: 
    - предпосылки 
    - истинные утверждения
2. Классифицирование каждого простого утверждения: 
    - условие
    - следствие (проверку)
3. Составление логической формулы, обечпечивающей выполнение требования: 
    - ЕСЛИ составное условие ИСТИНА -> следствие ИСТИНА

1. Выделение только объекта проверки 
    - фильтры 
        - условия наличия 
        - условия типа, характеристик
        - условия геометрические 
2. Все остальное - условия проверки 

In [None]:
class KSI():
    '''
    KSI class
    '''
    def __init__(self, ksi:str, table:str, id, defenition:str):
        self.ksi = ksi
        self.table = table
        self.id = id
        self.defenition = defenition

    def __str__(self):
        return f"KSI: {self.ksi}, Table: {self.table}, ID: {self.id}"

In [None]:
class TestedElement():
    '''
    Element taken from information model with internal parameters
    '''
    def __init__(self, linked_element, linked_ksi:str):
        self.linked_element = linked_element
        self.linked_ksi = linked_ksi

In [None]:
from xml.etree.ElementTree import XML


class Rule():
    def __init__(self, id_rule, 
                 id_rule_doc, 
                 defenition:str,
                 logical_schema:XML,
                 check_function:function):
        self.id_rule = id_rule
        self.id_rule_doc = id_rule_doc
        self.defenition = defenition
        self.logical_schema = logical_schema
        self.check_function = check_function

    def __str__(self):
        return f"Rule id: {self.id_rule}, Rule id doc: {self.id_rule_doc}"

    def check_rule(self, tested_element:TestedElement):
        return self.check_function(tested_element, self.logical_schema)



In [None]:
def check_stairs(element:TestedElement):
    '''
    Check if stairs are correct
    '''
    ksi = element.linked_ksi
    if ksi.ksi == "Stairs":
        return True
    return False

In [1]:
sentence_SP1_13130_5_2_1 = "Уклон наружных открытых лестниц, используемых для эвакуации, в зданиях детских дошкольных учреждений должен составлять не более 45°. Ширину указанных лестниц допускается выполнять не менее 0,8 м."


if_oks_sentence_mod0 = "здание детское дошкольное учреждение"
if_sentence_mod1 = "лестница эвакуационная открытая наружная"
check_sentence_mod2 = "уклон лестницы должен быть менее 45 градусов"
check_sentence_mod2 = "ширина лестницы должен быть менее 0.8 метров"

### **Архитектура и стек технологий для автоматического извлечения смысловых элементов из строительных текстов**

Для реализации системы **автоматизированного анализа строительных документов** (выделение объектов, формализация логики, построение онтологии) можно использовать следующую **архитектуру и стек технологий**:

---

## **🔷 1. Общая архитектура**
Система состоит из **четырёх основных компонентов**:

1. **Модуль обработки текста (NLP Pipeline)**  
   - Выполняет предобработку текста (очистку, токенизацию, лемматизацию).  
   - Извлекает ключевые сущности (Named Entity Recognition, NER).  
   - Определяет отношения между объектами (Dependency Parsing, Relation Extraction).  

2. **Модуль семантического анализа и онтологии**  
   - Преобразует текстовые данные в **семантическую модель** (триплеты).  
   - Формирует **граф знаний** (Knowledge Graph).  
   - Генерирует **логические правила (IF-THEN)** для экспертной системы.  

3. **Модуль базы знаний (Knowledge Base & Ontology Management)**  
   - Сохраняет извлечённые данные в формате **RDF/OWL**.  
   - Позволяет делать **семантический поиск** по документам.  
   - Позволяет запускать **автоматические проверки соответствия нормам**.  

4. **Интерфейс пользователя**  
   - Веб-приложение или API для загрузки документов.  
   - Визуализация семантических связей в графе знаний.  
   - Возможность поиска и анализа требований.  

---

## **🔷 2. Подробный стек технологий**
| Компонент | Технологии |
|-----------|-------------|
| **Предобработка текста (NLP)** | `spaCy`, `NLTK`, `Stanza`, `Hugging Face Transformers` |
| **Выделение объектов (NER)** | `BERT-NER`, `DeepPavlov`, `spaCy Custom NER`, `Hugging Face (bert-base-multilingual-cased)` |
| **Извлечение зависимостей (Dependency Parsing)** | `spaCy Dependency Parsing`, `Stanza`, `UDPipe` |
| **Извлечение отношений (Relation Extraction, OpenIE)** | `OpenAI GPT`, `AllenNLP OpenIE`, `Stanford OpenIE` |
| **Генерация логических правил** | `Prolog`, `OWL Reasoners (HermiT, Pellet)`, `Drools` |
| **Граф знаний (Ontology Management, RDF/OWL)** | `Neo4j`, `RDF4J`, `Apache Jena`, `Protégé` |
| **База знаний (Knowledge Graph Storage)** | `PostgreSQL + RDF4J`, `Neo4j`, `GraphDB` |
| **Визуализация графа знаний** | `Neo4j Bloom`, `D3.js`, `Gephi`, `RDF Visualization Tools` |
| **Интерфейс пользователя (Frontend)** | `React.js`, `Vue.js`, `Django`, `Flask` |
| **API для обработки текстов** | `FastAPI`, `Flask`, `GraphQL` |
| **Машинное обучение (ML/DL)** | `PyTorch`, `TensorFlow`, `Transformers` |

---

## **🔷 3. Подробное описание работы системы**
### **📌 Шаг 1. Обработка входных документов**
- Загружаются **строительные нормативы, СНиП, ГОСТы, ТУ**.
- Текст очищается (удаление лишних символов, нормализация).
- Выполняется **токенизация, лемматизация, разбор предложений**.

### **📌 Шаг 2. Выделение ключевых элементов**
- **NER (Named Entity Recognition)** извлекает **объекты, параметры, процессы**.
- **Dependency Parsing** определяет структуру предложений.
- **Semantic Role Labeling (SRL)** выявляет **отношения между словами**.

> **Пример:**
> *"В котельных следует предусматривать регулирование температуры с помощью насосов."*  
>  
> → **NER-выход:**  
> ```json
> {
>   "Объекты": ["котельные", "насосы"],
>   "Процессы": ["регулирование температуры"],
>   "Действия": ["предусматривать"]
> }
> ```

### **📌 Шаг 3. Семантическое структурирование и онтология**
- Извлечённые данные представляются в виде **RDF-триплетов**:
  ```
  ex:Котельные ex:предусматривают ex:Регулирование_температуры .
  ex:Регулирование_температуры ex:использует ex:Насосы .
  ```
- Эти триплеты **сохраняются в графе знаний**.

### **📌 Шаг 4. Построение логических правил**
- Применяются логические **IF-THEN правила**:
  ```
  Если (Котельные работают без персонала)
  ТО (Необходимо автоматическое регулирование температуры)
  ```
- Эти правила загружаются в **экспертную систему**.

### **📌 Шаг 5. Визуализация и пользовательский интерфейс**
- Построенный **граф знаний отображается в интерфейсе**.
- Можно делать **семантический поиск** по нормам.
- Возможность **автоматической проверки соответствия требованиям**.

---

## **🔷 4. Пример архитектурной схемы**
```
                 ┌─────────────────────────────────────────┐
                 │  🏗️ Документы (СНиП, ГОСТ, ТУ)           │
                 └──────────────┬──────────────────────────┘
                                │
               ┌────────────────▼─────────────────┐
               │ 📜 NLP-модуль (spaCy, BERT, OpenIE) │
               │ - Токенизация                     │
               │ - NER (объекты, параметры)       │
               │ - Разбор зависимостей            │
               └──────────────┬───────────────────┘
                              │
               ┌──────────────▼───────────────┐
               │ 🧠 Семантический анализ      │
               │ - Генерация RDF-триплетов   │
               │ - Построение онтологии      │
               └──────────────┬──────────────┘
                              │
               ┌──────────────▼──────────────┐
               │ 🔗 Граф знаний (Neo4j, RDF4J) │
               │ - Хранение норм             │
               │ - Проверка соответствия     │
               └──────────────┬──────────────┘
                              │
               ┌──────────────▼──────────────┐
               │ 🎨 Веб-интерфейс (React.js) │
               │ - Поиск по нормам          │
               │ - Визуализация графа       │
               └───────────────────────────┘
```

---

## **🔷 5. Вывод**
- 🔹 **Используем NLP для извлечения смысловых элементов**  
- 🔹 **Формируем граф знаний на базе Neo4j/RDF**  
- 🔹 **Разрабатываем экспертную систему с логическими правилами**  
- 🔹 **Создаём веб-интерфейс для анализа нормативных документов**  

---

💡 **Данный стек технологий позволяет автоматизировать обработку строительных норм, выделять логические связи и проверять документацию на соответствие требованиям.** 🚀