In [1]:
import pandas as pd
from qdrant_client import QdrantClient
from langchain_qdrant import QdrantVectorStore
from qdrant_client.http.models import Distance, VectorParams
from langchain_huggingface import HuggingFaceEmbeddings
from tqdm import tqdm
from langchain_community.document_loaders import Docx2txtLoader, PDFPlumberLoader
from pathlib import Path
import os
from langchain.text_splitter import RecursiveCharacterTextSplitter
import hashlib, time

In [2]:
import pathlib, subprocess

def docx_to_pdf_linux(input_docx: str, output_pdf: str | None = None) -> str:
    input_docx = os.path.abspath(input_docx)
    out_dir = os.path.abspath(os.path.dirname(output_pdf)) if output_pdf else os.path.dirname(input_docx)
    os.makedirs(out_dir, exist_ok=True)

    # LibreOffice положит PDF в out_dir с тем же именем
    subprocess.run(
        ["soffice", "--headless", "--convert-to", "pdf", "--outdir", out_dir, input_docx],
        check=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE
    )
    if output_pdf is None:
        output_pdf = os.path.join(out_dir, pathlib.Path(input_docx).with_suffix(".pdf").name)
    return output_pdf

In [3]:
client = QdrantClient(
    host="localhost",
    port=6333
)

In [4]:
client.get_collections()

CollectionsResponse(collections=[CollectionDescription(name='norma_ai_collection_ru-en-RoSBERTa')])

In [28]:
model_name = "ai-forever/ru-en-RoSBERTa"
model_kwargs = {"device":"cpu"}
encode_kwargs = {'normalize_embeddings': True, 'batch_size': 128}

embeddings_model = HuggingFaceEmbeddings(
    model_name=model_name,
    model_kwargs=model_kwargs,
    encode_kwargs=encode_kwargs,
)

Some weights of RobertaModel were not initialized from the model checkpoint at ai-forever/ru-en-RoSBERTa and are newly initialized: ['pooler.dense.bias', 'pooler.dense.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


In [6]:

def payload_for(doc):
    text = doc.page_content
    source_path =doc.metadata['source']
    return {
        "source": source_path,
        "filename": os.path.basename(source_path),
        "doc_type": os.path.splitext(source_path)[1].lower().strip("."),
        "page": doc.metadata.get("page"),
        "title": doc.metadata.get("Title"),
        "created_at": int(time.time()),
        "sha1": hashlib.sha1(text.encode("utf-8", "ignore")).hexdigest(),
        # "lang": detect_lang(text)  # см. п.4
    }

In [None]:
# emb_dim = len(embeddings_model.embed_query("probe"))

In [None]:
# client.create_collection(
#     collection_name="norma_ai_collection_ru-en-RoSBERTa",
#     vectors_config=VectorParams(size=emb_dim, distance=Distance.COSINE),
# )

True

In [7]:
all_documents = os.listdir('../data')
paths = '/srv/norma_ai/norma_ai_project/data/'

loaded_docs = []
broken_files = []


for i, p in enumerate(tqdm(all_documents, desc="Enumerating")):
    print(f'Файл № {i+1}')
    current_path = paths + p
    print(f"Trying to load file: {p}")
    if current_path.lower().endswith(".docx"):
        try:
            out_path = docx_to_pdf_linux(current_path, current_path[:current_path.rfind('.')] + '.pdf')
            loaded_docs.extend(PDFPlumberLoader(out_path).load())
            print(f"The download was successful: {p}")
            print('-'*50)
        except Exception as e:
            print(f'Нерабочий файл: {p}')
            broken_files.append(p)
            print('-'*50)
            continue
    elif current_path.lower().endswith(".pdf"):
        path = Path(current_path)
        try:
            loaded_docs.extend(PDFPlumberLoader(str(path)).load())
            print(f"The download was successful: {p}")
            print('-'*50)
        except Exception as e:
            print(f'Нерабочий файл: {p}')
            broken_files.append(p)
            print('-'*50)
            continue
    else:
        broken_files.append(p)

Enumerating:   0%|          | 0/45 [00:00<?, ?it/s]

Файл № 1
Trying to load file: 5. ФЗ 69 О пожарной безопасности.pdf


Enumerating:   2%|▏         | 1/45 [00:04<02:57,  4.03s/it]

The download was successful: 5. ФЗ 69 О пожарной безопасности.pdf
--------------------------------------------------
Файл № 2
Trying to load file: СП 68.13330.2017 Приемка в эксплуатацию законченных строительство объектов.pdf


Enumerating:   4%|▍         | 2/45 [00:07<02:42,  3.78s/it]

The download was successful: СП 68.13330.2017 Приемка в эксплуатацию законченных строительство объектов.pdf
--------------------------------------------------
Файл № 3
Trying to load file: ГОСТ 31385-2016 Резервуары вертикальные цилиндрические стальные.pdf


Enumerating:   7%|▋         | 3/45 [00:17<04:27,  6.37s/it]

The download was successful: ГОСТ 31385-2016 Резервуары вертикальные цилиндрические стальные.pdf
--------------------------------------------------
Файл № 4
Trying to load file: 17. Приказ РТН № 567.pdf


Enumerating:   9%|▉         | 4/45 [00:17<02:48,  4.11s/it]

The download was successful: 17. Приказ РТН № 567.pdf
--------------------------------------------------
Файл № 5
Trying to load file: 8.1. ФЗ 190 Градостроительный кодекс РФ.pdf


Enumerating:  11%|█         | 5/45 [01:04<12:57, 19.45s/it]

The download was successful: 8.1. ФЗ 190 Градостроительный кодекс РФ.pdf
--------------------------------------------------
Файл № 6
Trying to load file: ГОСТ Р 58329-2018.pdf


Enumerating:  13%|█▎        | 6/45 [01:22<12:26, 19.13s/it]

The download was successful: ГОСТ Р 58329-2018.pdf
--------------------------------------------------
Файл № 7
Trying to load file: ГОСТ Р 55990-2014.pdf


Enumerating:  16%|█▌        | 7/45 [01:38<11:23, 17.99s/it]

The download was successful: ГОСТ Р 55990-2014.pdf
--------------------------------------------------
Файл № 8
Trying to load file: 14. Приказ МЧС России № 302.pdf


Enumerating:  18%|█▊        | 8/45 [01:42<08:18, 13.47s/it]

The download was successful: 14. Приказ МЧС России № 302.pdf
--------------------------------------------------
Файл № 9
Trying to load file: 18. Приказ РТН № 534 ФНИП Правила безопасности в нефтяной и газовой промышленности.pdf


Enumerating:  20%|██        | 9/45 [02:15<11:45, 19.59s/it]

The download was successful: 18. Приказ РТН № 534 ФНИП Правила безопасности в нефтяной и газовой промышленности.pdf
--------------------------------------------------
Файл № 10
Trying to load file: 19.1 Приказ РТН № 444 ФНИП Правила промышленной безопасности при эксплуатации технологических трубопроводов.pdf


Enumerating:  22%|██▏       | 10/45 [02:19<08:35, 14.73s/it]

The download was successful: 19.1 Приказ РТН № 444 ФНИП Правила промышленной безопасности при эксплуатации технологических трубопроводов.pdf
--------------------------------------------------
Файл № 11
Trying to load file: 5. ФЗ 184 О техническом регулировании.pdf


Enumerating:  24%|██▍       | 11/45 [02:27<07:15, 12.80s/it]

The download was successful: 5. ФЗ 184 О техническом регулировании.pdf
--------------------------------------------------
Файл № 12
Trying to load file: 1. ТР ЕАЭС 049-2020 О требованиях к магистральным трубопроводам для транспортирования жидких и газообразных углеводородов.pdf


Enumerating:  27%|██▋       | 12/45 [02:30<05:26,  9.89s/it]

The download was successful: 1. ТР ЕАЭС 049-2020 О требованиях к магистральным трубопроводам для транспортирования жидких и газообразных углеводородов.pdf
--------------------------------------------------
Файл № 13
Trying to load file: 3. ТР ТС 012-2011.pdf


Enumerating:  29%|██▉       | 13/45 [02:34<04:12,  7.88s/it]

The download was successful: 3. ТР ТС 012-2011.pdf
--------------------------------------------------
Файл № 14
Trying to load file: Постановление Правительства РФ от 17.08.2020 N 1243.pdf


Enumerating:  31%|███       | 14/45 [02:34<02:53,  5.59s/it]

The download was successful: Постановление Правительства РФ от 17.08.2020 N 1243.pdf
--------------------------------------------------
Файл № 15
Trying to load file: 19. Приказ РТН № 536 ФНИП Правила промышленной безопасности при использовании оборудования, работающего под избыточным давлением.pdf


Enumerating:  33%|███▎      | 15/45 [02:58<05:37, 11.24s/it]

The download was successful: 19. Приказ РТН № 536 ФНИП Правила промышленной безопасности при использовании оборудования, работающего под избыточным давлением.pdf
--------------------------------------------------
Файл № 16
Trying to load file: 25. Приказ РТН № 784 Рекомендации по устройству и безопасной эксплуатации технологических трубопроводов.pdf


Enumerating:  36%|███▌      | 16/45 [03:09<05:24, 11.18s/it]

The download was successful: 25. Приказ РТН № 784 Рекомендации по устройству и безопасной эксплуатации технологических трубопроводов.pdf
--------------------------------------------------
Файл № 17
Trying to load file: СП 83.13330.2016 Промышленные печи и кирпичные трубы.pdf


Enumerating:  38%|███▊      | 17/45 [03:17<04:39, 10.00s/it]

The download was successful: СП 83.13330.2016 Промышленные печи и кирпичные трубы.pdf
--------------------------------------------------
Файл № 18
Trying to load file: 10. Постановление Правительства № 1437 Об утверждении Положения о разработке ПМЛЛПА на ОПО.pdf


Enumerating:  40%|████      | 18/45 [03:17<03:15,  7.24s/it]

The download was successful: 10. Постановление Правительства № 1437 Об утверждении Положения о разработке ПМЛЛПА на ОПО.pdf
--------------------------------------------------
Файл № 19
Trying to load file: 4.0. ФЗ 7 Об охране окружающей среды.pdf


Enumerating:  42%|████▏     | 19/45 [03:52<06:38, 15.34s/it]

The download was successful: 4.0. ФЗ 7 Об охране окружающей среды.pdf
--------------------------------------------------
Файл № 20
Trying to load file: 21. Приказ РТН № 330.pdf


Enumerating:  44%|████▍     | 20/45 [04:02<05:44, 13.79s/it]

The download was successful: 21. Приказ РТН № 330.pdf
--------------------------------------------------
Файл № 21
Trying to load file: СТО 9.3-011-2011 Ингибиторная защита от коррозии.pdf


Enumerating:  47%|████▋     | 21/45 [04:05<04:16, 10.68s/it]

The download was successful: СТО 9.3-011-2011 Ингибиторная защита от коррозии.pdf
--------------------------------------------------
Файл № 22
Trying to load file: СТО Газпром НТП 1.8-001-2004.pdf


Enumerating:  49%|████▉     | 22/45 [04:25<05:12, 13.57s/it]

The download was successful: СТО Газпром НТП 1.8-001-2004.pdf
--------------------------------------------------
Файл № 23
Trying to load file: ГОСТ Р 58972-2020 Общие правила отбора образцов для испытаний продукции при подтверждении соответствия.pdf


Enumerating:  51%|█████     | 23/45 [04:26<03:34,  9.75s/it]

The download was successful: ГОСТ Р 58972-2020 Общие правила отбора образцов для испытаний продукции при подтверждении соответствия.pdf
--------------------------------------------------
Файл № 24
Trying to load file: 17. Приказ РТН № 420 ФНИП Правила проведения экспертизы промышленной безопасности.pdf


Enumerating:  53%|█████▎    | 24/45 [04:27<02:28,  7.08s/it]

The download was successful: 17. Приказ РТН № 420 ФНИП Правила проведения экспертизы промышленной безопасности.pdf
--------------------------------------------------
Файл № 25
Trying to load file: Федеральный закон от 31.07.2020 N 248-ФЗ О государственном контроле (надзоре) и муниципальном.pdf


Enumerating:  56%|█████▌    | 25/45 [04:38<02:44,  8.22s/it]

The download was successful: Федеральный закон от 31.07.2020 N 248-ФЗ О государственном контроле (надзоре) и муниципальном.pdf
--------------------------------------------------
Файл № 26
Trying to load file: 2. ТР ТС 010-2011 О безопасности машин и оборудования.pdf


Enumerating:  58%|█████▊    | 26/45 [04:43<02:18,  7.26s/it]

The download was successful: 2. ТР ТС 010-2011 О безопасности машин и оборудования.pdf
--------------------------------------------------
Файл № 27
Trying to load file: ГОСТ 12.2.063-2015. Арматура трубопроводная. Общие требования безопасности.pdf


Enumerating:  60%|██████    | 27/45 [04:48<01:56,  6.45s/it]

The download was successful: ГОСТ 12.2.063-2015. Арматура трубопроводная. Общие требования безопасности.pdf
--------------------------------------------------
Файл № 28
Trying to load file: 17. Приказ РТН № 533 ФНИП.pdf


Enumerating:  62%|██████▏   | 28/45 [04:56<01:59,  7.01s/it]

The download was successful: 17. Приказ РТН № 533 ФНИП.pdf
--------------------------------------------------
Файл № 29
Trying to load file: 4. ТР ТС 032-2013 О безопасности оборудования, работающего под избыточным давлением.pdf


Enumerating:  64%|██████▍   | 29/45 [05:01<01:44,  6.54s/it]

The download was successful: 4. ТР ТС 032-2013 О безопасности оборудования, работающего под избыточным давлением.pdf
--------------------------------------------------
Файл № 30
Trying to load file: 16. Приказ РТН № 528 ФНИП Правила безопасного ведения газоопасных, огневых и ремонтных работ.pdf


Enumerating:  67%|██████▋   | 30/45 [05:06<01:29,  5.94s/it]

The download was successful: 16. Приказ РТН № 528 ФНИП Правила безопасного ведения газоопасных, огневых и ремонтных работ.pdf
--------------------------------------------------
Файл № 31
Trying to load file: 11. Постановление Правительства № 1466  Об утверждении Правил подготовки, рассмотрения и согласования планов и схем развития горных работ .pdf


Enumerating:  69%|██████▉   | 31/45 [05:06<00:59,  4.28s/it]

The download was successful: 11. Постановление Правительства № 1466  Об утверждении Правил подготовки, рассмотрения и согласования планов и схем развития горных работ .pdf
--------------------------------------------------
Файл № 32
Trying to load file: 9. ФЗ 384 О безопасности зданий и сооружений.pdf


Enumerating:  71%|███████   | 32/45 [05:10<00:51,  3.96s/it]

The download was successful: 9. ФЗ 384 О безопасности зданий и сооружений.pdf
--------------------------------------------------
Файл № 33
Trying to load file: СП 343.1325800.2017 Сооружения промышленных предприятий. Правила эксплуатации.pdf


Enumerating:  73%|███████▎  | 33/45 [05:17<01:00,  5.02s/it]

The download was successful: СП 343.1325800.2017 Сооружения промышленных предприятий. Правила эксплуатации.pdf
--------------------------------------------------
Файл № 34
Trying to load file: 17. Приказ РТН № 387 Методические основы анализа опасностей и оценки риска аварий на опасных производственных объектах.pdf


Enumerating:  76%|███████▌  | 34/45 [05:24<01:00,  5.51s/it]

The download was successful: 17. Приказ РТН № 387 Методические основы анализа опасностей и оценки риска аварий на опасных производственных объектах.pdf
--------------------------------------------------
Файл № 35
Trying to load file: 17. Приказ РТН № 478 ФНИП.pdf


Enumerating:  78%|███████▊  | 35/45 [05:24<00:39,  3.99s/it]

The download was successful: 17. Приказ РТН № 478 ФНИП.pdf
--------------------------------------------------
Файл № 36
Trying to load file: 9.1. ФЗ 7 Об охране окружающей среды.pdf


Enumerating:  80%|████████  | 36/45 [05:39<01:04,  7.12s/it]

The download was successful: 9.1. ФЗ 7 Об охране окружающей среды.pdf
--------------------------------------------------
Файл № 37
Trying to load file: ГОСТ Р 2.601-2019.pdf


Enumerating:  82%|████████▏ | 37/45 [05:43<00:50,  6.30s/it]

The download was successful: ГОСТ Р 2.601-2019.pdf
--------------------------------------------------
Файл № 38
Trying to load file: ГОСТ Р 57955-2017 Здания и сооружения газонефтедобывающих производств. Нормы проектирования.pdf


Enumerating:  84%|████████▍ | 38/45 [05:46<00:37,  5.42s/it]

The download was successful: ГОСТ Р 57955-2017 Здания и сооружения газонефтедобывающих производств. Нормы проектирования.pdf
--------------------------------------------------
Файл № 39
Trying to load file: 17. Приказ РТН № 136.pdf


Enumerating:  87%|████████▋ | 39/45 [05:54<00:36,  6.13s/it]

The download was successful: 17. Приказ РТН № 136.pdf
--------------------------------------------------
Файл № 40
Trying to load file: 17. Приказ РТН № 450 Об утверждении Руководства по безопасности факельных систем.pdf


Enumerating:  89%|████████▉ | 40/45 [05:58<00:27,  5.43s/it]

The download was successful: 17. Приказ РТН № 450 Об утверждении Руководства по безопасности факельных систем.pdf
--------------------------------------------------
Файл № 41
Trying to load file: ГОСТ Р 59652-2021 Футеровки теплового оборудования. Основные требования.pdf


Enumerating:  91%|█████████ | 41/45 [06:00<00:18,  4.50s/it]

The download was successful: ГОСТ Р 59652-2021 Футеровки теплового оборудования. Основные требования.pdf
--------------------------------------------------
Файл № 42
Trying to load file: ГОСТ 31294-2005.pdf


Enumerating:  93%|█████████▎| 42/45 [06:04<00:12,  4.13s/it]

The download was successful: ГОСТ 31294-2005.pdf
--------------------------------------------------
Файл № 43
Trying to load file: 7. ФЗ 116 О промышленной безопасности ОПО Тихомирова.pdf


Enumerating:  96%|█████████▌| 43/45 [06:28<00:20, 10.25s/it]

The download was successful: 7. ФЗ 116 О промышленной безопасности ОПО Тихомирова.pdf
--------------------------------------------------
Файл № 44
Trying to load file: 7. ФЗ 116 О промышленной безопасности ОПО.pdf


Enumerating:  98%|█████████▊| 44/45 [06:32<00:08,  8.47s/it]

The download was successful: 7. ФЗ 116 О промышленной безопасности ОПО.pdf
--------------------------------------------------
Файл № 45
Trying to load file: 15. Приказ РТН № 519 ФНИП Требования к производству сварочных работ на опасных производственных объектах.pdf


Enumerating: 100%|██████████| 45/45 [06:34<00:00,  8.76s/it]

The download was successful: 15. Приказ РТН № 519 ФНИП Требования к производству сварочных работ на опасных производственных объектах.pdf
--------------------------------------------------





In [8]:
len(loaded_docs)

3231

In [None]:
loaded_docs[100].

Document(metadata={'source': '/srv/norma_ai/norma_ai_project/data/19. Приказ РТН № 536 ФНИП Правила промышленной безопасности при использовании оборудования, работающего под избыточным давлением.pdf', 'file_path': '/srv/norma_ai/norma_ai_project/data/19. Приказ РТН № 536 ФНИП Правила промышленной безопасности при использовании оборудования, работающего под избыточным давлением.pdf', 'page': 100, 'total_pages': 198, 'Title': 'Приказ Ростехнадзора от 15.12.2020 N 536"Об утверждении федеральных норм и правил в области промышленной безопасности "Правила промышленной безопасности при использовании оборудования, работающего под избыточным давлением"(Зарегистрировано в Минюсте Росси', 'Author': 'Evgeniy Ostromecky', 'Creator': 'Writer', 'Producer': 'LibreOffice 24.2', 'CreationDate': "D:20250827112706Z'"}, page_content='Приказ Ростехнадзора от 15.12.2020 N 536\nДокумент предоставлен КонсультантПлюс\n"Об утверждении федеральных норм и правил в области\nДата сохранения: 14.02.2022\nпромышленной

In [43]:
payload_for(loaded_docs[19])

{'source': '/srv/norma_ai/norma_ai_project/data/ГОСТ Р 55990-2014.pdf',
 'filename': 'ГОСТ Р 55990-2014.pdf',
 'doc_type': 'pdf',
 'page': 10,
 'title': None,
 'created_at': 1756290001,
 'sha1': '57ee93e62f008358b6de22dc64d47d75eabaf33c'}

In [None]:
# # from langchain_text_splitters import CharacterTextSplitter

# # splitter_1 = CharacterTextSplitter.from_tiktoken_encoder(
# #     encoding_name="cl100k_base", chunk_size=480, chunk_overlap=80
# # )
# docs_1 = splitter_1.split_documents(loaded_docs)

In [24]:
# Чанкинг под регламенты (чуть крупнее блоки)
# splitter_1 = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)
# docs_1 = splitter_1.split_documents(loaded_docs)



splitter_2 = RecursiveCharacterTextSplitter(chunk_size=1500, chunk_overlap=150)
docs_2 = splitter_2.split_documents(loaded_docs)

In [25]:
# (опционально) добавить базовые метаданные
for d in docs_1:
    d.metadata.setdefault("source", d.metadata.get("source") or "local")

In [26]:
for d in docs_2:
    d.metadata.setdefault("source", d.metadata.get("source") or "local")

In [29]:
vs = QdrantVectorStore(
    client=client, 
    collection_name="norma_ai_collection_ru-en-RoSBERTa",
    embedding=embeddings_model,
)

In [30]:
from tqdm.auto import tqdm

BATCH = 64
total = len(docs_2)

with tqdm(total=total, desc="Adding to Qdrant", unit="doc") as pbar:
    for i in range(0, total, BATCH):
        batch = docs_2[i:i+BATCH]
        vs.add_documents(batch)          # эмбеддинг + upsert в Qdrant
        pbar.update(len(batch))

Adding to Qdrant:   0%|          | 0/8382 [00:00<?, ?doc/s]

In [36]:
query = "На какой максимальной высоте разрешается устанавливать штурвал ЗРА без применения площадок обслуживания"
results_with_scores = vs.similarity_search_with_score(
    query,
    k=7
)

for i, (doc, score) in enumerate(results_with_scores):
    print(f"\n--- Результат {i+1} ---")
    print(f"Описание: {doc.page_content[:]}")


--- Результат 1 ---
Описание: быть не менее 1 м. Люлька должна быть застрахована от падения.
350. При механизированном осуществлении спускоподъемных операций без участия верхового
КонсультантПлюс
www.consultant.ru Страница 37 из 312
надежная правовая поддержка

--- Результат 2 ---
Описание: "Руководство по безопасности "Рекомендации по
Документ предоставленКонсультантПлюс
техническому диагностированию сварных вертикальных
Дата сохранения: 09.01.2024
цилиндрических резервуа...
осадки основания) рекомендуется ежегодно проводить нивелирование окрайки днища в абсолютных
отметках и результаты заносить в журнал нивелирования окрайки днища.
26. Нивелирование стационарных стальных и алюминиевых крыш проводится для определения
отклонений высотных отметок несущих конструкций стальных и алюминиевых стационарных крыш от
значений, приведенных в проектной документации, в случае выявления видимых деформаций по
результатам ВИК.
27. Нивелирование стальных крыш проводится с площадок на крыше резервуара

In [32]:
# Проверочный блок для PDF

current_path = '/srv/norma_ai/norma_ai_project/data/7. ФЗ 116 О промышленной безопасности ОПО Тихомирова.pdf'
path = Path(current_path)
loaded_docs_test = PDFPlumberLoader(str(path)).load()

In [18]:
loaded_docs_test

[Document(metadata={'source': '/srv/norma_ai/norma_ai_project/temporary_data/1. ТР ЕАЭС 049-2020 О требованиях к магистральным трубопроводам для транспортирования жидких и газообразных углеводородов.pdf', 'file_path': '/srv/norma_ai/norma_ai_project/temporary_data/1. ТР ЕАЭС 049-2020 О требованиях к магистральным трубопроводам для транспортирования жидких и газообразных углеводородов.pdf', 'page': 0, 'total_pages': 33, 'Title': 'Решение Совета Евразийской экономической комиссии от 23.12.2020 N 121"О техническом регламенте Евразийского экономического союза "О требованиях к магистральным трубопроводам для транспортирования жидких и газообразных углеводородов"(вместе с "ТР ЕАЭС 49/2', 'Author': 'Evgeniy Ostromecky', 'Creator': 'Writer', 'Producer': 'LibreOffice 24.2', 'CreationDate': "D:20250827104938Z'"}, page_content='Решение Совета Евразийской\nэкономической комиссии от 23.12.2020 N\n121\n"О техническом регламенте Евразийского\nэкономического союза "О требованиях к\nмагистральным трубо

In [33]:
loaded_docs_test

[Document(metadata={'source': '/srv/norma_ai/norma_ai_project/data/7. ФЗ 116 О промышленной безопасности ОПО Тихомирова.pdf', 'file_path': '/srv/norma_ai/norma_ai_project/data/7. ФЗ 116 О промышленной безопасности ОПО Тихомирова.pdf', 'page': 0, 'total_pages': 222, 'CreationDate': 'D:20240109085328Z', 'Creator': 'Версия 4023.00.09© 1992 - 2023 КонсультантПлюс Сборка 672292', 'ModDate': "D:20250826142739+03'00'", 'Producer': 'КонсультантПлюс', 'Title': '"Документация по промышленной безопасности"\n(Тихомирова Л.А.)\n(Подготовлен для системы КонсультантПлюс, 2020)'}, page_content='"Документация по промышленной\nбезопасности"\n(Тихомирова Л.А.)\n(Подготовлен для системы КонсультантПлюс,\n2020)\nДокумент предоставлен КонсультантПлюс\nwww.consultant.ru\nДата сохранения: 09.01.2024\n'),
 Document(metadata={'source': '/srv/norma_ai/norma_ai_project/data/7. ФЗ 116 О промышленной безопасности ОПО Тихомирова.pdf', 'file_path': '/srv/norma_ai/norma_ai_project/data/7. ФЗ 116 О промышленной безопас

In [35]:
loaded_docs_test[31].page_content

'"Документация по промышленной безопасности"\nДокумент предоставленКонсультантПлюс\n(Тихомирова Л.А.)\nДата сохранения: 09.01.2024\n(Подготовлен для системы КонсультантПлюс, 2020)\nКак было отмечено ранее, деятельность в области промышленной безопасности охватывает далеко\nне каждую хозяйственную деятельность, не каждый промышленный объект и оборудование и не каждый\nхозяйствующий субъект. Объединяет обозначенные виды деятельности то, что все они связаны с\nопасными производственными объектами. Поэтому в определении необходимости соблюдения\nтребований промышленной безопасности важно определить статус промышленного объекта как опасного\nпроизводственного объекта.\nПравовой статус опасных производственных объектов определяется в статье 2 Федерального\nзакона от 21.07.1997 N 116-ФЗ "О промышленной безопасности опасных производственных объектов".\nПризнаки опасности, определяющие необходимость отнесения объекта к категории опасного\nпроизводственного объекта, устанавливаются приложением 1