In [1]:
from llama_cpp import Llama
import pandas as pd
import os
import json
import time
import re
from docx import Document
import subprocess
from tqdm import tqdm
from pathlib import Path
import string
import random
from collections import defaultdict
from transformers import AutoModelForCausalLM, AutoTokenizer

In [2]:
# Используемые llm 
llms = [
        ("Mistral", Llama(model_path="./IMPORTS/mistral-7b-instruct-v0.1.Q4_K_M.gguf", n_ctx=2048, verbose=False)),
]
folder = "./data"

llama_context: n_ctx_per_seq (2048) < n_ctx_train (32768) -- the full capacity of the model will not be utilized


In [3]:
# Если файл состоит из нескольких страниц, разделяет файл на несколько по одной странице
def split_files(input_folder, output_folder=None):
    if output_folder is None:
        output_folder = os.path.join(input_folder, "split")
        
    os.makedirs(output_folder, exist_ok=True)
    result = defaultdict(list)
    
    for file in sorted(os.listdir(input_folder)):
        
        file_path = os.path.join(input_folder, file)
        file_name, file_ext = os.path.splitext(file)
        
        if file_ext.lower() == '.xlsx':
            try:
                sheets = pd.read_excel(file_path, sheet_name=None)
                for sheet_name, df in sheets.items():
                    output_name = f"{file_name}_{sheet_name}.xlsx"
                    output_path = os.path.join(output_folder, output_name)
                    df.to_excel(output_path, index=False)
                    result[os.path.basename(file_path)].append(output_path)  
                    
            except Exception as e:
                print(f"Error processing Excel file {file}: {e}")

        elif file_ext.lower() == '.docx':
            try:
                doc = Document(file_path)
                if len(doc.paragraphs) > 0:
                    output_path = os.path.join(output_folder, file)
                    doc.save(output_path)
                    result[os.path.basename(file_path)].append(output_path)
                    
            except Exception as e:
                print(f"Error processing Word file {file}: {e}")

    return dict(result) 

In [4]:
# Перевод docx в pdf
def docx_to_pdf(docx_path, output_dir=None):
    if output_dir is None:
        output_dir = os.path.dirname(docx_path) or "."

    subprocess.run([
        "libreoffice", "--headless", "--convert-to", "pdf",
        docx_path, "--outdir", output_dir
    ], check=True)

    pdf_name = os.path.splitext(os.path.basename(docx_path))[0] + ".pdf"
    pdf_path = os.path.join(output_dir, pdf_name)

    return pdf_path

In [5]:
# Функция нормализации строки из таблицы
def normalize_row_string(row):
    processed_cells = []
    for cell in row:
        if cell and str(cell).strip():
            cell_str = str(cell).strip().lower()
            punctuation_chars = string.punctuation + '«»—–'
            translator = str.maketrans('', '', punctuation_chars)
            clean_cell = cell_str.translate(translator)
            processed_cells.append(clean_cell)    
    row_str = " ".join(processed_cells)
    clean_str = re.sub(r'\s+', ' ', row_str).strip()
    return clean_str

In [6]:
# Функция проверки строки
def check_info_row(llm, row, previous_row = None, previous_row_type = None):
    try:
        row_str = normalize_row_string(row)

        header_keywords = ["наименование", "название", "адрес", "страховая", "доступ", 
                          "программа", "лпу", "вид", "помощи"]
        if len([x for x in row if len(x)>0]) < 2:
            return "empty", 1    
        
        found_keywords = {keyword for keyword in header_keywords if keyword in row_str}
        if len(found_keywords) >= 2 and len(row_str.split()) > 5 and len(row_str.split())/len(row) <= 2:
                return "header", 1

        address_indicators = r'\b(ООО|ул|улица|пр-кт|просп|проспект|пер|переулок|ш|шоссе|наб|набережная|пл|площадь|д[\dа-я]*|дом|корп|к[\dа-я]*|строение|стр[\dа-я]*)\b'

        has_address = re.search(address_indicators, row_str, re.IGNORECASE)
        if has_address:
            return "info", 1
        if previous_row_type == "info" and previous_row:
            prev_non_empty = len([x for x in previous_row if x and str(x).strip()])
            curr_non_empty = len([x for x in row if x and str(x).strip()])        
            if curr_non_empty == prev_non_empty and curr_non_empty > 1:
                return "info", 1


        row_text = " | ".join(str(cell) for cell in row if pd.notna(cell))
        if not row_text.strip():
            return "empty", 1
        prompt = f"""
        Определи тип строки из таблицы. Варианты:
        - "header" - если это заголовки столбцов (например, содержат слова: название, адрес, город и т.п.)
        - "info" - если это данные (например, содержат конкретные значения: названия организаций, адреса)
        - "empty" - если строка не содержит полезной информации (шапка таблицы, пустые значения)

        Ответ должен быть только одним словом: "header", "info" или "empty".

        Пример header:
        Название | Адрес | Вид | помощи | №1 | №2 | №3

        Пример info:
        СПб ГУЗ "Городская поликлиника №51" | СПб, пр. Космонавтов, д.35 | ПВ | + | + | +

        Пример empty: 
        Амбулаторно-поликлиническая помощь | | |  

        Строка для анализа: "{row_text}" 
        """
        response = llm.create_chat_completion(
                messages=[{"role": "user", "content": prompt}]
            )
        result = response["choices"][0]["message"]["content"].strip().lower()
#         print(f"ROW: {row}")
#         print(f"RESULT: {result}")
        if "header" in result:
            if len(found_keywords) >= 1:
                return "header", 0
            else:
                return "info", 0
        elif "info" in result:
            return "info", 0
        else:
            return "empty", 0
    except:
        return "empty", 0

In [7]:
def find_headers(llm, row_headers):
    s = ", ".join(row_headers)
    prompt = f"""
    Ты — эксперт по структурированию медицинских данных. Найди точные соответствия между предоставленными заголовками и эталонными.
    Ответ должен быть только одним JSON

    Эталонные заголовки (используй ТОЛЬКО эти):
    "Название поликлиники"
    "Адрес"
    "Тип доступа"
    "Виды помощи"

    Строгие правила:
    1. Сопоставляй ТОЛЬКО если уверен на 100%
    2. Для "Название поликлиники" принимай:
       - "ЛПУ", "Медцентр", "Клиника", "Больница"
    3. Для "Адрес" ищи:
       - "Местоположение", "Адрес", "Локация"
    4. "Тип доступа":
       - "Доступ", "Обслуживание", "Условия"
    5. Для "Виды помощи" ищи:
       - "Виды обращений", "Вид помощи", "Тип помощи", "Риск", "Вид медицинской помощи"

    исходный заголовок может быть ТОЛЬКО из эталонных заголовков:
    "Название поликлиники"
    "Адрес"
    "Тип доступа"
    "Виды помощи"

   Пример 1: 
   Наименование, Адрес(фактич.), Вид помощи, №1, №2, №3, Доступ
   Ответ:
   {{
    "Название поликлиники": "Наименование",
    "Адрес": "Адрес(фактич.)",
    "Тип доступа": "Доступ",
    "Виды помощи": "Вид помощи"
   }}

   Пример 2: 
   Филиал, ЛПУ, Адрес ЛПУ, Риск, Доступ в ЛПУ
   Ответ:
   {{
    "Название поликлиники": "ЛПУ",
    "Адрес": "Адрес ЛПУ",
    "Страховая компания": "-",
    "Тип доступа": "Доступ в ЛПУ",
    "Виды помощи": "Риск"
   }}

    Предоставленные заголовки для анализа, использовать можно ТОЛЬКО их:
    {s}
    Ответ должен быть только одним JSON
    """        
    response = llm.create_chat_completion(
        messages=[{"role": "user", "content": prompt}]
    )
    result = response["choices"][0]["message"]["content"]
    print(f"ROW: {row_headers}")
    print(f"RESULT: {result}")
    json_str = result[result.find("{"):result.rfind("}")+1]
    json_str = json_str.replace("'", '"')

    mapping = json.loads(json_str)

    return mapping

In [8]:
def check_info_row_llm(llm, row):
    try:
        row_text = " | ".join(str(cell) for cell in row if pd.notna(cell))
        if not row_text.strip():
            return "empty"
        prompt = f"""
        Определи тип строки из таблицы. Варианты:
        - "header" - если это заголовки столбцов (например, содержат слова: название, адрес, город и т.п.)
        - "info" - если это данные (например, содержат конкретные значения: названия организаций, адреса)
        - "empty" - если строка не содержит полезной информации (шапка таблицы, пустые значения)

        Ответ должен быть только одним словом: "header", "info" или "empty".

        Пример header:
        Название | Адрес | Вид | помощи | №1 | №2 | №3

        Пример info:
        СПб ГУЗ "Городская поликлиника №51" | СПб, пр. Космонавтов, д.35 | ПВ | + | + | +

        Пример empty: 
        Амбулаторно-поликлиническая помощь | | |  
     
        Строка для анализа: "{row_text}" 
        """
        response = llm.create_chat_completion(
                messages=[{"role": "user", "content": prompt}]
            )
        result = response["choices"][0]["message"]["content"].strip().lower()
        if "header" in result:
            return "header"
        elif "info" in result:
            return "info"
        else:
            return "empty"
    except:
        return "empty"

In [9]:
standard_headers = [
    "Название поликлиники",
    "Адрес",
    "Виды помощи",
    "Тип доступа",
    "Страховая компания",
]

standard_val_headers = [
    "Row",
    "Pred_type",
    "Type",
]

standard_second_val_headers = [
    "Row",
    "Mapping",
]

files = split_files(folder)
dict_to_standard = {}  # {"Стандартное название" : "Нестандартное название"}

global_df = pd.DataFrame(columns=standard_headers)

test_val_heuristic = pd.DataFrame(columns=standard_val_headers)
test_val_llm = pd.DataFrame(columns=standard_val_headers)

test_second_query = pd.DataFrame(columns=standard_second_val_headers)

for model_name, llm in llms:
    print(f"\nМодель: {model_name}")
    start_time = time.time()
    for file_name, pages in files.items():
        name_company = os.path.splitext(file_name)[0]
        if os.path.splitext(file_name)[1] == '.docx':
            continue
        standard_df = pd.DataFrame(columns=standard_headers)
            
        for file in tqdm(pages, desc="Обработка файлов", unit="file"):
                
            output_dir = Path(f"Merged_tables")
            output_dir.mkdir(parents=True, exist_ok=True)
            
            
            df = pd.read_excel(os.path.join(file), header = None)
            n = 0
            current_headers = []
            prev_row, prev_info = None, None
            
            
            for index, row in tqdm(
                df.iterrows(), 
                total=len(df),
                desc=f"Строки ({os.path.basename(file)})",
                unit="строка",
                leave=False
            ):
                row_data = row.values.tolist()
                row_data = [value if pd.notna(value) else "" for value in row.values]

                info, flag = check_info_row(llm, row_data, prev_row, prev_info)
                
                val_row = {"Row": row_data, "Pred_type": info}
                if flag == 1:
                    test_val_heuristic = pd.concat([test_val_heuristic, pd.DataFrame([val_row])], ignore_index=True)
                else:
                    test_val_llm = pd.concat([test_val_llm, pd.DataFrame([val_row])], ignore_index=True)                            
                
                prev_info, prev_row = info, row_data
    
#                 if n < 20:
#                     print(f"ROW {row_data}")
#                     print(f"INFO {info}")
                n += 1

                if info == "header":
                    current_headers = row_data
                    header_mapping = find_headers(llm, row_data)
                    
                    val_row = {"Row": row_data, "Mapping": header_mapping}
                    test_second_query = pd.concat([test_second_query, pd.DataFrame([val_row])], ignore_index=True)                            
                    
                    for standard, non_standard in header_mapping.items():
                        if standard in standard_headers:
                            dict_to_standard[non_standard] = standard 
                    
                elif info == "info":
                    new_row = {col: "" for col in standard_headers}
                    for col_idx, value in enumerate(row_data):
                        if col_idx >= len(current_headers):
                            continue
                        data_header = current_headers[col_idx]
                        standard_header = dict_to_standard.get(data_header)
                        if standard_header and standard_header in new_row:
                            new_row[standard_header] = value

                    if any(new_row.values()):
                        new_row["Страховая компания"] = name_company
                        standard_df = pd.concat([standard_df, pd.DataFrame([new_row])], ignore_index=True)
                        global_df = pd.concat([global_df, pd.DataFrame([new_row])], ignore_index=True)
                elif info == "empty":
                    continue
            
            
        standard_df.to_excel(output_dir / f"merged_{name_company}.xlsx", index=False)

           
    random.seed(42)
    sampled_rows = test_val_heuristic.sample(n=100, random_state=42)

    test_bonus_val_llm = test_val_llm
    for _, row in sampled_rows.iterrows():
        new_row = {
            "Row": row["Row"],
            "Pred_type": check_info_row_llm(llm, row["Row"]),
        }
        test_bonus_val_llm = pd.concat([test_bonus_val_llm, pd.DataFrame([new_row])], ignore_index=True)                            

        
    global_df.to_excel(output_dir / f"merged_global.xlsx", index=False)

    output_dir_stats = Path(f"Stats")
    output_dir_stats.mkdir(parents=True, exist_ok=True)

    test_val_heuristic.to_excel(output_dir_stats / f"test_val_heuristic.xlsx", index=False)
    test_val_llm.to_excel(output_dir_stats / f"test_val_llm.xlsx", index=False)
    test_bonus_val_llm.to_excel(output_dir_stats / f"test_bonus_val_llm.xlsx", index=False)

    test_second_query.to_excel(output_dir_stats / f"test_second_query.xlsx", index=False)

            
    elapsed_time = time.time() - start_time
    print(f"\n Модель {model_name} завершена!")
    print(f"Затраченное время: {elapsed_time:.2f} сек")


Модель: Mistral


Обработка файлов:   0%|                                 | 0/3 [00:00<?, ?file/s]
Строки (Альфа(1)_ЛПУ_СПб.xlsx):   0%|               | 0/975 [00:00<?, ?строка/s][A
Строки (Альфа(1)_ЛПУ_СПб.xlsx):   0%|     | 1/975 [00:31<8:36:40, 31.83s/строка][A
Строки (Альфа(1)_ЛПУ_СПб.xlsx):   0%|     | 3/975 [01:49<9:56:56, 36.85s/строка][A
Строки (Альфа(1)_ЛПУ_СПб.xlsx):   3%|▏     | 34/975 [01:49<33:15,  2.12s/строка][A

ROW: ['Название', 'Адрес', 'Вид помощи', '№1', '№2', '№3', '', '']
RESULT:  {
    "Название поликлиники": "Название",
    "Адрес": "Адрес",
    "Тип доступа": "Доступ",
    "Виды помощи": "Вид помощи"
  }



Строки (Альфа(1)_ЛПУ_СПб.xlsx):   7%|▍     | 73/975 [01:49<11:51,  1.27строка/s][A
Строки (Альфа(1)_ЛПУ_СПб.xlsx):  11%|▌    | 111/975 [01:49<06:04,  2.37строка/s][A
Строки (Альфа(1)_ЛПУ_СПб.xlsx):  15%|▊    | 149/975 [01:49<03:29,  3.93строка/s][A
Строки (Альфа(1)_ЛПУ_СПб.xlsx):  19%|▉    | 188/975 [01:49<02:06,  6.20строка/s][A
Строки (Альфа(1)_ЛПУ_СПб.xlsx):  23%|█▏   | 226/975 [01:49<01:20,  9.31строка/s][A
Строки (Альфа(1)_ЛПУ_СПб.xlsx):  27%|█▎   | 263/975 [01:49<00:52, 13.54строка/s][A
Строки (Альфа(1)_ЛПУ_СПб.xlsx):  31%|█▌   | 300/975 [01:49<00:34, 19.41строка/s][A
Строки (Альфа(1)_ЛПУ_СПб.xlsx):  34%|█▋   | 336/975 [01:49<00:23, 27.21строка/s][A
Строки (Альфа(1)_ЛПУ_СПб.xlsx):  38%|█▉   | 372/975 [01:50<00:16, 37.63строка/s][A
Строки (Альфа(1)_ЛПУ_СПб.xlsx):  42%|██   | 407/975 [01:50<00:11, 50.91строка/s][A
Строки (Альфа(1)_ЛПУ_СПб.xlsx):  45%|██▎  | 441/975 [01:50<00:07, 67.49строка/s][A
Строки (Альфа(1)_ЛПУ_СПб.xlsx):  49%|██▍  | 475/975 [01:50<00:05, 87.91стро

ROW: ['Название', 'Адрес', 'Вид помощи', '№1', '№2', '№3']
RESULT:  {
    "Название поликлиники": "Наименование",
    "Адрес": "Адрес",
    "Тип доступа": "Доступ",
    "Виды помощи": "Вид помощи"
  }



Строки (Альфа(1)_Прямой доступ_СПб.xlsx):  43%|▍| 50/117 [00:17<00:13,  4.86стро[A
Строки (Альфа(1)_Прямой доступ_СПб.xlsx):  66%|▋| 77/117 [00:17<00:04,  9.17стро[A
Строки (Альфа(1)_Прямой доступ_СПб.xlsx):  89%|▉| 104/117 [00:17<00:00, 15.09стр[A
Обработка файлов:  67%|████████████████▋        | 2/3 [02:10<00:56, 56.70s/file][A
Строки (Альфа(1)_ЛПУ_Регионы.xlsx):   0%|            | 0/68 [00:00<?, ?строка/s][A
Строки (Альфа(1)_ЛПУ_Регионы.xlsx):   1%|    | 1/68 [00:28<31:24, 28.12s/строка][A
Строки (Альфа(1)_ЛПУ_Регионы.xlsx):   4%|▏   | 3/68 [01:53<42:16, 39.03s/строка][A
Строки (Альфа(1)_ЛПУ_Регионы.xlsx):  31%|▉  | 21/68 [01:53<02:54,  3.71s/строка][A


ROW: ['Филиал', 'ЛПУ', 'Адрес ЛПУ', 'Риск']
RESULT:  {
        "Название поликлиники": "ЛПУ",
        "Адрес": "Адрес ЛПУ",
        "Страховая компания": "-",
        "Тип доступа": "Доступ в ЛПУ",
        "Виды помощи": "Риск"
      }


Строки (Альфа(1)_ЛПУ_Регионы.xlsx):  71%|██ | 48/68 [01:54<00:25,  1.27s/строка][A
Обработка файлов: 100%|█████████████████████████| 3/3 [04:04<00:00, 81.40s/file][A
Обработка файлов:   0%|                                 | 0/1 [00:00<?, ?file/s]
Строки (Ингосстрах_Page 1.xlsx):   0%|             | 0/1774 [00:00<?, ?строка/s][A
Строки (Ингосстрах_Page 1.xlsx):   0%|   | 2/1774 [00:28<7:02:36, 14.31s/строка][A
Строки (Ингосстрах_Page 1.xlsx):   1%|    | 19/1774 [00:28<32:00,  1.09s/строка][A

ROW: ['План', 'Город', 'Наименование ЛПУ', 'Адрес(фактич.)', 'Вид медицинской помощи', 'Метро', 'Прямой доступ', 'Программа']
RESULT:  {
    "Название поликлиники": "Наименование ЛПУ",
    "Адрес": "Адрес(фактич.)",
    "Тип доступа": "Прямой доступ",
    "Виды помощи": "Вид медицинской помощи"
  }



Строки (Ингосстрах_Page 1.xlsx):   2%|    | 42/1774 [00:28<11:25,  2.53строка/s][A
Строки (Ингосстрах_Page 1.xlsx):   4%|▏   | 65/1774 [00:28<05:56,  4.79строка/s][A
Строки (Ингосстрах_Page 1.xlsx):   5%|▏   | 91/1774 [00:29<03:21,  8.37строка/s][A
Строки (Ингосстрах_Page 1.xlsx):   6%|▏  | 115/1774 [00:29<02:08, 12.92строка/s][A
Строки (Ингосстрах_Page 1.xlsx):   8%|▏  | 139/1774 [00:29<01:25, 19.08строка/s][A
Строки (Ингосстрах_Page 1.xlsx):   9%|▎  | 163/1774 [00:29<00:58, 27.35строка/s][A
Строки (Ингосстрах_Page 1.xlsx):  11%|▎  | 187/1774 [00:29<00:41, 38.13строка/s][A
Строки (Ингосстрах_Page 1.xlsx):  12%|▎  | 213/1774 [00:29<00:29, 53.01строка/s][A
Строки (Ингосстрах_Page 1.xlsx):  13%|▍  | 238/1774 [00:29<00:21, 70.16строка/s][A
Строки (Ингосстрах_Page 1.xlsx):  15%|▍  | 263/1774 [00:29<00:16, 90.07строка/s][A
Строки (Ингосстрах_Page 1.xlsx):  16%|▎ | 288/1774 [00:29<00:13, 110.77строка/s][A
Строки (Ингосстрах_Page 1.xlsx):  18%|▎ | 313/1774 [00:29<00:11, 132.72стро

Строки (Ренессанс_№1Стандарт.xlsx):   0%| | 2/577 [01:23<7:44:21, 48.45s/строка][A
Строки (Ренессанс_№1Стандарт.xlsx):   2%|  | 13/577 [01:23<44:32,  4.74s/строка][A

ROW: ['Субкат', 'Город', 'Наименование ЛПУ', 'Адрес', 'Вид помощи', 'Доступ', 'Франшиза']
RESULT:  {
    "Название поликлиники": "Наименование ЛПУ",
    "Адрес": "Адрес",
    "Страховая компания": "-",
    "Тип доступа": "Доступ",
    "Виды помощи": "Вид помощи"
  }



Строки (Ренессанс_№1Стандарт.xlsx):   5%|  | 31/577 [01:23<13:54,  1.53s/строка][A
Строки (Ренессанс_№1Стандарт.xlsx):   8%|▏ | 48/577 [01:23<07:03,  1.25строка/s][A
Строки (Ренессанс_№1Стандарт.xlsx):  11%|▏ | 66/577 [01:23<03:58,  2.14строка/s][A
Строки (Ренессанс_№1Стандарт.xlsx):  14%|▎ | 83/577 [01:24<02:28,  3.33строка/s][A
Строки (Ренессанс_№1Стандарт.xlsx):  17%|▏| 100/577 [01:24<01:35,  5.00строка/s][A
Строки (Ренессанс_№1Стандарт.xlsx):  20%|▏| 116/577 [01:24<01:04,  7.16строка/s][A
Строки (Ренессанс_№1Стандарт.xlsx):  23%|▏| 134/577 [01:24<00:41, 10.56строка/s][A
Строки (Ренессанс_№1Стандарт.xlsx):  26%|▎| 151/577 [01:24<00:28, 14.91строка/s][A
Строки (Ренессанс_№1Стандарт.xlsx):  29%|▎| 168/577 [01:24<00:19, 20.66строка/s][A
Строки (Ренессанс_№1Стандарт.xlsx):  32%|▎| 184/577 [01:24<00:14, 27.65строка/s][A
Строки (Ренессанс_№1Стандарт.xlsx):  35%|▎| 200/577 [01:24<00:10, 36.29строка/s][A
Строки (Ренессанс_№1Стандарт.xlsx):  37%|▎| 216/577 [01:24<00:07, 46.00стро

ROW: ['Субкат', 'Город', 'Наименование ЛПУ', 'Адрес', 'Вид помощи', 'Доступ', 'Франшиза']
RESULT:  {
    "Название поликлиники": "Наименование ЛПУ",
    "Адрес": "Адрес",
    "Страховая компания": "-",
    "Тип доступа": "Доступ",
    "Виды помощи": "Вид помощи"
  }



Строки (Ренессанс_№3Люкс.xlsx):   3%|▏     | 30/869 [01:50<27:38,  1.98s/строка][A
Строки (Ренессанс_№3Люкс.xlsx):   5%|▎     | 46/869 [01:51<14:15,  1.04s/строка][A
Строки (Ренессанс_№3Люкс.xlsx):   7%|▍     | 62/869 [01:51<08:22,  1.61строка/s][A
Строки (Ренессанс_№3Люкс.xlsx):   9%|▌     | 78/869 [01:51<05:13,  2.52строка/s][A
Строки (Ренессанс_№3Люкс.xlsx):  11%|▋     | 94/869 [01:51<03:23,  3.81строка/s][A
Строки (Ренессанс_№3Люкс.xlsx):  13%|▋    | 110/869 [01:51<02:15,  5.61строка/s][A
Строки (Ренессанс_№3Люкс.xlsx):  14%|▋    | 126/869 [01:51<01:31,  8.11строка/s][A
Строки (Ренессанс_№3Люкс.xlsx):  16%|▊    | 142/869 [01:51<01:03, 11.52строка/s][A
Строки (Ренессанс_№3Люкс.xlsx):  18%|▉    | 158/869 [01:51<00:44, 16.12строка/s][A
Строки (Ренессанс_№3Люкс.xlsx):  20%|█    | 174/869 [01:51<00:31, 22.17строка/s][A
Строки (Ренессанс_№3Люкс.xlsx):  22%|█    | 190/869 [01:52<00:22, 30.00строка/s][A
Строки (Ренессанс_№3Люкс.xlsx):  24%|█▏   | 206/869 [01:52<00:16, 39.61стро

ROW: ['Субкат', 'Город', 'Наименование ЛПУ', 'Адрес', 'Вид помощи', 'Доступ', 'Франшиза']
RESULT:  {
    "Название поликлиники": "Наименование ЛПУ",
    "Адрес": "Адрес",
    "Страховая компания": "-",
    "Тип доступа": "Доступ",
    "Виды помощи": "Вид помощи"
  }



Строки (Ренессанс_№2Бизнес.xlsx):   3%|    | 23/862 [01:53<37:06,  2.65s/строка][A
Строки (Ренессанс_№2Бизнес.xlsx):   4%|▏   | 37/862 [01:53<17:53,  1.30s/строка][A
Строки (Ренессанс_№2Бизнес.xlsx):   6%|▏   | 51/862 [01:53<10:12,  1.32строка/s][A
Строки (Ренессанс_№2Бизнес.xlsx):   8%|▎   | 65/862 [01:53<06:17,  2.11строка/s][A
Строки (Ренессанс_№2Бизнес.xlsx):   9%|▎   | 79/862 [01:53<04:03,  3.22строка/s][A
Строки (Ренессанс_№2Бизнес.xlsx):  11%|▍   | 93/862 [01:53<02:41,  4.76строка/s][A
Строки (Ренессанс_№2Бизнес.xlsx):  12%|▎  | 107/862 [01:53<01:49,  6.91строка/s][A
Строки (Ренессанс_№2Бизнес.xlsx):  14%|▍  | 121/862 [01:54<01:15,  9.86строка/s][A
Строки (Ренессанс_№2Бизнес.xlsx):  16%|▍  | 135/862 [01:54<00:52, 13.84строка/s][A
Строки (Ренессанс_№2Бизнес.xlsx):  17%|▌  | 149/862 [01:54<00:37, 19.12строка/s][A
Строки (Ренессанс_№2Бизнес.xlsx):  19%|▌  | 163/862 [01:54<00:27, 25.82строка/s][A
Строки (Ренессанс_№2Бизнес.xlsx):  21%|▌  | 177/862 [01:54<00:20, 34.11стро

ROW: ['Субкат', 'Город', 'Наименование ЛПУ', 'Адрес', 'Вид помощи', 'Доступ', 'Франшиза']
RESULT:  {
    "Название поликлиники": "Наименование ЛПУ",
    "Адрес": "Адрес",
    "Страховая компания": "-",
    "Тип доступа": "Доступ",
    "Виды помощи": "Вид помощи"
  }



Строки (Ренессанс_Новосибирск.xlsx):  18%|▏| 22/124 [01:53<04:46,  2.81s/строка][A
Строки (Ренессанс_Новосибирск.xlsx):  27%|▎| 34/124 [01:53<02:10,  1.45s/строка][A
Строки (Ренессанс_Новосибирск.xlsx):  37%|▎| 46/124 [01:53<01:06,  1.17строка/s][A
Строки (Ренессанс_Новосибирск.xlsx):  47%|▍| 58/124 [01:53<00:35,  1.84строка/s][A
Строки (Ренессанс_Новосибирск.xlsx):  56%|▌| 70/124 [01:53<00:19,  2.78строка/s][A
Строки (Ренессанс_Новосибирск.xlsx):  66%|▋| 82/124 [01:53<00:10,  4.11строка/s][A
Строки (Ренессанс_Новосибирск.xlsx):  76%|▊| 94/124 [01:54<00:05,  5.95строка/s][A
Строки (Ренессанс_Новосибирск.xlsx):  85%|▊| 106/124 [01:54<00:02,  8.46строка/s[A
Строки (Ренессанс_Новосибирск.xlsx):  95%|▉| 118/124 [01:54<00:00, 11.86строка/s[A
Обработка файлов:  83%|████████████████████    | 5/6 [08:10<01:47, 107.52s/file][A
Строки (Ренессанс_Екатеринбург.xlsx):   0%|         | 0/197 [00:00<?, ?строка/s][A
Строки (Ренессанс_Екатеринбург.xlsx):   1%| | 1/197 [00:30<1:39:49, 30.56s/

ROW: ['Субкат', 'Город', 'Наименование ЛПУ', 'Адрес', 'Вид помощи', 'Доступ', 'Франшиза']
RESULT:  {
    "Название поликлиники": "Наименование ЛПУ",
    "Адрес": "Адрес",
    "Страховая компания": "-",
    "Тип доступа": "Доступ",
    "Виды помощи": "Вид помощи"
  }



Строки (Ренессанс_Екатеринбург.xlsx):  10%| | 20/197 [01:53<08:51,  3.00s/строка[A
Строки (Ренессанс_Екатеринбург.xlsx):  16%|▏| 31/197 [01:53<04:20,  1.57s/строка[A
Строки (Ренессанс_Екатеринбург.xlsx):  22%|▏| 43/197 [01:53<02:18,  1.11строка/s[A
Строки (Ренессанс_Екатеринбург.xlsx):  27%|▎| 54/197 [01:53<01:22,  1.72строка/s[A
Строки (Ренессанс_Екатеринбург.xlsx):  34%|▎| 66/197 [01:53<00:49,  2.66строка/s[A
Строки (Ренессанс_Екатеринбург.xlsx):  40%|▍| 78/197 [01:53<00:29,  3.98строка/s[A
Строки (Ренессанс_Екатеринбург.xlsx):  46%|▍| 90/197 [01:54<00:18,  5.82строка/s[A
Строки (Ренессанс_Екатеринбург.xlsx):  52%|▌| 102/197 [01:54<00:11,  8.34строка/[A
Строки (Ренессанс_Екатеринбург.xlsx):  58%|▌| 114/197 [01:54<00:07, 11.74строка/[A
Строки (Ренессанс_Екатеринбург.xlsx):  64%|▋| 126/197 [01:54<00:04, 16.19строка/[A
Строки (Ренессанс_Екатеринбург.xlsx):  70%|▋| 138/197 [01:54<00:02, 21.82строка/[A
Строки (Ренессанс_Екатеринбург.xlsx):  76%|▊| 149/197 [01:54<00:01, 28.10ст

ROW: ['Город', '№ Программы', 'Наименование ЛПУ', 'Адрес ЛПУ', 'Виды помощи']
RESULT:  {
    "Название поликлиники": "Наименование ЛПУ",
    "Адрес": "Адрес ЛПУ",
    "Тип доступа": "-",
    "Виды помощи": "Виды помощи"
  }



Строки (Согласие_1 стандарт.xlsx):   6%|▏  | 22/373 [00:19<02:59,  1.96строка/s][A
Строки (Согласие_1 стандарт.xlsx):   9%|▎  | 33/373 [00:19<01:36,  3.54строка/s][A
Строки (Согласие_1 стандарт.xlsx):  12%|▎  | 44/373 [00:19<00:57,  5.72строка/s][A
Строки (Согласие_1 стандарт.xlsx):  15%|▍  | 56/373 [00:19<00:35,  8.95строка/s][A
Строки (Согласие_1 стандарт.xlsx):  18%|▌  | 67/373 [00:19<00:23, 12.86строка/s][A
Строки (Согласие_1 стандарт.xlsx):  21%|▋  | 79/373 [00:19<00:15, 18.43строка/s][A
Строки (Согласие_1 стандарт.xlsx):  24%|▋  | 90/373 [00:20<00:11, 24.78строка/s][A
Строки (Согласие_1 стандарт.xlsx):  27%|▌ | 102/373 [00:20<00:08, 33.21строка/s][A
Строки (Согласие_1 стандарт.xlsx):  30%|▌ | 113/373 [00:20<00:06, 41.81строка/s][A
Строки (Согласие_1 стандарт.xlsx):  34%|▋ | 125/373 [00:20<00:04, 52.41строка/s][A
Строки (Согласие_1 стандарт.xlsx):  37%|▋ | 137/373 [00:20<00:03, 62.49строка/s][A
Строки (Согласие_1 стандарт.xlsx):  40%|▊ | 149/373 [00:20<00:03, 71.97стро

ROW: ['Город', '№ Программы', 'Наименование ЛПУ', 'Адрес ЛПУ', 'Виды помощи']
RESULT:  {
    "Название поликлиники": "Наименование ЛПУ",
    "Адрес": "Адрес ЛПУ",
    "Тип доступа": "-",
    "Виды помощи": "Виды помощи"
  }



Строки (Согласие_2 бизнес.xlsx):   4%|▏    | 20/485 [00:16<03:38,  2.12строка/s][A
Строки (Согласие_2 бизнес.xlsx):   6%|▎    | 31/485 [00:16<01:53,  4.00строка/s][A
Строки (Согласие_2 бизнес.xlsx):   8%|▍    | 41/485 [00:16<01:10,  6.33строка/s][A
Строки (Согласие_2 бизнес.xlsx):  11%|▌    | 52/485 [00:16<00:44,  9.80строка/s][A
Строки (Согласие_2 бизнес.xlsx):  13%|▋    | 63/485 [00:16<00:29, 14.37строка/s][A
Строки (Согласие_2 бизнес.xlsx):  15%|▊    | 74/485 [00:16<00:20, 20.16строка/s][A
Строки (Согласие_2 бизнес.xlsx):  18%|▉    | 85/485 [00:16<00:14, 27.27строка/s][A
Строки (Согласие_2 бизнес.xlsx):  20%|▉    | 96/485 [00:16<00:10, 35.67строка/s][A
Строки (Согласие_2 бизнес.xlsx):  22%|▉   | 107/485 [00:17<00:08, 44.91строка/s][A
Строки (Согласие_2 бизнес.xlsx):  24%|▉   | 118/485 [00:17<00:06, 53.11строка/s][A
Строки (Согласие_2 бизнес.xlsx):  27%|█   | 129/485 [00:17<00:05, 62.17строка/s][A
Строки (Согласие_2 бизнес.xlsx):  29%|█▏  | 140/485 [00:17<00:05, 68.75стро

ROW: ['Город', '№ Программы', 'Наименование ЛПУ', 'Адрес ЛПУ', 'Виды помощи']
RESULT:  {
    "Название поликлиники": "Наименование ЛПУ",
    "Адрес": "Адрес ЛПУ",
    "Тип доступа": "-",
    "Виды помощи": "Виды помощи"
  }



Строки (Согласие_3 люкс.xlsx):   4%|▎      | 19/529 [00:16<04:24,  1.93строка/s][A
Строки (Согласие_3 люкс.xlsx):   6%|▍      | 30/529 [00:16<02:12,  3.75строка/s][A
Строки (Согласие_3 люкс.xlsx):   8%|▌      | 41/529 [00:17<01:18,  6.25строка/s][A
Строки (Согласие_3 люкс.xlsx):  10%|▋      | 52/529 [00:17<00:49,  9.61строка/s][A
Строки (Согласие_3 люкс.xlsx):  12%|▊      | 63/529 [00:17<00:33, 14.05строка/s][A
Строки (Согласие_3 люкс.xlsx):  14%|▉      | 74/529 [00:17<00:23, 19.67строка/s][A
Строки (Согласие_3 люкс.xlsx):  16%|█      | 85/529 [00:17<00:16, 26.60строка/s][A
Строки (Согласие_3 люкс.xlsx):  18%|█▎     | 96/529 [00:17<00:12, 34.58строка/s][A
Строки (Согласие_3 люкс.xlsx):  20%|█▏    | 107/529 [00:17<00:09, 43.41строка/s][A
Строки (Согласие_3 люкс.xlsx):  22%|█▎    | 118/529 [00:17<00:07, 52.31строка/s][A
Строки (Согласие_3 люкс.xlsx):  24%|█▍    | 129/529 [00:17<00:06, 60.70строка/s][A
Строки (Согласие_3 люкс.xlsx):  26%|█▌    | 139/529 [00:18<00:05, 65.17стро

ROW: ['Город', '№ Программы', 'Наименование ЛПУ', 'Адрес ЛПУ', 'Виды помощи']
RESULT:  {
    "Название поликлиники": "Наименование ЛПУ",
    "Адрес": "Адрес ЛПУ",
    "Тип доступа": "-",
    "Виды помощи": "Виды помощи"
  }


Строки (Согласие_4 Екатеринбург.xlsx):   7%| | 15/214 [00:17<02:12,  1.51строка/[A
Строки (Согласие_4 Екатеринбург.xlsx):  11%| | 24/214 [00:17<01:04,  2.95строка/[A
Строки (Согласие_4 Екатеринбург.xlsx):  16%|▏| 34/214 [00:17<00:34,  5.14строка/[A
Строки (Согласие_4 Екатеринбург.xlsx):  21%|▏| 44/214 [00:17<00:20,  8.11строка/[A
Строки (Согласие_4 Екатеринбург.xlsx):  25%|▎| 54/214 [00:17<00:13, 12.02строка/[A
Строки (Согласие_4 Екатеринбург.xlsx):  30%|▎| 64/214 [00:17<00:08, 17.01строка/[A
Строки (Согласие_4 Екатеринбург.xlsx):  35%|▎| 74/214 [00:18<00:06, 23.14строка/[A
Строки (Согласие_4 Екатеринбург.xlsx):  39%|▍| 84/214 [00:18<00:04, 30.41строка/[A
Строки (Согласие_4 Екатеринбург.xlsx):  44%|▍| 94/214 [00:18<00:03, 38.60строка/[A
Строки (Согласие_4 Екатеринбург.xlsx):  49%|▍| 104/214 [00:18<00:02, 46.13строка[A
Строки (Согласие_4 Екатеринбург.xlsx):  53%|▌| 114/214 [00:18<00:01, 54.83строка[A
Строки (Согласие_4 Екатеринбург.xlsx):  58%|▌| 124/214 [00:18<00:01, 62.76ст

ROW: ['Город', '№ Программы', 'Наименование ЛПУ', 'Адрес ЛПУ', 'Виды помощи']
RESULT:  {
    "Название поликлиники": "Наименование ЛПУ",
    "Адрес": "Адрес ЛПУ",
    "Тип доступа": "-",
    "Виды помощи": "Виды помощи"
  }



Строки (Согласие_5 Новосибирск.xlsx):  11%| | 18/170 [00:15<01:17,  1.97строка/s[A
Строки (Согласие_5 Новосибирск.xlsx):  16%|▏| 27/170 [00:15<00:40,  3.56строка/s[A
Строки (Согласие_5 Новосибирск.xlsx):  22%|▏| 37/170 [00:15<00:22,  5.96строка/s[A
Строки (Согласие_5 Новосибирск.xlsx):  28%|▎| 47/170 [00:16<00:13,  9.18строка/s[A
Строки (Согласие_5 Новосибирск.xlsx):  34%|▎| 57/170 [00:16<00:08, 13.30строка/s[A
Строки (Согласие_5 Новосибирск.xlsx):  39%|▍| 66/170 [00:16<00:05, 18.00строка/s[A
Строки (Согласие_5 Новосибирск.xlsx):  44%|▍| 75/170 [00:16<00:03, 23.78строка/s[A
Строки (Согласие_5 Новосибирск.xlsx):  49%|▍| 84/170 [00:16<00:02, 29.65строка/s[A
Строки (Согласие_5 Новосибирск.xlsx):  55%|▌| 93/170 [00:16<00:02, 36.38строка/s[A
Строки (Согласие_5 Новосибирск.xlsx):  59%|▌| 101/170 [00:16<00:01, 42.64строка/[A
Строки (Согласие_5 Новосибирск.xlsx):  64%|▋| 109/170 [00:16<00:01, 48.29строка/[A
Строки (Согласие_5 Новосибирск.xlsx):  70%|▋| 119/170 [00:16<00:00, 57.51ст

ROW: ['Программа', 'Город ЛПУ', 'Наименование ЛПУ', 'Адрес ЛПУ', 'Виды обращений']
RESULT:  {
    "Название поликлиники": "Наименование ЛПУ",
    "Адрес": "Адрес ЛПУ",
    "Тип доступа": "Доступ в ЛПУ",
    "Виды помощи": "Виды обращений"
  }



Строки (согаз_Лист3.xlsx):  25%|███         | 18/71 [01:23<02:24,  2.73s/строка][A
Строки (согаз_Лист3.xlsx):  38%|████▌       | 27/71 [01:24<01:05,  1.48s/строка][A
Строки (согаз_Лист3.xlsx):  51%|██████      | 36/71 [01:24<00:31,  1.11строка/s][A
Строки (согаз_Лист3.xlsx):  63%|███████▌    | 45/71 [01:24<00:15,  1.73строка/s][A
Строки (согаз_Лист3.xlsx):  76%|█████████▏  | 54/71 [01:24<00:06,  2.60строка/s][A
Строки (согаз_Лист3.xlsx):  89%|██████████▋ | 63/71 [01:24<00:02,  3.81строка/s][A
Обработка файлов: 100%|█████████████████████████| 2/2 [01:33<00:00, 46.69s/file][A



 Модель Mistral завершена!
Затраченное время: 2210.59 сек
