In [5]:
import pandas as pd
from sqlalchemy import (
    create_engine, MetaData, Table, Column, Integer, String, ForeignKey, DateTime,
    UniqueConstraint, Index
)
from sqlalchemy.schema import CreateSchema
from llama_index.core.retrievers import NLSQLRetriever
from llama_index.core import SQLDatabase
from llama_index.llms.bedrock_converse import BedrockConverse
from llama_index.core.prompts import BasePromptTemplate, ChatPromptTemplate, ChatMessage, MessageRole, PromptTemplate
from sqlalchemy.sql import text
from dotenv import load_dotenv
import os
load_dotenv()

True

In [6]:


df = pd.read_excel("test.xlsx")

expected_types = {
    "doctor": str,
    "procedure": str,
    "duration_min": int,
    "duration_max": int,
    "cost": int,
    "anestesia": str,
    "if_anestesia_cost": int,
}

def validate_dataframe(df, expected_types):
    for col, dtype in expected_types.items():
        try:
            if dtype == str:
                df[col] = df[col].astype(str)
            else:
                df[col] = df[col].astype(int)
        except Exception as e:
            raise ValueError(f"Ошибка в формате данных в колонке '{col}': {e}")
    return df


df_validated = validate_dataframe(df, expected_types)

print("Все данные успешно провалидированы!")
print(df_validated.dtypes)

print(df_validated)

Все данные успешно провалидированы!
doctor               object
procedure            object
duration_min          int64
duration_max          int64
cost                  int64
anestesia            object
if_anestesia_cost     int64
dtype: object
           doctor                             procedure  duration_min  \
0    Иванова Л.Ю.                                ботокс            60   
1  Кузнецова Н.М.                         плазмотерапия            30   
2    Петрова П.Н.                       десневая улыбка            45   
3  Михайлова А.А.                           гипергидроз            30   
4   Скворцов К.С.          консультации врача-трихолога            60   
5    Иванова Л.Ю.    фототерапия VV и BBL  -крылья носа            20   
6    Иванова Л.Ю.  фототерапия лицо(пигментация/сосуды)            60   
7  Михайлова А.А.                              тестовая            30   
8   Скворцов К.С.                           гипергидроз            60   
9  Кузнецова Н.М.       

In [9]:
engine = create_engine("postgresql+psycopg2://postgres:postgres@localhost:5432/postgres")

schema_name = "medical"

with engine.begin() as conn:
    conn.execute(text(f"CREATE SCHEMA IF NOT EXISTS {schema_name}"))


metadata = MetaData(schema=schema_name)

procedures_table = Table(
    "procedures",
    metadata,
    Column("id", Integer, primary_key=True),  # уникальный идентификатор процедуры
    Column("doctor", String, nullable=False),
    Column("procedure", String, nullable=False),
    Column("duration_min", Integer),
    Column("duration_max", Integer),
    Column("cost", Integer),
    Column("anestesia", String),
    Column("if_anestesia_cost", Integer),
    UniqueConstraint("doctor", "procedure", name="uix_doctor_procedure"),  # уникальность для сочетания врач+процедура
    Index("idx_procedure_name", "procedure")  # индекс по названию процедуры для быстрого поиска
)

# Таблица записей клиентов
appointment_table = Table(
    "appointments",
    metadata,
    Column("id", Integer, primary_key=True),
    Column("client_name", String, nullable=False),
    Column("age", String),
    Column("email", String),
    Column("phone", String),
    Column("datetime", DateTime, nullable=False),
    Column("procedure_id", Integer, ForeignKey(f"{schema_name}.procedures.id"), nullable=False),  # ссылка на процедуру
    Column("duration", Integer),
    Column("cost", Integer),
    Column("anestesia", String),
    Column("if_anestesia_cost", Integer),
    Index("idx_appointment_datetime", "datetime")  # индекс по дате для быстрого поиска
)


metadata.create_all(engine)
df_validated.to_sql(
    "procedures",
    con=engine,
    schema=schema_name,
    if_exists="replace",
    index=False
)

10

In [4]:
aws_access_key_id = os.getenv('AWS_ACCESS_KEY_ID')
aws_secret_access_key = os.getenv('AWS_SECRET_ACCESS_KEY')
aws_bedrock_api_name = os.getenv('AWS_BEDROCK_KEY_NAME')
aws_bedrock_api_key = os.getenv('AWS_BEDROCK_API_KEY')
aws_guardrails = os.getenv("AWS_GUARDRAIL_ARN")
model_arn_4 = os.getenv('SONNET_4')

In [5]:
llm = BedrockConverse(
    model=model_arn_4,
    region_name="eu-central-1",
    temperature=0.3,
    max_tokens=512
)

#resp = llm.complete("процедуры")
#print(resp)

In [6]:
prompt_to_sql = PromptTemplate(
    """
    Ты помощник для генерации SQL-запросов в Postgres.

    Схема таблиц:
    {schema}

    В колонке anestesia варианты значений: обязательно, необязательно, нет
    В колонке cost указана стоимость за процедуру без анестезии
    В колонке if_anestesia_cost указана финальная стоимость за всю процедуру с анестезией, то есть если клиент спрашивает стоимость процедуры с анестезией,
    просто извлекай стоимость из if_anestesia_cost и не складывай ее с cost

    Диалект: {dialect}

    Запрос клиента:
    {query_str}

    Сформируй SQL, который отвечает на запрос. Не пиши ничего кроме SQL-запросов.
    
    Всегда включай в результат имена специалистов, даже если клиент не спрашивает напрямую.
    Если в названии процедуры опечатка - исправь опечатку для своего запроса.
    Формируй запрос, исходя из того, что процедура может называться чуть иначе в таблице. 
    Используй разные вариации для поиска, но исходи из содержания процедуры.

    """
)

In [11]:
sql_database = SQLDatabase(engine, schema="medical")

retriever = NLSQLRetriever(
    sql_database=sql_database,
    tables=["procedures"],
    return_raw=True,
    top_k=3,
    llm=llm,
    sql_parser_mode='default',
    embed_model="local",
    text_to_sql_prompt = prompt_to_sql
)


user_input = "Есть проблемы с перхотью, хочу узнать можно ли вылечить. Там делают анестезию? и сколько по времени?? сколько выйдет?"
results = retriever.retrieve(user_input)

print(results)

[NodeWithScore(node=TextNode(id_='17eb08cf-5925-409b-b91a-7629a17bd15e', embedding=None, metadata={'sql_query': "SELECT \n    doctor,\n    procedure,\n    duration_min,\n    duration_max,\n    cost,\n    anestesia,\n    if_anestesia_cost\nFROM procedures \nWHERE LOWER(procedure) LIKE '%перхот%' \n   OR LOWER(procedure) LIKE '%себоре%'\n   OR LOWER(procedure) LIKE '%кожа головы%'\n   OR LOWER(procedure) LIKE '%зуд головы%'\n   OR LOWER(procedure) LIKE '%шелушение%'\n   OR LOWER(procedure) LIKE '%трихолог%';", 'result': [('Скворцов К.С.', 'консультации врача-трихолога', 60, 60, 550, 'нет', 0), ('Кузнецова Н.М.', 'трихология', 30, 60, 700, 'необязательно', 1100)], 'col_keys': ['doctor', 'procedure', 'duration_min', 'duration_max', 'cost', 'anestesia', 'if_anestesia_cost']}, excluded_embed_metadata_keys=['sql_query', 'result', 'col_keys'], excluded_llm_metadata_keys=['sql_query', 'result', 'col_keys'], relationships={}, metadata_template='{key}: {value}', metadata_separator='\n', text="[('

In [12]:
node_with_score = results[0]

only_result = node_with_score.node.metadata["result"]

print(only_result)

[('Скворцов К.С.', 'консультации врача-трихолога', 60, 60, 550, 'нет', 0), ('Кузнецова Н.М.', 'трихология', 30, 60, 700, 'необязательно', 1100)]


In [94]:
prompt =f"""
Ты ассистент клиники эстетической медицины. 
Клиент задал вопрос: {user_input}
У тебя есть данные из базы данных sql по этому вопросу {results}. 
Ты должен вежливо ответить на запрос клиента, используя все данные, извлеченные из базы, а также предложить клиенту записаться к специалисту, который такую процедуру проводит.
Если специалистов несколько, предложи на выбор всех
"""

In [95]:
llm = BedrockConverse(
    model=model_arn_4,
    region_name="eu-central-1",
    temperature=0.3,
    max_tokens=512,
    system_prompt=prompt
)


response = llm.complete(prompt)

In [96]:
print(response)



Здравствуйте! С удовольствием помогу вам с записью к трихологу.

У нас работают два специалиста-трихолога:

**1. Скворцов К.С.**
- Консультация врача-трихолога
- Длительность: 60 минут
- Анестезия: не требуется
- Стоимость: 550 рублей

**2. Кузнецова Н.М.**
- Трихологические процедуры
- Длительность: от 30 до 60 минут
- Анестезия: по желанию (необязательно)
- Стоимость: 700 рублей без анестезии, 1800 рублей с анестезией

Как видите, анестезия зависит от выбранного специалиста и процедуры. У доктора Скворцова анестезия не применяется, а у доктора Кузнецовой она доступна по вашему желанию.

Какого специалиста вы бы предпочли? Я помогу вам записаться на удобное время. Также, если у вас есть конкретные жалобы или пожелания по процедуре, это поможет выбрать наиболее подходящего врача.
