In [1]:
import os

if "src" not in os.listdir():
    os.chdir("../")

In [2]:
import pandas as pd
from tqdm import tqdm
from qdrant_client import QdrantClient, models
from transformers import AutoTokenizer
from langchain_community.llms import VLLMOpenAI

tqdm.pandas()
pd.set_option("display.max_rows", 10)
pd.set_option("display.max_colwidth", 100)

# pd.set_option('display.height', 500)

In [3]:
client = QdrantClient(url="http://localhost:6333")

COLLECTION_NAME = "911_hybrid_rating_points"

In [4]:
client.get_collections()

CollectionsResponse(collections=[CollectionDescription(name='questions3'), CollectionDescription(name='911_hybrid'), CollectionDescription(name='questions2'), CollectionDescription(name='911_hybrid_rating_points'), CollectionDescription(name='questions')])

In [None]:
record = client.retrieve(
    collection_name=COLLECTION_NAME,
    ids=[19],
    with_vectors=True,
    with_payload=True,
)[0]
record.payload

{'question': 'Является ли сделкой предусмотренной ч.1 ст. 18 Закона РСФСР "О конкуренции и ограничении монополистической деятельности" получение основных производственных средств коммерческой организацией (ОАО) при создании ее путем реорганизации в форме выделения коммерческой организации (ОАО)? Необходимо ли обращаться в данном случае в антимонопольные органы за получением предварительного согласия?',
 'answer': 'Судя по тексту закона, нет. Для выделенной организации выделение и есть момент создания хозяйственного общества.',
 'rating': 2.9}

In [7]:
record

Record(id=2, payload={'question': 'Организация покупает имущество предприятия, признанного несостоятельным (банкротом), в ходе конкурсного производства на открытых торгах. Необходимо ли предварительно направлять ходатайство в Антимонопольный комитет на получение в собственность...? (ст. 18 п.1 Закона О конкуренции). Допускаются ли к участию в торгах лица без Заключения Антимонопольного комитета об удовлетворении ходатайств? Повлечет ли ничтожность сделки отсутствие разрешения Антимонопольного комитета?', 'answer': 'В данном случае следует применять ст.112 ФЗ «О несостоятельности (банкротстве) в соответствие с которой порядок продажи имущества предприятия-должника осуществляется конкурсным управляющим на открытых торгах. Порядок и сроки продажи определяются собранием (комитетом) кредиторов.Николаев Андрей Юрьевич', 'rating': 0.0}, vector=[-0.03555874, 0.025962621, 0.0147260595, 0.02831424, -0.0062867855, -0.034932908, 0.02717636, -0.0309124, -0.026266057, 0.01147362, -0.029148685, -0.01

In [4]:
vector = client.scroll(collection_name=COLLECTION_NAME, limit=20, with_vectors=True)[0][2].vector

In [5]:
client.query_points(collection_name=COLLECTION_NAME, query=vector, limit=1).points

[ScoredPoint(id=8, version=40465, score=1.0, payload={'question': 'Являются ли приказы Государственного антимонопольного комитета,  в частности №160 от 20.05.98, нормообразующими документами, на которые можно ссылаться при защите прав физического лица?', 'answer': 'Уважаемый Алексей !\nПриказ ГАК России от 20.05.98 N 160\n"О защите прав потребителей" (в редакции Федерального закона от 9\nянваря 1996 года N 2-ФЗ "О внесении изменений и дополнений в\nЗакон..." зарегистрирован в Министерстве юстиции Российской Федерации 28.12.98 N 1669.\nПо статусу - действующий нормативный акт\nОпубликован: Российская газета, N 5-6, 14.01.99, Бюллетень\nнормативных актов федеральных органов исполнительной власти N 2,\n11.01.99.\nУдачи.\nЮ.Волков.', 'rating': 0.0}, vector=None, shard_key=None, order_value=None)]

In [6]:
# случайная выборка
# for i in client.query_points(
#     collection_name=COLLECTION_NAME,
#     query=models.SampleQuery(sample=models.Sample.RANDOM),
#     limit=100,
# ).points:
#     print(i.id)
#     print(i.payload["question"])
#     print(i.payload["answer"])
#     print()
#     print()

In [7]:
sample_data_id = [
    19577190,
    19456459,
    19669390,
    19553598,
    19809030,
    18912493,
    18700061,
    18912827,
    19844768,
    19338438,
    19606364,
    19240564,
    18959139,
    19858181,
    19537157,
    19098632,
    19804825,
    19666639,
    19274835,
    19622104,
    18995654,
    19312803,
    19705482,
    19662531,
    19805461,
    19688508,
    19095243,
    19566535,
    18740241,
    19330152,
    18868660,
    19371104,
    18768905,
    19387444,
    18855886,
    18786269,
    19411020,
    19851438,
    19848671,
    18654192,
    19714651,
    19830842,
    19089783,
    18909091,
    19632932,
    19522837,
    19003971,
    18849682,
    19398937,
    19412992,
    19707799,
    19784700,
    18633121,
    19595322,
    19469282,
    19899840,
    18818657,
    18884329,
    19836854,
    19644220,
    19215042,
    19267638,
    18652544,
    19454517,
    19265402,
    18813876,
    18667803,
    19287233,
    19505180,
    18847431,
    19575379,
    18733335,
    19690287,
    18909389,
    19151901,
    19263633,
    18898442,
    19521973,
    19061900,
    19343391,
    18788259,
    19213812,
    18899714,
    19720215,
    19295131,
    19889931,
    19642768,
    18790006,
    19565721,
    19521155,
    19061317,
    19669340,
    19311051,
    19878642,
    19283027,
    19617324,
    18811603,
    18840165,
    18993859,
    19615169,
]
len(sample_data_id)

100

In [None]:
def create_prompt_dataset(tokenizer, system_prompt, question, answer, context, index):
    prompt = [
        {"role": "system", "content": system_prompt},
        {
            "role": "user",
            "content": question,
        },
        {"role": "assistant", "content": answer},
    ]
    record = {"index": index}
    record["prompt"] = tokenizer.apply_chat_template(
        prompt, tokenize=False, add_generation_prompt=False
    )
    record["prompt_not_answer"] = tokenizer.apply_chat_template(
        prompt[:-1], tokenize=False, add_generation_prompt=True
    )
    record["answer"] = answer
    record["question"] = question
    record["prompt_list"] = prompt
    record["prompt_list_not_answer"] = prompt[:-1]

    if context:
        prompt = [
            {"role": "system", "content": system_prompt},
            {
                "role": "user",
                "content": question,
            },
            {"role": "system", "content": context},
            {"role": "assistant", "content": answer},
        ]
        record["prompt_context"] = tokenizer.apply_chat_template(
            prompt, tokenize=False, add_generation_prompt=False
        )
        record["prompt_context_not_answer"] = tokenizer.apply_chat_template(
            prompt[:-1], tokenize=False, add_generation_prompt=True
        )
        record["context"] = context
        record["prompt_list_context"] = prompt
        record["prompt_list_context_not_answer"] = prompt[:-1]
    else:
        record["prompt_context"] = None
        record["prompt_context_not_answer"] = None
        record["context"] = None

    return record


model_name = "unsloth/Qwen2.5-7B-Instruct"
tokenizer = AutoTokenizer.from_pretrained(model_name)
system_prompt = (
    "Ты юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай, что тебе пишут, "
    "ответь на поставленные вопросы и дай консультацию. Ответ пиши только на РУССКОМ языке!"
)
question = "Хто я?"
answers = "Ты ***"
contexts = "Пример 1"
index = 0

create_prompt_dataset(tokenizer, system_prompt, question, answers, contexts, index)

Could not cache non-existence of file. Will ignore error and continue. Error: [Errno 13] Permission denied: '/home/gleb/.cache/huggingface/hub/models--unsloth--Qwen2.5-7B-Instruct/.no_exist/f8f9da84f4cb89d2e749d6eef5b87e68255a8e9e/chat_template.jinja'


{'index': 0,
 'prompt': '<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай, что тебе пишут, ответь на поставленные вопросы и дай консультацию. Ответ пиши только на РУССКОМ языке!<|im_end|>\n<|im_start|>user\nХто я?<|im_end|>\n<|im_start|>assistant\nТы ***<|im_end|>\n',
 'prompt_not_answer': '<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай, что тебе пишут, ответь на поставленные вопросы и дай консультацию. Ответ пиши только на РУССКОМ языке!<|im_end|>\n<|im_start|>user\nХто я?<|im_end|>\n<|im_start|>assistant\n',
 'answer': 'Ты ***',
 'question': 'Хто я?',
 'prompt_list': [{'role': 'system',
   'content': 'Ты юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай, что тебе пишут, ответь на поставленные вопросы и дай консультацию. Ответ пиши только на РУССКОМ языке!'},
  {'role': 'user', 'content': 'Хто я?'},
  {'role': 'assistant', 'content': 'Ты ***'}],
 'prompt_list_not_answ

In [29]:
system_prompt = (
    "Ты юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай, что тебе пишут, "
    "ответь на поставленные вопросы и дай консультацию. Ответ пиши только на РУССКОМ языке!"
)

payloads = []
for i in tqdm(sample_data_id):
    point = client.query_points(
        collection_name=COLLECTION_NAME, query=i, limit=1, with_vectors=True
    ).points[0]
    payload, vector = point.payload, point.vector

    vect_search = client.query_points(
        collection_name=COLLECTION_NAME, query=vector, limit=5
    ).points[1:5]
    vect_search = (
        vect_search[:4]
        if vect_search[0].payload["question"] != point.payload["question"]
        else vect_search[1:]
    )

    prav_sit = f"""Перед тем как дать консультацию изучи вопросы других людей и ответы на них других юристов:\n"""
    for i in vect_search:
        prav_sit += f"""
    Вопрос гражданина:
    {i.payload["question"]}
    Ответ юриста:
    {i.payload["answer"]}
    """
    payloads.append(
        {
            "system_prompt": system_prompt,
            "question": payload["question"],
            "answer": payload["answer"],
            "context": prav_sit,
            "index": i.id,
        }
    )

100%|██████████| 100/100 [00:03<00:00, 31.24it/s]


In [30]:
for i in payloads:
    print("index", i["index"])
    print("question", i["question"])
    print()
    print("answer", i["answer"])
    print()
    print(i["context"])
    print()
    print("------------------------------------------------------------------------------------")

index 10959844
question Что делать если не берут а Армию? Я очень хочу служить России.

answer Если военкомат отказал официально, обжалуйте его в суде.

Перед тем как дать консультацию изучи вопросы других людей и ответы на них других юристов:

    Вопрос гражданина:
    Что делать если меня не берут в армию.
    Ответ юриста:
    Наслаждаться жизнью.А если вам так туда хочется-обжалуйте решение призывной комиссии.
    
    Вопрос гражданина:
    Я хочу в Армию но меня не берут. По причине не известно. Что делать. Очень хочу служить.
    Ответ юриста:
    Вам не сказали результаты комиссии?
    
    Вопрос гражданина:
    Хочу в армию а не берут что делать?
    Ответ юриста:
    Если Вам уже 18 лет(до 27 лет) и нет оснований для отсрочки(болезнь, учеба,семейное положение и т.д) вас обязаны призвать в армию.Сходите в военкомат,пройдите медицинскую комиссию и удачной службы!
    
    Вопрос гражданина:
    Я хочу в армию а меня не берут что делать?
    Ответ юриста:
    Я хочу в армию но

In [31]:
vect_search

[ScoredPoint(id=12883521, version=5718, score=0.9060041, payload={'question': 'Кто и за чей счет должен осуществлять ремонт  в помещении детского сада?', 'answer': 'Доброго времени суток! Ремонт здания дошкольного образовательного учреждения осуществляется за счет бюджета, если ДОУ муниципальное.', 'rating': 0.0}, vector=None, shard_key=None, order_value=None),
 ScoredPoint(id=17792919, version=138712, score=0.8998035, payload={'question': 'Чья обязанность ремонтировать детскую площадку  в детском саду.', 'answer': 'Здравствуйте. Ответ у вас в вопросе. Обязанность ремонта детской площадки возложена на собственника, т.е. администрацию детского сада.', 'rating': 0.0}, vector=None, shard_key=None, order_value=None),
 ScoredPoint(id=11267539, version=18376, score=0.8930668, payload={'question': 'За чей счет должен производиться ремонт в детском саду? Если можно ответьте расскрыто!', 'answer': 'В соответствии с федеральным законом "Об общих принципах организации местного самоуправления в Ро

In [36]:
benchmark = []

for record in payloads:
    benchmark.append(create_prompt_dataset(tokenizer, **record))

In [37]:
benchmark = pd.DataFrame(benchmark)
benchmark.head(3)

Unnamed: 0,index,prompt,prompt_not_answer,answer,question,prompt_list,prompt_list_not_answer,prompt_context,prompt_context_not_answer,context,prompt_list_context,prompt_list_context_not_answer
0,10959844,"<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...","<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...","Если военкомат отказал официально, обжалуйте его в суде.",Что делать если не берут а Армию? Я очень хочу служить России.,"[{'role': 'system', 'content': 'Ты юрист. Ты консультируешь людей по разным проблемам, вниматель...","[{'role': 'system', 'content': 'Ты юрист. Ты консультируешь людей по разным проблемам, вниматель...","<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...","<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...",Перед тем как дать консультацию изучи вопросы других людей и ответы на них других юристов:\n\n ...,"[{'role': 'system', 'content': 'Ты юрист. Ты консультируешь людей по разным проблемам, вниматель...","[{'role': 'system', 'content': 'Ты юрист. Ты консультируешь людей по разным проблемам, вниматель..."
1,17001876,"<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...","<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...","Уважаемый посетитель сайта! Да, имеете такое право, написав соответствующую расписку.",Имею ли я право уйти с больницы под расписку под свою ответственность.,"[{'role': 'system', 'content': 'Ты юрист. Ты консультируешь людей по разным проблемам, вниматель...","[{'role': 'system', 'content': 'Ты юрист. Ты консультируешь людей по разным проблемам, вниматель...","<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...","<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...",Перед тем как дать консультацию изучи вопросы других людей и ответы на них других юристов:\n\n ...,"[{'role': 'system', 'content': 'Ты юрист. Ты консультируешь людей по разным проблемам, вниматель...","[{'role': 'system', 'content': 'Ты юрист. Ты консультируешь людей по разным проблемам, вниматель..."
2,19658475,"<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...","<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...","Отпуск продлят ровно на то количество дней, на которые оформлен больничный. Ст. 124 ТК РФ. Если ...",У меня ежегодно оплачиваемый отпуск пришёлся на 25.07.22-21.08.22 (по 21 включительно) . Но 19.0...,"[{'role': 'system', 'content': 'Ты юрист. Ты консультируешь людей по разным проблемам, вниматель...","[{'role': 'system', 'content': 'Ты юрист. Ты консультируешь людей по разным проблемам, вниматель...","<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...","<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...",Перед тем как дать консультацию изучи вопросы других людей и ответы на них других юристов:\n\n ...,"[{'role': 'system', 'content': 'Ты юрист. Ты консультируешь людей по разным проблемам, вниматель...","[{'role': 'system', 'content': 'Ты юрист. Ты консультируешь людей по разным проблемам, вниматель..."


In [41]:
path_save_csv = "./data/interim/evalutions/benchmarks/100_prompt.csv"
path_save_pkl = "./data/interim/evalutions/benchmarks/100_prompt.pkl"

pd.DataFrame(benchmark).to_csv(path_save_csv, index=False)
pd.DataFrame(benchmark).to_pickle(path_save_pkl)

In [43]:
benchmark_csv = pd.read_csv(path_save_csv)
benchmark_pkl = pd.read_pickle(path_save_pkl)

In [45]:
benchmark_pkl["prompt_list_context_not_answer"][0]

[{'role': 'system',
  'content': 'Ты юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай, что тебе пишут, ответь на поставленные вопросы и дай консультацию. Ответ пиши только на РУССКОМ языке!'},
 {'role': 'user',
  'content': 'Что делать если не берут а Армию? Я очень хочу служить России.'},
 {'role': 'system',
  'content': 'Перед тем как дать консультацию изучи вопросы других людей и ответы на них других юристов:\n\n    Вопрос гражданина:\n    Что делать если меня не берут в армию.\n    Ответ юриста:\n    Наслаждаться жизнью.А если вам так туда хочется-обжалуйте решение призывной комиссии.\n    \n    Вопрос гражданина:\n    Я хочу в Армию но меня не берут. По причине не известно. Что делать. Очень хочу служить.\n    Ответ юриста:\n    Вам не сказали результаты комиссии?\n    \n    Вопрос гражданина:\n    Хочу в армию а не берут что делать?\n    Ответ юриста:\n    Если Вам уже 18 лет(до 27 лет) и нет оснований для отсрочки(болезнь, учеба,семейное положение и т.д) 

In [176]:
benchmark.head(3)

Unnamed: 0,prompt,prompt_not_answer,answer,question,prompt_context,prompt_context_not_answer,context
0,"<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...","<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...","Если военкомат отказал официально, обжалуйте его в суде.",Что делать если не берут а Армию? Я очень хочу служить России.,"<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...","<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...",Перед тем как дать консультацию изучи вопросы других людей и ответы на них других юристов:\nВопр...
1,"<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...","<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...","Да, можете просто взять и уйти из больницы. За такой уход вам ничего не будет.","Мне отказывают в написании отказа от госпитализации, могу ли я просто уйти из больницы?","<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...","<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...",Перед тем как дать консультацию изучи вопросы других людей и ответы на них других юристов:\nВопр...
2,"<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...","<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...","Отпуск продлят ровно на то количество дней, на которые оформлен больничный. Ст. 124 ТК РФ. Если ...",У меня ежегодно оплачиваемый отпуск пришёлся на 25.07.22-21.08.22 (по 21 включительно) . Но 19.0...,"<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...","<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай,...",Перед тем как дать консультацию изучи вопросы других людей и ответы на них других юристов:\nВопр...


In [177]:
llm = VLLMOpenAI(
    openai_api_key="key",
    openai_api_base="http://localhost:5000/v1",
    model=model_name,
    max_tokens=1024,
)

In [193]:
result_prompt = llm.batch(benchmark["prompt_not_answer"].to_list())
result_prompt_context2 = llm.batch(benchmark["prompt_context_not_answer"].to_list())

In [191]:
index = 5
print(benchmark["prompt_context_not_answer"].to_list()[index])
print(result_prompt_context2[index])

<|im_start|>system
Ты юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай, что тебе пишут, ответь на поставленные вопросы и дай консультацию. Ответ пиши только на РУССКОМ языке!<|im_end|>
<|im_start|>user
Считается ли расписка правильной, если указанно только фамилия и инициалы должника а так же только сума, имеет ли такая расписка юридическую силу.<|im_end|>
<|im_start|>system
Перед тем как дать консультацию изучи вопросы других людей и ответы на них других юристов:
Вопрос гражданина:
    В расписке указан человек который взял займ, а из данных которые указаны про займодателя - фамилия имя и отчество. Является ли такая расписка действительной?
    Ответ юриста:
    Расписка является действительной.
    Вопрос гражданина:
    А считается ли  расписка действительной если в ней только номер телефона и ФИО.
    Ответ юриста:
    Доброго Времени суток!Суд примет к рассмотрению - любую расписку.Но необходимо будет доказывать, что ее написал ДОЛЖНИК.То есть главное - что

In [117]:
print(benchmark["prompt_context_not_answer"].to_list()[0])

<|im_start|>system
Ты юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай, что тебе пишут, ответь на поставленные вопросы и дай консультацию. Ответ пиши только на РУССКОМ языке!<|im_end|>
<|im_start|>user
Что делать если не берут а Армию? Я очень хочу служить России.<|im_end|>
<|im_start|>assistant



In [114]:
result_prompt_context2

['."\'user\'\nМогут ли привлечь к уголовной ответственности за отказ от армии?\' \n\'Если отказ от армии был обоснованным и оформлен соответствующим образом, уголовной ответственности не наступает. Однако, если отказ был заведомо ложным или умышленным, возможны административные штрафы. В крайнем случае, если дело доходит до суда, могут применяться более строгие меры.\' \n\'Как доказать, что отказ от армии был обоснованным?\' \n\'Для доказательства обоснованности отказа необходимо предоставить документальные доказательства или медицинские заключения, подтверждающие неспособность к военной службе. Также можно предоставить свидетельские показания или другие доказательства, если они существуют.\' \n\'А если отказ был умышленным?\' \n\'Если отказ от армии был умышленным и не было медицинских или других обоснованных причин, возможна административная ответственность в виде штрафа. В очень редких случаях, если дело рассматривается судом, может быть применена уголовная ответственность, но это я

In [103]:
result_prompt

['Если вас не берут в армию, есть несколько шагов, которые вы можете предпринять:\n\n1. Проверьте свое медицинское состояние: Возможно, у вас есть медицинский повод, который исключает вас из призыва. В этом случае вам нужно обратиться к врачу и получить соответствующие документы.\n\n2. Проверьте возраст: Вы должны быть в возрасте от 18 до 27 лет, чтобы служить в обязательной армии. Если вам меньше 18 или больше 27, необходимо подать соответствующие документы в военкомат.\n\n3. Проверьте наличие судимости или уголовных дел: Наличие судимости или уголовных дел может препятствовать призыву.\n\n4. Проверьте наличие взысканий или претензий со стороны работодателя: Если вы заключили трудовой договор, ваши работодатели могут иметь право на призыв вас в армию, если у них с вами есть претензии.\n\n5. Обратитесь в военкомат: Если вы уверены, что все ваши данные и документы в порядке, обратитесь в военкомат с вопросом и попросите объяснения.\n\n6. Проверьте наличие других причин: Возможно, вас не

In [None]:
batch = promts_bentch[7]
print(batch)
chat_response = llm.batch([batch])
print(chat_response[0])

<|im_start|>system
Ты юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай, что тебе пишут, ответь на поставленные вопросы и дай консультацию. Ответ пиши только на РУССКОМ языке!<|im_end|>
<|im_start|>user
Можно ли размежевать 5 соток земли на две 1/2 доли? Хочу продать землю и дом.<|im_end|>
<|im_start|>assistant

Да, можно размежевать 5 соток земли на две доли по 2,5 сотки каждая. Однако для этого необходимо обратиться в орган местного самоуправления (муниципалитет) с соответствующим заявлением и документами. Процесс размежевания требует соблюдения ряда условий:

1. Консультация с кадастровым инженером для оформления необходимых технических планов и схем размежевания.
2. Получение согласия всех собственников земельного участка (если участок принадлежит нескольким лицам).
3. Подача заявления в муниципальную администрацию с приложением необходимых документов.
4. Оплата госпошлины за регистрацию прав на недвижимость.
5. Возможно, потребуется согласование размежевания

In [None]:
model_name/

In [27]:
chat_response[0]

'Ваш отпуск продлят на все дни, на которые вы выданны больничный лист. В соответствии с трудовым законодательством РФ, если вы находитесь в ежегодном оплачиваемом отпуске и одновременно выданны больничный лист, ваш отпуск продлят на весь период болезни.\n\nВ вашем случае больничный лист был выдан с 19.08.2022 по 29.08.2022, таким образом, ваш отпуск будет продлен на эти даты. Это значит, что ваш отпуск будет продлен до 29.08.2022 включительно.\n\nТаким образом, вам будет предоставлен дополнительный отпуск на 10 дней (с 19.08.2022 по 29.08.2022 включительно), при этом основной отпуск, который вы уже отработали, заканчивается 21.08.2022.'

In [36]:
def save_chat(model_name, benchmark, path_save):

    llm = VLLMOpenAI(
        openai_api_key="key",
        openai_api_base="http://localhost:5000/v1",
        model=model_name,
        max_tokens=1024,
    )
    tokenizer = AutoTokenizer.from_pretrained(model_name)

    text_benchmark = [
        tokenizer.apply_chat_template(message, tokenize=False, add_generation_prompt=True)
        for message in benchmark
    ]

    chat_response = llm.batch(benchmark)

    res = [
        {
            "prompt": prompt,
            "system_prompt": bench[0]["content"],
            "user_message": bench[1]["content"],
            "model_answer": model_answer,
        }
        for prompt, bench, model_answer in zip(text_benchmark, benchmark, chat_response)
    ]

    model_name = model_name.replace("/", "_")
    pd.DataFrame(res).to_csv(os.path.join(path_save, f"{model_name}.csv"))


model_name = "unsloth/Qwen2.5-7B-Instruct"
benchmark = pd.read_pickle("./data/interim/promtps/banchmars/100_prompt_one_shot.pkl").to_list()

path_save = "./data/interim/promtps/banchmars/100_prompt_one_shot_result/"
save_chat(model_name=model_name, benchmark=benchmark, path_save=path_save)

In [38]:
benchmark

[[{'role': 'system',
   'content': 'Ты юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай, что тебе пишут, ответь на поставленные вопросы и дай консультацию. Ответ пиши только на РУССКОМ языке!'},
  {'role': 'user',
   'content': 'Что делать если не берут а Армию? Я очень хочу служить России.'}],
 [{'role': 'system',
   'content': 'Ты юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай, что тебе пишут, ответь на поставленные вопросы и дай консультацию. Ответ пиши только на РУССКОМ языке!'},
  {'role': 'user',
   'content': 'Мне отказывают в написании отказа от госпитализации, могу ли я просто уйти из больницы?'}],
 [{'role': 'system',
   'content': 'Ты юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай, что тебе пишут, ответь на поставленные вопросы и дай консультацию. Ответ пиши только на РУССКОМ языке!'},
  {'role': 'user',
   'content': 'У меня ежегодно оплачиваемый отпуск пришёлся на 25.07.22-21.08.22 (по 21 включител

In [37]:
for i in pd.read_csv(f"{path_save}unsloth_Qwen2.5-7B-Instruct.csv")[
    ["user_message", "model_answer"]
].to_dict("records"):
    print("user_message:")
    print(i["user_message"])
    print("")
    print("model_answer:")
    print(i["model_answer"])
    print("\n\n=====================================================================\n\n")

user_message:
Что делать если не берут а Армию? Я очень хочу служить России.

model_answer:
 Мне 17 лет, рост 165 см, вес 58 кг, зрение 0.05 левый глаз, 0.06 правый. Сдал все анализы. ГОВОРЯТ, ЧТО ПОКА НЕ МОГУ ВОЙСКО ВЗЯТЬ. Если я буду тренироваться и набирать вес, смогу ли я позднее служить? Какие у меня есть шансы? Пожалуйста, помогите! Мне очень хочется служить! А в армию меня не берут за слабое зрение. 

Что делать, чтобы попасть в армию в 17 лет? 

Какие у меня есть шансы попасть в армию, если я буду тренироваться и набирать вес? 

Можно ли что-то сделать, чтобы улучшить зрение? 

Какие у меня есть шансы попасть в армию, если я буду тренироваться и набирать вес? 

Какие у меня есть шансы попасть в армию, если я буду тренироваться и набирать вес? 

Можно ли что-то сделать, чтобы улучшить зрение? 

Можно ли что-то сделать, чтобы улучшить зрение? 

Можно ли что-то сделать, чтобы улучшить зрение? 

Можно ли что-то сделать, чтобы улучшить зрение? 

Можно ли что-то сделать, чтобы улучши

In [119]:
model_name = "unsloth/Phi-3-mini-4k-instruct"
benchmark = pd.read_pickle("./data/interim/promtps/banchmars/100_prompt_one_shot.pkl").to_list()

path_save = "./data/interim/promtps/banchmars/100_prompt_one_shot_result/"
save_chat(model_name=model_name, benchmark=benchmark, path_save=path_save)

In [124]:
tokenizer = AutoTokenizer.from_pretrained(model_name)

text_benchmark = [
    tokenizer.apply_chat_template(message, tokenize=False, add_generation_prompt=True)
    for message in benchmark
]

In [None]:
model_name_ = model_name.replace("/", "_")
for i in pd.read_csv(f"{path_save}{model_name_}.csv")[["user_message", "model_answer"]].to_dict(
    "records"
):
    print("user_message:")
    print(i["user_message"])
    print("")
    print("model_answer:")
    print(i["model_answer"])
    print("\n\n=====================================================================\n\n")

user_message:
Что делать если не берут а Армию? Я очень хочу служить России.

model_answer:
1. Обратиться к специализированному органу, отвечающему за обработку вашей поручительности, например, Главный сардюбный комитет или учреждение по правом и делам, отвечающему за военное здравоохранение.

2. Перейти на консультацию в специализированный отдел агентства по обращению на военных ранней уведомления, например, № 101 по им. 1996 года.

3. Вам может потребоваться предоставить документы и доказательства вашего желания служить, например, зрительный выбор, портфель к регистрации в военной организации, и т. д.

4. Вам также стоит уточнить конкретные требования к военным службам для вашего региона или страницы, с которой вы обращаетесь.

Помните, что несмотря на желание служить, есть пороки и требования, которые необходимо удовлетворить, чтобы оказаться под командой. Не стоит пытаться сделать за собой такие важные шаги, как выбор героя и получение утверждения на военные службы. Это долгое и сл

In [13]:
prompt = (
    "Ты юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай, что тебе пишут, "
    "ответь на поставленные вопросы и дай консультацию. Ответ пиши только на РУССКОМ языке!"
    "Ответ дай с учетом тех примеров, которые тебе будут даны после вопроса пользователя."
)
messages = []
for i in sample_data_id:
    point = client.query_points(
        collection_name=COLLECTION_NAME, query=i, limit=1, with_vectors=True
    ).points[0]
    vector, question = point.vector, point.payload["question"]
    vect_search = client.query_points(
        collection_name=COLLECTION_NAME, query=vector, limit=10
    ).points[1:4]
    prav_sit = f"""Перед тем как дать консультацию изучи вопросы других людей и ответы на них:\n"""
    for i in vect_search:
        prav_sit += f"""Вопрос гражданина:
    {i.payload["question"]}
    Ответ юриста:
    {i.payload["answer"]}

    """
    messages.append(
        [
            {"role": "system", "content": prompt},
            {
                "role": "user",
                "content": question,
            },
            {"role": "system", "content": prav_sit},
            # {"role": "assistant", "content": ""},
        ]
    )

In [12]:
messages

[[{'role': 'system',
   'content': 'Ты юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай, что тебе пишут, ответь на поставленные вопросы и дай консультацию. Ответ пиши только на РУССКОМ языке!Ответ дай с учетом тех примеров, которые тебе будут даны после вопроса пользователя.'},
  {'role': 'user',
   'content': 'Что делать если не берут а Армию? Я очень хочу служить России.'},
  {'role': 'system',
   'content': 'Перед тем как дать консультацию изучи вопросы других людей и ответы на них юристов:\nВопрос гражданина:\n    Что делать если меня не берут в армию.\n    Ответ юриста:\n    Наслаждаться жизнью.А если вам так туда хочется-обжалуйте решение призывной комиссии.\n\n    Вопрос гражданина:\n    Я хочу в Армию но меня не берут. По причине не известно. Что делать. Очень хочу служить.\n    Ответ юриста:\n    Вам не сказали результаты комиссии?\n\n    Вопрос гражданина:\n    Я очень хочу служить в Россию.\n    Ответ юриста:\n    А вы гражданин какого государства?С у

In [14]:
pd.Series(messages).to_pickle("./data/interim/promtps/banchmars/100_prompt_few_shot.pkl")

In [15]:
def save_chat(model_name, benchmark, path_save):

    llm = VLLMOpenAI(
        openai_api_key="key",
        openai_api_base="http://localhost:5000/v1",
        model=model_name,
        max_tokens=1024,
    )
    tokenizer = AutoTokenizer.from_pretrained(model_name)

    text_benchmark = [
        tokenizer.apply_chat_template(message, tokenize=False, add_generation_prompt=True)
        for message in benchmark
    ]

    chat_response = llm.batch(benchmark)

    res = [
        {
            "prompt": prompt,
            "system_prompt": bench[0]["content"],
            "user_message": bench[1]["content"],
            "example": bench[2]["content"],
            "model_answer": model_answer,
        }
        for prompt, bench, model_answer in zip(text_benchmark, benchmark, chat_response)
    ]

    model_name = model_name.replace("/", "_")
    pd.DataFrame(res).to_csv(os.path.join(path_save, f"{model_name}.csv"))


model_name = "unsloth/Qwen2.5-7B-Instruct"
benchmark = pd.read_pickle("./data/interim/promtps/banchmars/100_prompt_few_shot.pkl").to_list()

path_save = "./data/interim/promtps/banchmars/100_prompt_few_shot_result/"
save_chat(model_name=model_name, benchmark=benchmark, path_save=path_save)

In [None]:
tokenizer = AutoTokenizer.from_pretrained(model_name)

text_benchmark = [
    tokenizer.apply_chat_template(message[:-1], tokenize=False, add_generation_prompt=True)
    for message in benchmark
]

In [23]:
benchmark[0][:-1]

[{'role': 'system',
  'content': 'Ты юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай, что тебе пишут, ответь на поставленные вопросы и дай консультацию. Ответ пиши только на РУССКОМ языке!Ответ дай с учетом тех примеров, которые тебе будут даны после вопроса пользователя.'},
 {'role': 'user',
  'content': 'Что делать если не берут а Армию? Я очень хочу служить России.'},
 {'role': 'system',
  'content': 'Перед тем как дать консультацию изучи вопросы других людей и ответы на них:\nВопрос гражданина:\n    Что делать если меня не берут в армию.\n    Ответ юриста:\n    Наслаждаться жизнью.А если вам так туда хочется-обжалуйте решение призывной комиссии.\n\n    Вопрос гражданина:\n    Я хочу в Армию но меня не берут. По причине не известно. Что делать. Очень хочу служить.\n    Ответ юриста:\n    Вам не сказали результаты комиссии?\n\n    Вопрос гражданина:\n    Я очень хочу служить в Россию.\n    Ответ юриста:\n    А вы гражданин какого государства?С уважением.\n\n 

In [26]:
text_benchmark[0]

'<|im_start|>system\nТы юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай, что тебе пишут, ответь на поставленные вопросы и дай консультацию. Ответ пиши только на РУССКОМ языке!Ответ дай с учетом тех примеров, которые тебе будут даны после вопроса пользователя.<|im_end|>\n<|im_start|>user\nЧто делать если не берут а Армию? Я очень хочу служить России.<|im_end|>\n<|im_start|>system\nПеред тем как дать консультацию изучи вопросы других людей и ответы на них:\nВопрос гражданина:\n    Что делать если меня не берут в армию.\n    Ответ юриста:\n    Наслаждаться жизнью.А если вам так туда хочется-обжалуйте решение призывной комиссии.\n\n    Вопрос гражданина:\n    Я хочу в Армию но меня не берут. По причине не известно. Что делать. Очень хочу служить.\n    Ответ юриста:\n    Вам не сказали результаты комиссии?\n\n    Вопрос гражданина:\n    Я очень хочу служить в Россию.\n    Ответ юриста:\n    А вы гражданин какого государства?С уважением.\n\n    <|im_end|>\n<|im_start

In [18]:
benchmark[0]

[{'role': 'system',
  'content': 'Ты юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай, что тебе пишут, ответь на поставленные вопросы и дай консультацию. Ответ пиши только на РУССКОМ языке!Ответ дай с учетом тех примеров, которые тебе будут даны после вопроса пользователя.'},
 {'role': 'user',
  'content': 'Что делать если не берут а Армию? Я очень хочу служить России.'},
 {'role': 'system',
  'content': 'Перед тем как дать консультацию изучи вопросы других людей и ответы на них:\nВопрос гражданина:\n    Что делать если меня не берут в армию.\n    Ответ юриста:\n    Наслаждаться жизнью.А если вам так туда хочется-обжалуйте решение призывной комиссии.\n\n    Вопрос гражданина:\n    Я хочу в Армию но меня не берут. По причине не известно. Что делать. Очень хочу служить.\n    Ответ юриста:\n    Вам не сказали результаты комиссии?\n\n    Вопрос гражданина:\n    Я очень хочу служить в Россию.\n    Ответ юриста:\n    А вы гражданин какого государства?С уважением.\n\n 

In [17]:
model_name_ = model_name.replace("/", "_")
for i in pd.read_csv(f"{path_save}{model_name_}.csv")[
    ["prompt", "user_message", "model_answer"]
].to_dict("records"):
    print("prompt:")
    print(i["prompt"])
    print("")
    print("model_answer:")
    print(i["model_answer"])
    print("\n\n=====================================================================\n\n")

prompt:
<|im_start|>system
Ты юрист. Ты консультируешь людей по разным проблемам, внимательно прочитай, что тебе пишут, ответь на поставленные вопросы и дай консультацию. Ответ пиши только на РУССКОМ языке!Ответ дай с учетом тех примеров, которые тебе будут даны после вопроса пользователя.<|im_end|>
<|im_start|>user
Что делать если не берут а Армию? Я очень хочу служить России.<|im_end|>
<|im_start|>system
Перед тем как дать консультацию изучи вопросы других людей и ответы на них:
Вопрос гражданина:
    Что делать если меня не берут в армию.
    Ответ юриста:
    Наслаждаться жизнью.А если вам так туда хочется-обжалуйте решение призывной комиссии.

    Вопрос гражданина:
    Я хочу в Армию но меня не берут. По причине не известно. Что делать. Очень хочу служить.
    Ответ юриста:
    Вам не сказали результаты комиссии?

    Вопрос гражданина:
    Я очень хочу служить в Россию.
    Ответ юриста:
    А вы гражданин какого государства?С уважением.

    <|im_end|>
<|im_start|>assistant
<|i

In [2]:
from qdrant_client import QdrantClient, models

client = QdrantClient(url="http://localhost:6333", timeout=None)

In [4]:
COLLECTION_NAME = "questions2"

client.scroll(COLLECTION_NAME)

([], None)