<a href="https://colab.research.google.com/github/Reichart88/endocrynology_base_neuro/blob/main/%D0%9F%D1%80%D0%BE%D1%81%D1%82%D0%BE%D0%B9_%D0%BD%D0%B5%D0%B9%D1%80%D0%BE%D1%81%D0%BE%D1%82%D1%80%D1%83%D0%B4%D0%BD%D0%B8%D0%BA_(%D0%B2%D1%80%D0%B0%D1%87).ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
!pip install openai gradio tiktoken langchain langchain-openai langchain-community chromadb

Collecting gradio
  Downloading gradio-5.20.0-py3-none-any.whl.metadata (16 kB)
Collecting tiktoken
  Downloading tiktoken-0.9.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (6.7 kB)
Collecting langchain-openai
  Downloading langchain_openai-0.3.7-py3-none-any.whl.metadata (2.3 kB)
Collecting langchain-community
  Downloading langchain_community-0.3.19-py3-none-any.whl.metadata (2.4 kB)
Collecting chromadb
  Downloading chromadb-0.6.3-py3-none-any.whl.metadata (6.8 kB)
Collecting aiofiles<24.0,>=22.0 (from gradio)
  Downloading aiofiles-23.2.1-py3-none-any.whl.metadata (9.7 kB)
Collecting fastapi<1.0,>=0.115.2 (from gradio)
  Downloading fastapi-0.115.11-py3-none-any.whl.metadata (27 kB)
Collecting ffmpy (from gradio)
  Downloading ffmpy-0.5.0-py3-none-any.whl.metadata (3.0 kB)
Collecting gradio-client==1.7.2 (from gradio)
  Downloading gradio_client-1.7.2-py3-none-any.whl.metadata (7.1 kB)
Collecting groovy~=0.1 (from gradio)
  Downloading groovy-0.1.2-py3-none-

In [None]:
import getpass
import os
from langchain.docstore.document import Document
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.vectorstores import Chroma
from langchain.text_splitter import CharacterTextSplitter
import requests
from openai import OpenAI
import gradio as gr
import tiktoken
import re

# Установка API ключа
os.environ["OPENAI_API_KEY"] = getpass.getpass("Paste your key:")

class GPT():
    def __init__(self, model="gpt-3.5-turbo"):
        self.log = ''
        self.model = model
        self.search_index = None
        self.client = OpenAI(api_key=os.environ["OPENAI_API_KEY"])
        self.doc_url = "https://docs.google.com/document/d/16lVkyDUpmPGDH0Qu1_XfXQmDKY6DGmieVC82nkHvBGM/edit?usp=sharing"
        self.system_prompt = '''Ты опытный врач-эндокринолог с 15-летним стажем. Твоя задача - консультировать пациентов по вопросам эндокринологии, основываясь на предоставленной медицинской информации.

                    Стиль общения:
                    - Говори профессионально, но понятно для пациента
                    - Используй вежливый и спокойный тон
                    - Проявляй эмпатию

                    Важные правила:
                    1. Отвечай ТОЛЬКО на основе предоставленной информации из документа
                    2. Если информации недостаточно, обязательно скажи об этом и рекомендуй обратиться к врачу очно
                    3. НЕ ставь диагнозы
                    4. Давай только общие рекомендации из документа
                    5. При упоминании серьезных симптомов настаивай на очной консультации
                    6. Структурируй ответ по пунктам для лучшего восприятия
                    7. В конце каждого ответа напоминай, что это общая информация и необходима консультация врача'''

    def load_search_indexes(self):
        match_ = re.search('/document/d/([a-zA-Z0-9-_]+)', self.doc_url)
        if match_ is None:
            raise ValueError('Неверный Google Docs URL')

        doc_id = match_.group(1)
        response = requests.get(f'https://docs.google.com/document/d/{doc_id}/export?format=txt')
        response.raise_for_status()

        return self.create_embedding(response.text)

    def num_tokens_from_string(self, string):
        encoding = tiktoken.encoding_for_model(self.model)
        num_tokens = len(encoding.encode(string))
        return num_tokens

    def create_embedding(self, data):
        source_chunks = []
        splitter = CharacterTextSplitter(separator="\n",
                                       chunk_size=512,
                                       chunk_overlap=50)

        for chunk in splitter.split_text(data):
            source_chunks.append(Document(page_content=chunk, metadata={}))

        # Подсчет токенов
        count_token = self.num_tokens_from_string(' '.join([x.page_content for x in source_chunks]))
        self.log += f'Количество токенов в документе: {count_token}\n'

        self.search_index = Chroma.from_documents(source_chunks, OpenAIEmbeddings())
        self.log += f'Данные из документа загружены в векторную базу данных\n'

        return self.search_index

    def num_tokens_from_messages(self, messages, model):
        try:
            encoding = tiktoken.encoding_for_model(model)
        except KeyError:
            self.log += "Предупреждение: модель не создана. Используется cl100k_base кодировка.\n"
            encoding = tiktoken.get_encoding("cl100k_base")

        if "gpt-3.5-turbo" in model:
            tokens_per_message = 3
            tokens_per_name = 1
        else:
            tokens_per_message = 3
            tokens_per_name = 1

        num_tokens = 0
        for message in messages:
            num_tokens += tokens_per_message
            for key, value in message.items():
                num_tokens += len(encoding.encode(value))
                if key == "name":
                    num_tokens += tokens_per_name
        num_tokens += 3
        return num_tokens

    def answer_index(self, question, temp=0.7):
        if not self.search_index:
            self.log += 'Модель необходимо обучить!\n'
            return ''

        docs = self.search_index.similarity_search(question, k=7)
        self.log += 'Выбираем документы по степени схожести с вопросом:\n'

        context = '\n'.join([f'Отрывок документа №{i+1}:\n' + doc.page_content + '\n' for i, doc in enumerate(docs)])
        self.log += f'{context}\n'

        messages = [
            {"role": "system", "content": self.system_prompt + f"\n\nКонтекст:\n{context}"},
            {"role": "user", "content": question}
        ]

        self.log += f"\nТокенов использовано на вопрос: {self.num_tokens_from_messages(messages, self.model)}\n"

        completion = self.client.chat.completions.create(
            model=self.model,
            messages=messages,
            temperature=temp
        )

        self.log += '\nСтатистика по токенам:\n'
        self.log += f'Токенов на вопрос: {completion.usage.prompt_tokens}\n'
        self.log += f'Всего токенов: {completion.usage.total_tokens}\n'

        return completion.choices[0].message.content

# Инициализация GPT
gpt = GPT("gpt-3.5-turbo")

def train():
    try:
        gpt.log = ''  # Очищаем лог перед обучением
        gpt.load_search_indexes()
        return "Модель успешно обучена", ""  # Возвращаем статус и пустой лог
    except Exception as e:
        return f"Ошибка при обучении модели: {str(e)}", ""

def predict(question):
    if not gpt.search_index:
        return "Сначала необходимо обучить модель", "Модель не обучена"
    try:
        gpt.log = ''  # Очищаем лог перед новым предсказанием
        response = gpt.answer_index(question)
        return response, gpt.log
    except Exception as e:
        error_msg = f"Ошибка при получении ответа: {str(e)}"
        return error_msg, error_msg

# Интерфейс Gradio
with gr.Blocks() as demo:
    gr.Markdown("# Виртуальный эндокринолог")

    # Кнопка обучения во всю ширину
    train_btn = gr.Button("Обучить модель", size="lg")
    train_output = gr.Textbox(label="Статус обучения")

    # Поле ввода вопроса
    question = gr.Textbox(label="Ваш вопрос", placeholder="Задайте вопрос по эндокринологии...")

    # Кнопка получения ответа
    submit_btn = gr.Button("Получить ответ")

    # Поле вывода ответа
    answer = gr.Textbox(label="Ответ врача")

    # Поле логирования
    log = gr.Textbox(label="Логирование", lines=5)

    # Обработчики событий
    train_btn.click(train, outputs=[train_output, log])
    submit_btn.click(predict, inputs=question, outputs=[answer, log])

# Запуск приложения
demo.launch()



Paste your key:··········
Running Gradio in a Colab notebook requires sharing enabled. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://1f29147da73b85eac5.gradio.live

This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)


