In [1]:
import os
import sys

main_path = os.getcwd()
sys.path.append(main_path)
print("Main path: ", main_path)

Main path:  /home/billy/mental-llm/llm_chatbot_backend


In [2]:
import huggingface_hub
from datetime import datetime
huggingface_hub.login("")
print(datetime.now())

2024-12-05 17:25:41.170205


In [3]:
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
import re
from log import logger

class MentalLlm():
    def __init__(self, max_length=512, model_name="MentalLlm", **kwags):
        self.max_length = max_length
        self.user_name = "사용자"
        self.device = kwags.get('device', 'cpu')

        # 모델과 토크나이저 로드
        load_model_name = "juhoon01/ko_llama3_model_shinhan_2"
        self.model = AutoModelForCausalLM.from_pretrained(load_model_name, torch_dtype=torch.float32)
        self.tokenizer = AutoTokenizer.from_pretrained(load_model_name)

        logger.info(f"Load {model_name} model complete.")

    def preProcess(self, text: str) -> str:
        """ LLM에 입력하기 전에 전처리를 수행"""
        return text

    def postProcess(self, text: str) -> str:
        """ LLM의 출력을 후처리"""
        text = text.replace("사우", f"{self.user_name}")
        text = re.sub(r'<\|.*?\|>', '', text)
        text = re.sub(r'\|endoftask\|=1>', '', text)

        # Remove text within angle brackets (e.g., <br>, <p>, </li>, etc.)
        text = re.sub(r'<[^<>]*>', '', text)

        # Remove incomplete tags or tokens starting with < or ending with >
        text = re.sub(r'<[^ ]*', '', text)
        text = re.sub(r'[^ ]*>', '', text)

        # Remove special characters that may have been left behind
        text = re.sub(r'[<>]', '', text)
        #remove undefined
        text = re.sub(r'undefined', '', text)

        # Normalize whitespace
        text = re.sub(r'\s+', ' ', text).strip()
        return text


    def remove_repeated_sentences(self, text: str) -> str:
        return text
        """텍스트에서 반복되는 문장을 제거"""
        seen = set()
        result = []
        for sentence in text.split('. '):  # 문장을 '.' 기준으로 나눔
            sentence = sentence.strip()   # 공백 제거
            if sentence not in seen:
                seen.add(sentence)
                result.append(sentence)
        return '. '.join(result)

    def generate_response(self, prompt: str) -> str:
        """ 사용자 입력에 대한 응답 생성 """
        # 프롬프트만 사용
        full_prompt = f"### 질문: {prompt}\n### 답변:"
        inputs = self.tokenizer(full_prompt, return_tensors="pt", truncation=True).to(self.device)

        # 응답 생성
        outputs = self.model.generate(
            inputs.input_ids,
            max_new_tokens=150,  # 더 많은 텍스트를 생성
            temperature=0.7,
            top_p=0.85,
            top_k=50,
            repetition_penalty=2.5,
            no_repeat_ngram_size=3
        )

        # 생성된 텍스트 디코딩 및 후처리
        response = self.tokenizer.decode(outputs[0], skip_special_tokens=True)
        response = response.replace("<|endoftext|>", "").strip()

        # 반복 제거 (필요시)
        response = self.postProcess(self.remove_repeated_sentences(response))

        # 필요 없는 텍스트 제거
        if "### 질문:" in response:
            response = response.split("### 질문:")[-1]  # 마지막 응답만 가져옴

        return response


    def set_max_length(self, max_length):
        self.max_length = max_length

In [4]:
mental_llm = MentalLlm(device='cuda')

Unused kwargs: ['_load_in_4bit', '_load_in_8bit', 'quant_method']. These kwargs are not used in <class 'transformers.utils.quantization_config.BitsAndBytesConfig'>.
`low_cpu_mem_usage` was None, now default to True since model is quantized.


Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]

2024-12-05 17:25:46 - log - INFO - Load MentalLlm model complete.


In [6]:
# 테스트할 프롬프트
prompt = "일어나서 나가기도 힘들고 잠에서 깨고싶지않아요"

# generate_response 메서드를 이용해 모델 응답 생성
response = mental_llm.generate_response(prompt)

# 결과 출력
print(f"Model Response: {response}")

Model Response:  일어나서 나가기도 힘들고 잠에서 깨고싶지않아요 ### 답변: 사용자님은 아침에 일어나는 것이 너무 어렵다고 하시네요. 그래서 출근하기 전까지 계속해서 누워있거나, 늦게나가려고 하는 경우도 있다고 합니다. 사실 우리 몸이 깊은 수면을 취하지 못하면 다음날 피로감과 졸음증상으로 나타납니다.(수명 1~2시간) 이러한 현상을 '불규칙한 주기성'이라고 부르는데요., 이는 밤새도록 자는 것보다 더 많은 시간동안 낮 동안의 활동량이나 식습관 등 생활 패턴 때문에 생기는 것입니다.. 또 다른 원인 중 하나로는 스트레스입니다..스트레쓰를 받으면 신체적인 변화와 함께


In [5]:
prompt = "안녕하세요"
response = mental_llm.generate_response(prompt)
print(f"Model Response: {response}")

Asking to truncate to max_length but no maximum length is provided and the model has no predefined maximum length. Default to no truncation.


2024-12-05 17:27:10 - torch.distributed.nn.jit.instantiator - INFO - Created a temporary directory at /tmp/tmpzbx0wbj8
2024-12-05 17:27:10 - torch.distributed.nn.jit.instantiator - INFO - Writing /tmp/tmpzbx0wbj8/_remote_module_non_scriptable.py


The attention mask is not set and cannot be inferred from input because pad token is same as eos token. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.


Model Response:  안녕하세요 ### 답변: 네, 무엇이 궁금하신가요? #


In [None]:
class MentalLlm(BaseAiModel):
    def __init__(self, max_length=512, model_name="MentalLlm", **kwargs):
        self.max_length = max_length
        self.user_name = kwargs.get("user_name", "사용자")
        self.device = kwargs.get("device", "cpu")

        # 모델과 토크나이저 로드
        load_model_name = "juhoon01/ko_llama3_model_shinhan_4"
        self.model = AutoModelForCausalLM.from_pretrained(load_model_name, torch_dtype=torch.float32)
        self.tokenizer = AutoTokenizer.from_pretrained(load_model_name)

        logger.info(f"Load {model_name} model complete.")

    def set_user_name(self, user_name: str):
        """사용자 이름 설정"""
        self.user_name = user_name

    def preProcess(self, text: str) -> str:
        text = text.strip()
        return text

    def postProcess(self, text: str) -> str:
        text = text.replace("사우", self.user_name)
        return text

    def remove_repeated_sentences(self, text: str) -> str:
        seen = set()
        result = []
        for sentence in text.split(". "):
            sentence = sentence.strip()
            if sentence not in seen:
                seen.add(sentence)
                result.append(sentence)
        return ". ".join(result)

    def summarize_response(self, text: str, max_sentences: int = 3) -> str:
        sentences = text.split(". ")
        return ". ".join(sentences[:max_sentences]) + ("..." if len(sentences) > max_sentences else "")

    def generate_one_shot_prompt(self, example_question: str, example_answer: str, new_question: str) -> str:
        prompt = f"""
        ### 질문:
        {example_question}
        ### 답변:
        {example_answer}

        위의 예제와 유사한 방식으로, 주어진 질문에 대해 적절한 답변을 작성하십시오.
        ### 질문:
        {new_question}
        ### 답변:
        """
        return prompt

    def generate_response(self, prompt: str, one_shot: bool = False, example_question: str = None, example_answer: str = None) -> str:
        if one_shot and example_question and example_answer:
            full_prompt = self.generate_one_shot_prompt(example_question, example_answer, prompt)
        else:
            full_prompt = f"""
                제공된 데이터는 {prompt}에 대한 질문과 답변을 포함한다. 
                사용자 증상을 분석하고, 의사 진단, 진단 근거, 해결책을 제시하라.
                의사 진단은 간결하게 작성하며, 진단 근거는 진단의 근거가 되는 증거를 제시하고, 해결책은 적절한 조치를 제시해야 한다.
                의사 진단, 진단 근거, 해결책은 각각 줄내림(\n)으로 구분하여라.
            """

        inputs = self.tokenizer(full_prompt, return_tensors="pt", truncation=True).to(self.device)

        outputs = self.model.generate(
            inputs.input_ids,
            max_new_tokens=150,
            temperature=0.7,
            top_p=0.85,
            top_k=50,
            repetition_penalty=2.5,
            no_repeat_ngram_size=3
        )

        response = self.tokenizer.decode(outputs[0], skip_special_tokens=True)
        response = response.replace("<|endoftext|>", "").strip()

        response = self.postProcess(self.remove_repeated_sentences(response))
        if "### 질문:" in response:
            response = response.split("### 질문:")[-1]

        response = self.summarize_response(response)

        return response


In [8]:
# MentalLlm 객체 생성
mental_llm = MentalLlm(device="cuda")

# 예제 질문과 답변
example_question = "요즘 회사에서 일이 많아 스트레스를 받고 있습니다. 잠도 잘 못 자고 몸 상태가 좋지 않습니다."
example_answer = (
    "사용자님은 현재 회사에서 스트레스를 받고 계시다고 말씀하셨습니다. 매일 늦게까지 일하다가도 머리에서 일이 떠나지 않아 잠을 제대로 못 주무시고, "
    "몸 상태도 악화되셨다고 하셨습니다. 이런 경우에는 일을 우선순위로 나누고 휴식 시간을 확보하는 것이 중요합니다. 명상, 운동, 여가 생활 등으로 스트레스를 해소해보세요."
)

# 새로운 질문
new_question = "매일 밤 야근 때문에 수면 시간이 부족하고 피곤합니다. 어떻게 해야 할까요?"

# 원샷 프롬프팅을 활용한 응답 생성
response = mental_llm.generate_response(
    prompt=new_question,
    one_shot=True,
    example_question=example_question,
    example_answer=example_answer
)

# 결과 출력
print(f"Model Response: {response}")


TypeError: MentalLlm.generate_response() got an unexpected keyword argument 'one_shot'