In [1]:
from transformers import AutoModel, AutoTokenizer, BitsAndBytesConfig
import torch
from peft import  PeftModelForCausalLM
from datasets import load_from_disk

In [2]:
quantization_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type='nf4',
    bnb_4bit_compute_dtype=torch.float32
)

In [3]:
base_model = AutoModel.from_pretrained('THUDM/chatglm2-6b', trust_remote_code=True, device_map='auto', quantization_config=quantization_config)

A new version of the following files was downloaded from https://huggingface.co/THUDM/chatglm2-6b:
- configuration_chatglm.py
. Make sure to double-check they do not contain any added malicious code. To avoid downloading new versions of the code file, you can pin a revision.
Downloading (…)/modeling_chatglm.py: 100%|██████████| 50.7k/50.7k [00:00<00:00, 319kB/s]
A new version of the following files was downloaded from https://huggingface.co/THUDM/chatglm2-6b:
- quantization.py
. Make sure to double-check they do not contain any added malicious code. To avoid downloading new versions of the code file, you can pin a revision.
A new version of the following files was downloaded from https://huggingface.co/THUDM/chatglm2-6b:
- modeling_chatglm.py
- quantization.py
. Make sure to double-check they do not contain any added malicious code. To avoid downloading new versions of the code file, you can pin a revision.
Downloading shards: 100%|██████████| 7/7 [00:03<00:00,  1.85it/s]
The model wei

In [4]:
base_model

ChatGLMForConditionalGeneration(
  (transformer): ChatGLMModel(
    (embedding): Embedding(
      (word_embeddings): Embedding(65024, 4096)
    )
    (rotary_pos_emb): RotaryEmbedding()
    (encoder): GLMTransformer(
      (layers): ModuleList(
        (0-27): 28 x GLMBlock(
          (input_layernorm): RMSNorm()
          (self_attention): SelfAttention(
            (query_key_value): Linear4bit(in_features=4096, out_features=4608, bias=True)
            (core_attention): CoreAttention(
              (attention_dropout): Dropout(p=0.0, inplace=False)
            )
            (dense): Linear4bit(in_features=4096, out_features=4096, bias=False)
          )
          (post_attention_layernorm): RMSNorm()
          (mlp): MLP(
            (dense_h_to_4h): Linear4bit(in_features=4096, out_features=27392, bias=False)
            (dense_4h_to_h): Linear4bit(in_features=13696, out_features=4096, bias=False)
          )
        )
      )
      (final_layernorm): RMSNorm()
    )
    (output_la

In [5]:
tokenizer = AutoTokenizer.from_pretrained('THUDM/chatglm2-6b', trust_remote_code=True)

Downloading (…)enization_chatglm.py: 100%|██████████| 10.0k/10.0k [00:00<00:00, 40.3MB/s]
A new version of the following files was downloaded from https://huggingface.co/THUDM/chatglm2-6b:
- tokenization_chatglm.py
. Make sure to double-check they do not contain any added malicious code. To avoid downloading new versions of the code file, you can pin a revision.


In [6]:
base_model.eval()

ChatGLMForConditionalGeneration(
  (transformer): ChatGLMModel(
    (embedding): Embedding(
      (word_embeddings): Embedding(65024, 4096)
    )
    (rotary_pos_emb): RotaryEmbedding()
    (encoder): GLMTransformer(
      (layers): ModuleList(
        (0-27): 28 x GLMBlock(
          (input_layernorm): RMSNorm()
          (self_attention): SelfAttention(
            (query_key_value): Linear4bit(in_features=4096, out_features=4608, bias=True)
            (core_attention): CoreAttention(
              (attention_dropout): Dropout(p=0.0, inplace=False)
            )
            (dense): Linear4bit(in_features=4096, out_features=4096, bias=False)
          )
          (post_attention_layernorm): RMSNorm()
          (mlp): MLP(
            (dense_h_to_4h): Linear4bit(in_features=4096, out_features=27392, bias=False)
            (dense_4h_to_h): Linear4bit(in_features=13696, out_features=4096, bias=False)
          )
        )
      )
      (final_layernorm): RMSNorm()
    )
    (output_la

In [13]:
datasets = load_from_disk(dataset_path='data/Med_datasets.jsonl')

# quantize model and no lora

## generally QA 

In [6]:
response, history = base_model.chat(tokenizer, '输出一份黄山旅游的计划', history=[])

In [7]:
response

'以下是一份黄山旅游计划:\n\n第一天:\n到达黄山市,住宿在黄山市区。可以先游览黄山市政府广场和黄山市博物馆,了解黄山市的旅游文化和历史。\n\n第二天:\n前往黄山市区的黄山风景区,乘坐缆车上山。可以游览西海大峡谷、天都峰等著名景点,欣赏美丽的山景。建议早上早早起床,因为黄山的日出非常美丽。\n\n第三天:\n前往黄山市区的黄山市博物馆,了解黄山市的生态环境和旅游发展情况。下午前往黄山市区的黄山风景区,游览黄山谷、光明顶等景点。可以乘坐缆车前往光明顶,欣赏山顶的景色。\n\n第四天:\n前往黄山市的徽州区,游览徽州古城、潜口民宅等景点。可以品尝当地的美食和徽州的特色茶。\n\n第五天:\n前往黄山市的黄山区,游览黄山区的景点,如齐云山、黄山区古镇等。\n\n第六天:\n在黄山市区游览,可以参观黄山市博物馆、安徽省博物馆等文化景点。\n\n第七天:\n乘坐高铁离开黄山市,返回原地。\n\n以上是一份黄山旅游计划,可以根据自己的时间和需求进行适当的调整。希望这份计划能有所帮助!'

In [8]:
response, history = base_model.chat(tokenizer, '大众汽车怎么样?', history=[])

In [9]:
response

'作为一家全球知名的汽车制造商,大众汽车在汽车制造技术、汽车安全性、可靠性以及汽车性能等方面都有着较高的声誉。大众汽车集团旗下拥有众多品牌,包括大众、斯柯达、西雅特、保时捷等,涵盖了轿车、SUV、MPV、新能源汽车、卡车等多个细分市场。\n\n近年来,大众汽车在电动汽车领域取得了较大的进展,推出了许多电动车型,如ID.4 crossover、E-Golf等,并计划在未来推出更多电动汽车。此外,大众汽车也在自动驾驶技术、车联网等方面进行投入和研发。\n\n当然,每个消费者对于汽车的需求和口味都不同,具体是否适合购买大众汽车还需要根据自己的实际需求和考虑做出判断。'

In [10]:
response, history = base_model.chat(tokenizer, '下雨天骑电瓶车有哪些需要注意的问题?', history=[])

In [12]:
response

'下雨天骑电瓶车需要注意以下问题:\n\n1. 防水:雨天骑电瓶车,需要做好防水处理,可以考虑在电机、车把、座垫等部位加防水罩,避免电机受潮、电路板受潮等问题。\n\n2. 防滑:雨天路面湿滑,需要加挂防滑链或者请有经验的骑手驾驶,以免滑行造成危险。\n\n3. 减速慢行:雨天路面湿滑,摩擦力减小,需要减速慢行,以免发生滑倒等意外事故。\n\n4. 避免涉水:遇到雨势较大的时候,需要避免电瓶车涉水,以免造成电机、电路等的损坏。\n\n5. 及时充电:在雨天行驶中,需要时刻关注电瓶电量,及时充电,以免因电量不足导致电动车无法行驶。\n\n6. 注意安全:雨天行驶中,需要时刻注意周围的环境,尤其是路况和交通情况,确保自己的安全。'

## Med QA

In [14]:
datasets['train'][1]

{'context': '指令：下面是一个医学领域的问题，请根据你对医学领域的了解，严谨细致的回答，如果不清楚就回答不清楚，不许胡编乱造。\n问题：患者孕14周，主诉右上腹部疼痛，伴随恶心、呕吐，BP 160/110 mmHg，体检腹肌紧张，有肝区压痛。请问可能患有什么疾病？\n回答: ',
 'target': '患者可能患有妊娠期高血压疾病引起的妊娠期肝血肿及破裂，需要进行B超检查、实验室检查等辅助检查，对症给予肝素、冻干人血浆等治疗方案。'}

In [23]:
query1 = datasets['train'][1]['context']

In [24]:
target1 = datasets['train'][1]['target']

In [25]:
query1

'指令：下面是一个医学领域的问题，请根据你对医学领域的了解，严谨细致的回答，如果不清楚就回答不清楚，不许胡编乱造。\n问题：患者孕14周，主诉右上腹部疼痛，伴随恶心、呕吐，BP 160/110 mmHg，体检腹肌紧张，有肝区压痛。请问可能患有什么疾病？\n回答: '

In [26]:
target1

'患者可能患有妊娠期高血压疾病引起的妊娠期肝血肿及破裂，需要进行B超检查、实验室检查等辅助检查，对症给予肝素、冻干人血浆等治疗方案。'

In [27]:
response1, history = base_model.chat(tokenizer, query=query1, history=[])

In [28]:
response1

'根据病史和体检结果,患者可能患有妊娠期高血压疾病( pre-eclampsia,PE )。\n\nPE是一种妊娠并发症,其特征是高血压、蛋白尿和水肿,通常在怀孕20周后发生,但在孕24-28周达到高峰。患者的血压升高和肝区压痛也支持这一诊断。恶心、呕吐等症状可能与高血压引起的消化系统问题有关。\n\n其他可能的疾病包括肝疾病、胆囊炎、胃炎等,但这些疾病通常不会伴随妊娠期高血压的典型症状,因此可以排除。建议患者尽快到医院就诊,接受进一步的检查和治疗,包括 blood pressure monitoring, urine analysis, and imaging tests if necessary.'

In [29]:
datasets['valid'][1]

{'context': '指令：下面是一个医学领域的问题，请根据你对医学领域的了解，严谨细致的回答，如果不清楚就回答不清楚，不许胡编乱造。\n问题：小孙，男性，23岁，肌肤油腻，面部出现多处粉刺，想要彻底改善肤质，该怎么处理？\n回答: ',
 'target': '建议小孙注意面部皮肤的清洁卫生，睡前洗面，避免长时间接触手机和电脑，减少紫外线暴晒。同时，可采用多西环素、金霉素等口服抗生素消炎，也可以使用物理治疗方法，如光子嫩肤、超声刀、微针等，帮助去除粉刺并调整肌肤的水油平衡。'}

In [30]:
query2 = datasets['valid'][1]['context']

In [31]:
target2 = datasets['valid'][1]['target']

In [32]:
query2

'指令：下面是一个医学领域的问题，请根据你对医学领域的了解，严谨细致的回答，如果不清楚就回答不清楚，不许胡编乱造。\n问题：小孙，男性，23岁，肌肤油腻，面部出现多处粉刺，想要彻底改善肤质，该怎么处理？\n回答: '

In [33]:
target2

'建议小孙注意面部皮肤的清洁卫生，睡前洗面，避免长时间接触手机和电脑，减少紫外线暴晒。同时，可采用多西环素、金霉素等口服抗生素消炎，也可以使用物理治疗方法，如光子嫩肤、超声刀、微针等，帮助去除粉刺并调整肌肤的水油平衡。'

In [34]:
response2, history = base_model.chat(tokenizer, query=query2, history=[])

In [35]:
response2

'根据小孙的描述，他可能患有痤疮，这是一种常见的皮肤疾病，通常在青春期时发生，但也可能在成年时期出现。痤疮的发生与皮肤油脂分泌过多、阻塞毛孔、细菌感染等因素有关。\n\n以下是一些可能有助于改善小孙肤质的方法:\n\n1. 温和清洁：小孙应该每天用温和的洁面产品轻轻地清洗面部，以减少皮肤油脂和污垢的积累。\n\n2. 保持皮肤清洁：使用温和的保湿产品，保持皮肤干燥，这有助于减少皮肤油脂的分泌。\n\n3. 避免摸脸：避免经常触摸面部，因为手指上的细菌可能会传到脸上，引起痤疮。\n\n4. 饮食健康：小孙应该避免摄入高糖、高脂肪、高盐、高咖啡因等不健康的食物，多摄取富含维生素和蛋白质的食物，如水果、蔬菜、鱼类等。\n\n5. 注意休息：保持良好的作息时间，避免过度疲劳，有利于改善皮肤状况。\n\n6. 使用外用药物：根据医生的建议，小孙可以考虑使用外用药物，如含有水杨酸、苯甲酸等成分的外用药物，有助于缓解痤疮的症状。\n\n请注意，以上回答仅供参考，如果小孙的病情较为严重，建议尽快就医，寻求专业医生的帮助。'

# quantize model and lora adapter 

## Med QA 

In [36]:
lora_model = PeftModelForCausalLM.from_pretrained(base_model, 'Lora_Adapter_THUDM_chatglm2-6b/finally_adapter/LoraAdapter')

In [37]:
lora_model

PeftModelForCausalLM(
  (base_model): LoraModel(
    (model): ChatGLMForConditionalGeneration(
      (transformer): ChatGLMModel(
        (embedding): Embedding(
          (word_embeddings): Embedding(65024, 4096)
        )
        (rotary_pos_emb): RotaryEmbedding()
        (encoder): GLMTransformer(
          (layers): ModuleList(
            (0-27): 28 x GLMBlock(
              (input_layernorm): RMSNorm()
              (self_attention): SelfAttention(
                (query_key_value): Linear4bit(
                  in_features=4096, out_features=4608, bias=True
                  (lora_dropout): ModuleDict(
                    (default): Dropout(p=0.05, inplace=False)
                  )
                  (lora_A): ModuleDict(
                    (default): Linear(in_features=4096, out_features=12, bias=False)
                  )
                  (lora_B): ModuleDict(
                    (default): Linear(in_features=12, out_features=4608, bias=False)
                  )
          

In [38]:
lora_model.peft_config

{'default': LoraConfig(peft_type='LORA', base_model_name_or_path='THUDM/chatglm2-6b', revision=None, task_type='CAUSAL_LM', inference_mode=True, r=12, target_modules=['query_key_value'], lora_alpha=24, lora_dropout=0.05, fan_in_fan_out=False, bias='none', modules_to_save=None, init_lora_weights=True, layers_to_transform=None, layers_pattern=None)}

In [39]:
response1_q, history = lora_model.chat(tokenizer, query=query1, history=[])

In [40]:
target1

'患者可能患有妊娠期高血压疾病引起的妊娠期肝血肿及破裂，需要进行B超检查、实验室检查等辅助检查，对症给予肝素、冻干人血浆等治疗方案。'

In [41]:
response1_q

'该患者可能患有妊娠期肝内胆管炎，建议进行超声检查、B超检查和CT检查等辅助检查，同时需要及时就医，进行治疗和护理。'

In [45]:
response1

'根据病史和体检结果,患者可能患有妊娠期高血压疾病( pre-eclampsia,PE )。\n\nPE是一种妊娠并发症,其特征是高血压、蛋白尿和水肿,通常在怀孕20周后发生,但在孕24-28周达到高峰。患者的血压升高和肝区压痛也支持这一诊断。恶心、呕吐等症状可能与高血压引起的消化系统问题有关。\n\n其他可能的疾病包括肝疾病、胆囊炎、胃炎等,但这些疾病通常不会伴随妊娠期高血压的典型症状,因此可以排除。建议患者尽快到医院就诊,接受进一步的检查和治疗,包括 blood pressure monitoring, urine analysis, and imaging tests if necessary.'

In [42]:
response2_q, history = lora_model.chat(tokenizer, query=query2, history=[])

In [43]:
target2

'建议小孙注意面部皮肤的清洁卫生，睡前洗面，避免长时间接触手机和电脑，减少紫外线暴晒。同时，可采用多西环素、金霉素等口服抗生素消炎，也可以使用物理治疗方法，如光子嫩肤、超声刀、微针等，帮助去除粉刺并调整肌肤的水油平衡。'

In [44]:
response2_q

'建议小孙到皮肤科就诊，医生会根据病情进行相应的检查和治疗，同时建议注意皮肤卫生，避免过度清洁，避免使用刺激性化妆品等。'

In [46]:
response2

'根据小孙的描述，他可能患有痤疮，这是一种常见的皮肤疾病，通常在青春期时发生，但也可能在成年时期出现。痤疮的发生与皮肤油脂分泌过多、阻塞毛孔、细菌感染等因素有关。\n\n以下是一些可能有助于改善小孙肤质的方法:\n\n1. 温和清洁：小孙应该每天用温和的洁面产品轻轻地清洗面部，以减少皮肤油脂和污垢的积累。\n\n2. 保持皮肤清洁：使用温和的保湿产品，保持皮肤干燥，这有助于减少皮肤油脂的分泌。\n\n3. 避免摸脸：避免经常触摸面部，因为手指上的细菌可能会传到脸上，引起痤疮。\n\n4. 饮食健康：小孙应该避免摄入高糖、高脂肪、高盐、高咖啡因等不健康的食物，多摄取富含维生素和蛋白质的食物，如水果、蔬菜、鱼类等。\n\n5. 注意休息：保持良好的作息时间，避免过度疲劳，有利于改善皮肤状况。\n\n6. 使用外用药物：根据医生的建议，小孙可以考虑使用外用药物，如含有水杨酸、苯甲酸等成分的外用药物，有助于缓解痤疮的症状。\n\n请注意，以上回答仅供参考，如果小孙的病情较为严重，建议尽快就医，寻求专业医生的帮助。'

## generally QA 

In [48]:
response, history = lora_model.chat(tokenizer, '输出一份黄山旅游的计划', history=[])

In [49]:
response

'以下是一份黄山旅游计划:\n\n第一天:\n1. 黄山风景区出发,乘坐缆车上山。\n2. 到达山顶,欣赏壮丽的山景。\n3. 参观黄山的地质博物馆,了解黄山的地质背景和自然形成过程。\n4. 在山上午餐,品尝当地的美食。\n5. 前往光明顶,欣赏黄山著名的阳光房和云海。\n6. 在光明顶拍照留念,等待下午的行程。\n\n第二天:\n1. 前往黄山的始信峰,欣赏山间美景。\n2. 参观始信峰的黄山风景区博物馆,了解黄山的景区历史和文化。\n3. 在始信峰午餐,品尝当地美食。\n4. 前往黄山的卧佛峰,欣赏山间美景。\n5. 在卧佛峰午餐,品尝当地美食。\n6. 前往黄山的始新峰,欣赏山间美景。\n7. 在始新峰午餐,品尝当地美食。\n8. 返回黄山的酒店,结束愉快的黄山之旅。\n\n以上是一份黄山旅游计划,希望能够帮助到您。'

In [53]:
response, history = lora_model.chat(tokenizer, '大众汽车怎么样?', history=[])

In [54]:
response

'作为一家德国汽车制造商,大众汽车在全球范围内享有广泛的品牌知名度和销售网络,是一家规模庞大、经验丰富的汽车制造商。\n\n近年来,大众汽车在电动汽车和自动驾驶技术方面取得了重要进展,并加大了在电动汽车市场的投入。此外,大众汽车也致力于改善环境性能,并采取了一系列措施,如开发更环保的发动机和车辆,以及推广可持续驾驶等。\n\n当然,每个消费者对于汽车的需求和口味都不同,因此,对于大众汽车是否适合你,你需要根据自己的具体需求和喜好进行评估。'

In [55]:
response, history = lora_model.chat(tokenizer, '下雨天骑电瓶车有哪些需要注意的问题?', history=[])

In [56]:
response

'下雨天骑电瓶车需要注意以下问题:\n\n1. 防水:电瓶车淋雨后可能会漏电,需要确保车辆和骑行者的安全。可以考虑购买带有防水功能的电瓶车。\n\n2. 防滑:雨天路滑,需要采取防滑措施,如加防滑链或轮子加宽等。\n\n3. 避免行驶在积水中:不要在积水中行驶,以免车辆被泡坏。\n\n4. 提高可见度:穿戴雨衣或雨披等雨具,提高行车可见度。\n\n5. 注意电瓶防水:可以考虑在电瓶上涂抹防水剂,以保护电瓶不受雨水侵蚀。 \n\n6. 注意充电安全:不要在雨天露天充电,应选择安全的地方进行充电。\n\n7. 注意骑行安全:在雨天骑行时,要减速慢行,注意避开障碍物和危险路段。'

# Note
- After instructions-tuning, we have observed that the outputs of the model indeed underwent certain changes
- For medical dialogues, prior to fine-tuning, the model's outputs tended to be lengthy. However, post fine-tuning, the model's outputs became more concise, aligning closely with the length of our dataset. Considering the sampling strategy employed during model output, although the outputs may not be entirely identical to the data in the dataset in terms of content, a careful analysis reveals that the outputs do align reasonably well with the data in the dataset. This indicates the effectiveness of our fine-tuning process.
- For general conversations, we have discovered that after meticulous instruction fine-tuning, the model did not exhibit severe catastrophic forgetting. It is still capable of providing decent answers to general questions. However, the length of the output content is shorter and more concise compared to the pre-fine-tuning stage. This indicates that our fine-tuning process indeed aligns the model's output more closely with the length of the data in the dataset.
- Given our training parameters, although we set the rank of our Lora parameter matrix to 12, which is generally a relatively large value, we have reduced the alpha parameter. The alpha parameter is used to scale the values computed from the Lora matrix. Typically, the alpha parameter is four times the rank, indicating that the computed Lora results are multiplied by four and added to the results of the original parameter matrix. In our case, we have set the alpha parameter to 24, so we are only amplifying the computed Lora results by a factor of two. Further adjustments to the parameters may help align the model's output with the data used for training.
- We will now modify the temperature parameter used in the output sampling process to achieve a more consistent output result. This adjustment is intended to observe and assess any potential impact it may have on the results.

In [None]:
response1_q_p, history = lora_model.chat(tokenizer, query=query1, history=[], temperature=0.5)

In [61]:
query1

'指令：下面是一个医学领域的问题，请根据你对医学领域的了解，严谨细致的回答，如果不清楚就回答不清楚，不许胡编乱造。\n问题：患者孕14周，主诉右上腹部疼痛，伴随恶心、呕吐，BP 160/110 mmHg，体检腹肌紧张，有肝区压痛。请问可能患有什么疾病？\n回答: '

In [58]:
response1_q_p

'可能患有妊娠期肝内胆汁淤积症，需要进行超声检查、B超检查、肝功能检查等辅助检查，同时进行治疗，如口服胆酸钠、硫酸镁等药物，以及进行手术治疗。'

In [59]:
target1

'患者可能患有妊娠期高血压疾病引起的妊娠期肝血肿及破裂，需要进行B超检查、实验室检查等辅助检查，对症给予肝素、冻干人血浆等治疗方案。'

In [60]:
response1_q

'该患者可能患有妊娠期肝内胆管炎，建议进行超声检查、B超检查和CT检查等辅助检查，同时需要及时就医，进行治疗和护理。'

In [67]:
response2_q_p, history = lora_model.chat(tokenizer, query=query2, history=[], temperature=0.1)

In [64]:
target2

'建议小孙注意面部皮肤的清洁卫生，睡前洗面，避免长时间接触手机和电脑，减少紫外线暴晒。同时，可采用多西环素、金霉素等口服抗生素消炎，也可以使用物理治疗方法，如光子嫩肤、超声刀、微针等，帮助去除粉刺并调整肌肤的水油平衡。'

In [68]:
response2_q_p

'建议小孙到皮肤科就诊，医生会根据病情进行诊断，并给出相应的治疗方案。同时，小孙也需要注意饮食、生活作息等生活习惯，避免过度油腻、熬夜等不良习惯。'

In [66]:
response2_q

'建议小孙到皮肤科就诊，医生会根据病情进行相应的检查和治疗，同时建议注意皮肤卫生，避免过度清洁，避免使用刺激性化妆品等。'

## temperature
- After reducing the temperature parameter, there was no significant impact on the output results. However, for the first question, there was a vague sense that the alignment with the training data seemed to have improved to some extent.