# 模型推理 - 使用 QLoRA 微调后的 ChatGLM-6B

In [1]:
import torch
from transformers import AutoModel, AutoTokenizer, BitsAndBytesConfig

# 模型ID或本地路径
model_name_or_path = '/data/chatglm3-6b'



In [2]:
_compute_dtype_map = {
    'fp32': torch.float32,
    'fp16': torch.float16,
    'bf16': torch.bfloat16
}

# QLoRA 量化配置
q_config = BitsAndBytesConfig(load_in_4bit=True,
                              bnb_4bit_quant_type='nf4',
                              bnb_4bit_use_double_quant=True,
                              bnb_4bit_compute_dtype=_compute_dtype_map['bf16'])

# 加载量化后模型(与微调的 revision 保持一致）
base_model = AutoModel.from_pretrained(model_name_or_path,
                                      quantization_config=q_config,
                                      device_map='auto',
                                      trust_remote_code=True,
                                      revision='b098244')

Loading checkpoint shards:   0%|          | 0/7 [00:00<?, ?it/s]

In [3]:
base_model.requires_grad_(False)
base_model.eval()

ChatGLMForConditionalGeneration(
  (transformer): ChatGLMModel(
    (embedding): Embedding(
      (word_embeddings): Embedding(65024, 4096)
    )
    (rotary_pos_emb): RotaryEmbedding()
    (encoder): GLMTransformer(
      (layers): ModuleList(
        (0-27): 28 x GLMBlock(
          (input_layernorm): RMSNorm()
          (self_attention): SelfAttention(
            (query_key_value): Linear4bit(in_features=4096, out_features=4608, bias=True)
            (core_attention): CoreAttention(
              (attention_dropout): Dropout(p=0.0, inplace=False)
            )
            (dense): Linear4bit(in_features=4096, out_features=4096, bias=False)
          )
          (post_attention_layernorm): RMSNorm()
          (mlp): MLP(
            (dense_h_to_4h): Linear4bit(in_features=4096, out_features=27392, bias=False)
            (dense_4h_to_h): Linear4bit(in_features=13696, out_features=4096, bias=False)
          )
        )
      )
      (final_layernorm): RMSNorm()
    )
    (output_la

In [4]:
tokenizer = AutoTokenizer.from_pretrained(model_name_or_path,
                                          trust_remote_code=True,
                                          revision='b098244')

Setting eos_token is not supported, use the default one.
Setting pad_token is not supported, use the default one.
Setting unk_token is not supported, use the default one.


## 使用原始 ChatGLM3-6B 模型

In [5]:
input_text = "解释下乾卦是什么？"

In [6]:
response, history = base_model.chat(tokenizer, query=input_text)

In [7]:
print(response)

乾卦是八卦之一，也是八宫图之一，其卦象是由三个阳爻夹一个阴爻构成，象征着天、云、雷等自然现象，也代表着刚强、积极、行动力等象征。乾卦的含义包括：力量、刚强、积极、行动、领导、刚正不阿、坚定等。在八卦中，乾卦具有最高的位置，代表着天地、刚强、行动和领导等特性。在五行中，乾卦代表金，与肺、皮肤、骨骼等有关。在中医中，乾卦与手太阴肺经有关，与呼吸、气机、声音等有关。


#### 询问一个64卦相关问题（应该不在 ChatGLM3-6B 预训练数据中）

In [8]:
response, history = base_model.chat(tokenizer, query="周易中的讼卦是什么？", history=history)
print(response)

讼卦是八卦之一，也是八宫图之一，其卦象是由两个阴爻夹一个阳爻构成，象征着水、 cloud、雨等自然现象，也代表着诉讼、争端、困扰等象征。讼卦的含义包括：困扰、争端、诉讼、诉讼程序、公正、法律、规则等。在八卦中，讼卦具有较低的位置，代表着困扰、争端、诉讼等特性。在五行中，讼卦代表水，与肾脏、膀胱、耳等有关。在中医中，讼卦与足少阴肾经有关，与排泄、水液、耳等有关。


## 使用微调后的 ChatGLM3-6B

### 加载 QLoRA Adapter(Epoch=3, automade-dataset(fixed)) - 请根据训练时间戳修改 timestamp 

In [10]:
from peft import PeftModel, PeftConfig

epochs = 3
timestamp = "20240407_013445"

peft_model_path = f"models/{model_name_or_path}-epoch{epochs}-{timestamp}"

config = PeftConfig.from_pretrained(peft_model_path)
qlora_model = PeftModel.from_pretrained(base_model, peft_model_path)
training_tag=f"ChatGLM3-6B(Epoch=3, automade-dataset(fixed))-{timestamp}"

In [11]:
def compare_chatglm_results(query, base_model, qlora_model, training_tag):
    base_response, base_history = base_model.chat(tokenizer, query)

    inputs = tokenizer(query, return_tensors="pt").to(0)
    ft_out = qlora_model.generate(**inputs, max_new_tokens=512)
    ft_response = tokenizer.decode(ft_out[0], skip_special_tokens=True)
    
    print(f"问题：{query}\n\n原始输出：\n{base_response}\n\n\n微调后（{training_tag}）：\n{ft_response}")
    return base_response, ft_response

### 微调前后效果对比

In [12]:
base_response, ft_response = compare_chatglm_results("解释下乾卦是什么？", base_model, qlora_model, training_tag)

问题：解释下乾卦是什么？

原始输出：
在周易中，乾卦是六十四卦之首，由六个阳爻组成，象征着天。它所代表的是刚健、健行、刚健不屈的意境。乾卦的核心哲学是：天道刚健，运行不已，君子观此卦象，从而以天为法，自强不息。

乾卦象征天，为大通而至正。得此卦者，名利双收，应把握机会，争取成果。然而，切勿过于骄傲自满，而应保持谦逊、冷静和警惕。在事业、经商、求名等方面，乾卦皆暗示着大吉大利，但也警示着必须坚持正道、修养德行，方能永远亨通。

在婚恋方面，乾卦提示着阳盛阴衰，但也强调刚柔相济，相互补足，形成美满的结果。在决策方面，则是强调刚健、正直、公允，自强不息的实质，需要修养德行、坚定信念，方能克服困难，消除灾难。


微调后（ChatGLM3-6B(Epoch=3, automade-dataset(fixed))-20240407_013445）：
[gMASK] sop 解释下乾卦是什么？ 在周易中，乾卦是六十四卦之首，由六个阳爻组成，象征着天。它所代表的是刚健、健行、刚健不屈的意境。乾卦的核心哲学是：天道刚健，运行不已，君子观此卦象，从而以天为法，自强不息。

乾卦象征天，为大通而至正。得此卦者，名利双收，应把握机会，争取成果。然而，切勿过于骄傲自满，而应保持谦逊、冷静和警惕。在事业、经商、求名等方面，乾卦皆暗示着大吉大利，但也警示着必须坚持正道、修养德行，方能永远亨通。

在婚恋方面，乾卦提示着阳盛阴衰，但也强调刚柔相济，相互补足，形成美满的结果。在决策方面，则是强调刚健、正直、公允，自强不息的实质，需要修养德行、坚定信念，方能克服困难，消除灾难。


In [13]:
base_response, ft_response = compare_chatglm_results("周易中的讼卦是什么", base_model, qlora_model, training_tag)

问题：周易中的讼卦是什么

原始输出：
在周易中，讼卦是一个充满警示的卦象。它由上卦乾（天）和下卦坎（水）组成，代表着天与水背道而驰，形成争讼的局面。虽然事情开始时有利可图，但必须警惕戒惧，因为中间虽然吉利，但最终会带来凶险。对于涉及大川，涉水渡河的行动不利。因此，君子观此卦象，应当慎之又慎，杜绝争讼之事，并在谋事之初谨慎行事。讼卦的核心哲学是要避免争讼，退而让人，求得化解，安于正理，方可避免意外之灾。在事业上，务必避免介入诉讼纠纷的争执之中，与其这样，不如退而让人。即使最终获胜，也难免得失不均。经商方面，要坚持公正、公平、互利的原则，避免冲突，这样会有好结果。而对于求名、婚恋和决策，也都需要慎重行事，避免盲目追求，退让让人，可助事业、婚姻和决策的发展。


微调后（ChatGLM3-6B(Epoch=3, automade-dataset(fixed))-20240407_013445）：
[gMASK] sop 周易中的讼卦是什么卦象，它是由上卦乾（天）和下卦坎（水）相叠而成。在这个卦象中，预示着 conflict and strife will arise from a dispute between the two parties. However, the outcome will not be favorable for either side, as the upper卦象征天，而天是高远无垠的，无法约束，下卦坎则象征水，代表着灵活和变化。因此, thetan（天变）卦的解释是，天变是指天地间发生的巨大变化，它意味着无法预料和控制的事件。

在事业方面，预示着从事一项事业将面临巨大的困难和挫折，需要耐心和坚持，务必以德服人，方能成功。在经商方面，提示经商需要注意协作和沟通，避免冲突和 disputes。在婚恋方面，预示着爱情顺利，但需要谨慎处理。在决策方面，提示需要作出正确的选择，但务必以德服人，避免冲突和争议。

总体而言，tan卦提示需要耐心和坚持，擅长沟通和合作，方能取得成功。


In [14]:
base_response, ft_response = compare_chatglm_results("师卦是什么？", base_model, qlora_model, training_tag)

问题：师卦是什么？

原始输出：
在周易中，师卦是一个由坎卦（水）和坤卦（地）相叠而成的异卦。这一卦象代表着军队的力量和军情的总指挥，预示着吉祥无灾。象辞中描述了地中有水的情景，寓意着君子应当像大地一样容纳和畜养大众。师卦的解释强调选择德高望重的长者来统率军队，才能获得吉祥无咎。另外，师卦也象征着困难重重，需要包容别人、艰苦努力，及时行事，严于律已。在事业、经商、求名、婚恋等方面的决策中，都需要警惕潜在敌人，小心谨慎，合作与决断兼顾，方能成功。


微调后（ChatGLM3-6B(Epoch=3, automade-dataset(fixed))-20240407_013445）：
[gMASK] sop 师卦是什么？ 在周易中，师卦是一个由坎卦（水）和坤卦（地）相叠而成的异卦。这一卦象代表着军队的力量和军情的总指挥，预示着吉祥无灾。象辞中描述了地中有水的情景，寓意着君子应当像大地一样容纳和畜养大众。师卦的解释强调选择德高望重的长者来统率军队，才能获得吉祥无咎。另外，师卦也象征着困难重重，需要包容别人、艰苦努力，及时行事，严于律已。在事业、经商、求名、婚恋等方面的决策中，都需要警惕潜在敌人，小心谨慎，合作与决断兼顾，方能成功。


## 其他模型（错误数据或训练参数）

#### 加载 QLoRA Adapter(Epoch=3, automade-dataset)

In [15]:
from peft import PeftModel, PeftConfig

epochs = 3
peft_model_path = f"models/{model_name_or_path}-epoch{epochs}"

config = PeftConfig.from_pretrained(peft_model_path)
qlora_model_e3 = PeftModel.from_pretrained(base_model, peft_model_path)
training_tag = f"ChatGLM3-6B(Epoch=3, automade-dataset)"

In [16]:
base_response, ft_response = compare_chatglm_results("解释下乾卦是什么？", base_model, qlora_model_e3, training_tag)

问题：解释下乾卦是什么？

原始输出：
乾卦是周易中的一卦，代表天，象征刚健强劲，刚毅果敢，充满活力和生机。在《易经》中，乾卦代表着键字的形象，键字是由天上的龙和大地的象征结合而成的，意味着可以人力无法穿透的天然力量。

在哲学领域，乾卦代表着天行健，君子自强不息的观念。在卜筮时，乾卦预示着大吉大利，事业顺利，抽象为：天行健，君子自强不息，治理大国，必先建立法则。

在周易的哲学中，乾卦代表阳刚之象，具有刚健、刚毅、果敢、勇于担当的特点。在运势方面，带来积极的影响，提升人的运势，为胜运提供条件。在事业、经商、求名、婚恋等方面都有积极的作用，可以带来财富、权力和成功。

 summary:
乾卦是周易中的一卦，代表天，象征刚健强劲，刚毅果敢，充满活力和生机。在《易经》中，乾卦代表着键字的形象，键字是由天上的龙和大地的象征结合而成的，意味着可以人力无法穿透的天然力量。

在哲学领域，乾卦代表阳刚之象，具有刚健、刚毅、果敢、勇于担当的特点。在运势方面，带来积极的影响，提升人的运势，为胜运提供条件。在事业、经商、求名、婚恋等方面都有积极的作用，可以带来财富、权力和成功。


微调后（ChatGLM3-6B(Epoch=3, automade-dataset)）：
[gMASK] sop 解释下乾卦是什么？ 乾卦是周易中的一卦，代表天，具有刚健强劲的特性。它由两个乾卦叠加而成，象征着天地的广大无垠。在周易中，乾卦代表着天地的运行，以及人类社会的秩序和繁荣。在卜筮时，乾卦预示着吉祥、顺利，但同时也提醒要警惕困难和险阻。

在儒家解卦中，乾卦代表刚健，健盛可以致极，但物极必反，因此提醒人们要温和对待他人，保持中庸之道。在周易的哲学中，乾卦代表刚健强劲的特性，具有強烈的精神力量，是吉利的象征。


In [17]:
base_response, ft_response = compare_chatglm_results("地水师卦是什么？", base_model, qlora_model_e3, training_tag)

问题：地水师卦是什么？

原始输出：
地水师卦是一个由三个爻组成的卦象，由上卦（乾为天，卦象为天）下卦（坎为水）组成，卦象为天坎。上卦为阳，下卦为阴，卦象为阳阴。上卦为天，下卦为水，卦象为阳阴。上卦为阳，下卦为阴，卦象为阳阴。

地水师卦的卦辞为：利见天颜，利见水中之游鱼。

 interpreted by the I Ching (Book of Changes):

The first hexagram, called the "Treading on Water" or "Mudslide"卦, represents the principle of overcoming difficulties and achieving success. The upper trigram represents the天（heaven），the lower trigram represents the water（sea），and the middle trigram represents the top of the mountain, symbolizing the power of the situation.

The I Ching also interprets the hexagram as a metaphor for the circumstances of life, suggesting that the key to success is to adapt to changing conditions and to become one with the natural world. In particular, the bottom trigram represents the flow of water, which suggests the importance of flexibility and adaptability in life.

In the I Ching, the Treading on Water卦 is associated with the concept of "yang"（阳, active, positive），and it suggests that the circumstances of life are

In [18]:
base_response, ft_response = compare_chatglm_results("周易中的讼卦是什么", base_model, qlora_model_e3, training_tag)

问题：周易中的讼卦是什么

原始输出：
{'name': '讼卦"是周易卦象中的一枚卦，由下卦坤（地）上卦坎（水）组成，预示着吉利的变化。讼卦的卦辞为：上卦坤，下卦坎，利见大人，象leg（腿）劳而无功，利导民示（示以利）道。讼卦的核心哲学是：吉利的出现依赖于键（大人）的帮助，键（大人）的出现依赖于leg（腿）的劳动，而leg（腿）的劳动又依赖于利的引导。因此，晴天出现的云彩是利的，云彩的消散是利的，大人的宴会也是利的。然而，leg（腿）的劳作却不能得到成果，这种情况就像ts象征的讼卦一样，需要避免。', 'content': '\n讼卦的卦象和 attendant卦象都预示着顺利的观点，但ts卦象则提醒了大人的宴会是利的，但leg（腿）的劳动却不能得到成果。因此，ts卦表示键（大人）的劳动依赖于利的引导，但leg（腿）的劳作却不能得到成果。'}


微调后（ChatGLM3-6B(Epoch=3, automade-dataset)）：
[gMASK] sop 周易中的讼卦是什么样子 讼卦"是周易卦象中的一枚卦，由下卦坤（地）上卦坎（水）组成，预示着吉利的变化。在讼卦中，上卦坤代表阴柔的地，下卦坎代表阳刚的水，两者相互挤压，象征着事理乖舛和争讼之象。讼卦的时运不佳，事业运亦不畅，可能面临朋友、家人或朋友的压力和冲突。

讼卦提示着表面平静，内心却充满焦虑和不安。应该保持冷静，理智地处理问题，避免因情绪化而做出错误的决策。此外，讼卦还预示着财运下降，事业不宜冒险，需要谨慎行事。

讼卦的时运不佳，事业运亦不畅，可能面临朋友、家人或朋友的压力和冲突。因此，在遇到问题时，应该保持冷静，理智地处理，避免因情绪化而做出错误的决策。


#### 加载 QLoRA Adapter(Epoch=3, Overfit, handmade-dataset)

In [21]:
from peft import PeftModel, PeftConfig

epochs = 3
peft_model_path = f"models{model_name_or_path}-epoch{epochs}"

config = PeftConfig.from_pretrained(peft_model_path)
qlora_model_e50_handmade = PeftModel.from_pretrained(base_model, peft_model_path)
training_tag = f"ChatGLM3-6B(Epoch=3, handmade-dataset)"

In [22]:
base_response, ft_response = compare_chatglm_results("解释下乾卦是什么？", base_model, qlora_model_e50_handmade, training_tag)

问题：解释下乾卦是什么？

原始输出：
乾卦是周易中的一卦，代表天，象征刚健强劲，刚强自主，充满活力。它由两个卦相组合而成，上卦为乾，下卦为坎， both 卦都代表着力量。

在周易中，乾卦代表着天，代表着刚健强劲的特性，是六十四卦中的第一卦。它象征着力量、勇气、自信和阳光。在周易的解卦中，乾卦代表着大吉，预示着吉祥如意，表示事情将会顺利进行。

在周易的象辞中，描述了乾卦的卦象，认为乾卦的卦象为天，象征着云彩聚集，然后吉利的出现。这反映了人们对于乾卦的吉祥寓意的解读。

在周易的卦辞中，描述了乾卦的特性，认为乾卦具有刚健强劲的特性，代表着力量、勇气、自信和阳光。同时，也强调了乾卦预示着吉利，表示事情将会顺利进行。

在周易的爻辞中，描述了乾卦的动态变化，认为乾卦的动态为阳，代表着积极向上，象征着充满活力的意义。

总结起来，乾卦是周易中的一卦，代表天，象征刚健强劲，刚强自主，充满活力。它由两个卦相组合而成，上卦为乾，下卦为坎， both 卦都代表着力量。在周易的解卦中，乾卦代表着大吉，预示着吉祥如意，表示事情将会顺利进行。


微调后（ChatGLM3-6B(Epoch=3, handmade-dataset)）：
[gMASK] sop 解释下乾卦是什么？ 乾卦是周易中的一卦，代表天，具有刚健强劲的特性。它由两个乾卦叠加而成，象征着天地的广大无垠。在周易中，乾卦代表着天地的运行，以及人类社会的秩序和繁荣。在卜筮时，乾卦预示着吉祥、顺利，但同时也提醒要警惕困难和险阻。

在儒家解卦中，乾卦代表刚健，健盛可以致极，但物极必反，因此提醒人们要温和对待他人，保持中庸之道。在周易的哲学中，乾卦代表刚健强劲的特性，具有強烈的精神力量，是吉利的象征。


In [23]:
base_response, ft_response = compare_chatglm_results("地水师卦", base_model, qlora_model_e50_handmade, training_tag)

问题：地水师卦

原始输出：
地水师卦是中国周易中的一卦，代表大地上的水流。在卦象中，上卦为乾（天），下卦为坎（水），两者相互配合，表示天地的统一。

地水师卦的核心卦义是：天行健，君子 popoel活力，灵活运筹于天地之间。

在卜筮时，地水师卦表示不利于行事，像坎水一样，需要避免好运，像地上的水流，不能持久静止，必须谨慎行动。

综合来看，地水师卦的核心哲学是：天行健，君子 popoel活力，灵活运筹于天地之间。然而，过于箱套于习惯行事，则必败无疑。因此，必须避免好运，像地上的水流，不能持久静止，必须谨慎行动。


微调后（ChatGLM3-6B(Epoch=3, handmade-dataset)）：
[gMASK] sop 地水师卦象解释

 地水师卦是一个由三个卦象组成的卦卦，由上卦坤（地），下卦坎（水），中卦震（雷）组成。这个卦象表示天地之间有水流，象征着人民群众的力量和活力。


地水师卦的卦象解释如下：

上卦坤（地）：代表地，代表大地，象征稳定和承载，以及众人的力量。

下卦坎（水）：代表水，代表流动和变化，以及灵活性和适应性。

中卦震（雷）：代表雷，象征天空，代表智慧，提示人们要倾听天道的声音。

地水师卦的卦象组合代表了一个注重力量和稳定性的性格，能够团结和引导他人，但也需要注意避免过于刚硬和固执。


In [24]:
base_response, ft_response = compare_chatglm_results("天水讼卦", base_model, qlora_model_e50_handmade, training_tag)

问题：天水讼卦

原始输出：
天水讼卦是一个由坎卦（水）上承坤卦（地）组成的卦象，代表诉讼案件，预示着吉凶不一的情况。在卜卦时，损卦（火）卦象出现在卦象中，这意味着卦象中火多水少，人际关系可能受到一定的损害。

在好运方面，众口譽（ acid）卦象出现在卦象中，代表着群众好评，事业可取得成功。然而， Career.com指出，事业上需要谨慎行事，避免急躁冒险，以免造成不必要的损失。

在事业、经商、求名、婚恋等方面，都需要谨慎行事，避免急躁冒险，以免造成不必要的损失。事业上的进展缓慢，需要耐心等待，while在事业上的进步则需要主动寻求进步。

总结起来，天水讼卦预示着险象环生，事业随时可能面临不利的变化，因此，必须谨慎行事，避免急躁冒险，以免造成不必要的损失。


微调后（ChatGLM3-6B(Epoch=3, handmade-dataset)）：
[gMASK] sop 天水讼卦" (Han-Shu-Gun-Ga) is a卦象卜卦的卦象，由上卦坎（水）和下卦乾（天）组成，上卦为云，下卦为天。上卦坎为险，下卦乾为刚，象征着云浮聚于天上，待时降雨之象。预示抓到俘虏，大吉大利，有利于涉水渡河。君子观此卦象，可以宴饮安乐，待时而动。

这个卦象表示踌躇期待，虽然刚强，但前面有险阻，应当等待，涉大川则利。时机尚未成熟，需要耐心等待，不宜冒进。谋事应审时度势，耐心等待，切勿冒险，欲速不达。自信、坚守中正，可化险为夷。情况有利时，仍得居安思危。

来源：《易经》
