# Qwen3微调实战：医疗R1推理风格聊天

[![](https://raw.githubusercontent.com/SwanHubX/assets/main/badge1.svg)](https://swanlab.cn/@ZeyiLin/qwen3-sft-medical/overview)

- **Github**: [Qwen3-Medical-SFT](https://github.com/Zeyi-Lin/Qwen3-Medical-SFT)
- **基础模型**：[Qwen3-1.7B](https://modelscope.cn/models/Qwen/Qwen3-1.7B/summary)
- **微调后模型**：[Qwen3-1.7b-Medical-R1-sft](https://modelscope.cn/models/testUser/Qwen3-1.7b-Medical-R1-sft/summary)
- **数据集**：[delicate_medical_r1_data](https://modelscope.cn/datasets/krisfu/delicate_medical_r1_data)
- **SwanLab**：[qwen3-sft-medical](https://swanlab.cn/@ZeyiLin/qwen3-sft-medical/runs/agps0dkifth5l1xytcdyk/chart)
- **微调方式**：全参数微调、LoRA微调
- **推理风格**：R1推理风格
- **算力要求**：
  - **全参数微调**：32GB显存
  - **LoRA微调**：28GB显存
- **图文教程**：[Qwen3大模型微调入门实战（完整代码）](https://zhuanlan.zhihu.com/p/1903848838214705484)

## 1. 安装环境

In [1]:
import json
import pandas as pd
import torch
from datasets import Dataset
from modelscope import snapshot_download, AutoTokenizer
from transformers import AutoModelForCausalLM, TrainingArguments, Trainer, DataCollatorForSeq2Seq

from transformers import DataCollatorForLanguageModeling


import os
import swanlab

  import pynvml  # type: ignore[import]
  import pynvml  # type: ignore[import]


In [2]:


PROMPT = "你是一个医学专家，你需要根据用户的问题，给出带有思考的回答。"
MAX_LENGTH = 2048


In [3]:

def dataset_jsonl_transfer(origin_path, new_path):
    """
    将原始数据集转换为大模型微调所需数据格式的新数据集
    """
    messages = []

    # 读取旧的JSONL文件
    with open(origin_path, "r") as file:
        for line in file:
            # 解析每一行的json数据
            data = json.loads(line)
            input = data["question"]
            think = data["think"]
            answer = data["answer"]
            output = f"<think>{think}</think> \n {answer}"
            message = {
                "instruction": PROMPT,
                "input": f"{input}",
                "output": output,
            }
            messages.append(message)

    # 保存重构后的JSONL文件
    with open(new_path, "w", encoding="utf-8") as file:
        for message in messages:
            file.write(json.dumps(message, ensure_ascii=False) + "\n")



In [4]:
def process_func2(example):
    

    instruction = example['instruction']

    
    input1 = example['input']
    
    output = example['output']

    messages = [
        {'role': 'system', 'content': f"{PROMPT}"},
        {'role': 'user', 'content': input1},
        {'role': 'assistant', 'content': output},
                ]



    text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=False,
    truncate=True,
#     return_tensors='pt',
#     enable_thinking=False

    )
#     example['text'] = text
    return {"text":text}
    
    
    
    

In [5]:


def process_func(example):
    """
    将数据集进行预处理
    """ 
    input_ids, attention_mask, labels = [], [], []
    instruction = tokenizer(
        f"<|im_start|>system\n{PROMPT}<|im_end|>\n<|im_start|>user\n{example['input']}<|im_end|>\n<|im_start|>assistant\n",
        add_special_tokens=False,
    )
    response = tokenizer(f"{example['output']}", add_special_tokens=False)
    input_ids = instruction["input_ids"] + response["input_ids"] + [tokenizer.pad_token_id]
    attention_mask = (
        instruction["attention_mask"] + response["attention_mask"] + [1]
    )
    labels = [-100] * len(instruction["input_ids"]) + response["input_ids"] + [tokenizer.pad_token_id]
    if len(input_ids) > MAX_LENGTH:  # 做一个截断
        input_ids = input_ids[:MAX_LENGTH]
        attention_mask = attention_mask[:MAX_LENGTH]
        labels = labels[:MAX_LENGTH]
    return {"input_ids": input_ids, "attention_mask": attention_mask, "labels": labels}   


In [6]:


def predict(messages, model, tokenizer):
    device = model.device
    text = tokenizer.apply_chat_template(
        messages,
        tokenize=False,
        add_generation_prompt=True
    )
    model_inputs = tokenizer([text], return_tensors="pt").to(device)

    generated_ids = model.generate(
        model_inputs.input_ids,
        max_new_tokens=MAX_LENGTH,
    )
    generated_ids = [
        output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
    ]

    response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

    return response


In [8]:

# Transformers加载模型权重
tokenizer = AutoTokenizer.from_pretrained("/ssd2/output_test_202509152109_debug", use_fast=False, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("/ssd2/output_test_202509152109_debug", device_map="cuda:0", torch_dtype=torch.bfloat16)
model.enable_input_require_grads()  # 开启梯度检查点时，要执行该方法




In [9]:
model

Qwen2ForCausalLM(
  (model): Qwen2Model(
    (embed_tokens): Embedding(151936, 896, padding_idx=151645)
    (layers): ModuleList(
      (0-23): 24 x Qwen2DecoderLayer(
        (self_attn): Qwen2Attention(
          (q_proj): Linear(in_features=896, out_features=896, bias=True)
          (k_proj): Linear(in_features=896, out_features=128, bias=True)
          (v_proj): Linear(in_features=896, out_features=128, bias=True)
          (o_proj): Linear(in_features=896, out_features=896, bias=False)
        )
        (mlp): Qwen2MLP(
          (gate_proj): Linear(in_features=896, out_features=4864, bias=False)
          (up_proj): Linear(in_features=896, out_features=4864, bias=False)
          (down_proj): Linear(in_features=4864, out_features=896, bias=False)
          (act_fn): SiLU()
        )
        (input_layernorm): Qwen2RMSNorm((896,), eps=1e-06)
        (post_attention_layernorm): Qwen2RMSNorm((896,), eps=1e-06)
      )
    )
    (norm): Qwen2RMSNorm((896,), eps=1e-06)
    (rotary_e

In [10]:
model.to("cuda:0")

Qwen2ForCausalLM(
  (model): Qwen2Model(
    (embed_tokens): Embedding(151936, 896, padding_idx=151645)
    (layers): ModuleList(
      (0-23): 24 x Qwen2DecoderLayer(
        (self_attn): Qwen2Attention(
          (q_proj): Linear(in_features=896, out_features=896, bias=True)
          (k_proj): Linear(in_features=896, out_features=128, bias=True)
          (v_proj): Linear(in_features=896, out_features=128, bias=True)
          (o_proj): Linear(in_features=896, out_features=896, bias=False)
        )
        (mlp): Qwen2MLP(
          (gate_proj): Linear(in_features=896, out_features=4864, bias=False)
          (up_proj): Linear(in_features=896, out_features=4864, bias=False)
          (down_proj): Linear(in_features=4864, out_features=896, bias=False)
          (act_fn): SiLU()
        )
        (input_layernorm): Qwen2RMSNorm((896,), eps=1e-06)
        (post_attention_layernorm): Qwen2RMSNorm((896,), eps=1e-06)
      )
    )
    (norm): Qwen2RMSNorm((896,), eps=1e-06)
    (rotary_e

In [11]:
model.device

device(type='cuda', index=0)

In [12]:

# 加载、处理数据集和测试集
train_dataset_path = "train.jsonl"
test_dataset_path = "val.jsonl"

train_jsonl_new_path = "train_format.jsonl"
test_jsonl_new_path = "val_format.jsonl"

if not os.path.exists(train_jsonl_new_path):
    dataset_jsonl_transfer(train_dataset_path, train_jsonl_new_path)
if not os.path.exists(test_jsonl_new_path):
    dataset_jsonl_transfer(test_dataset_path, test_jsonl_new_path)


In [13]:

# 得到训练集
train_df = pd.read_json(train_jsonl_new_path, lines=True)
train_ds = Dataset.from_pandas(train_df)

In [14]:
tmp = process_func2(train_ds[0])


In [15]:
tmp

{'text': '<|im_start|>system\n你是一个医学专家，你需要根据用户的问题，给出带有思考的回答。<|im_end|>\n<|im_start|>user\n医生，我想了解一下如何测定盐酸甲氧明注射液的含量，具体步骤是什么样的？<|im_end|>\n<|im_start|>assistant\n<think>嗯，用户问的是如何测定盐酸甲氧明注射液的含量，具体步骤是什么。首先，我需要回忆一下相关的分析方法，特别是药典中常用的方法。盐酸甲氧明属于药物分析中的常见成分，通常可能用紫外分光光度法或者HPLC之类的。\n\n首先，用户提到的是紫外-可见分光光度法，这应该是比较直接的方法。那步骤的话，首先应该考虑样品的制备。因为注射液浓度可能较高，需要稀释到合适的浓度范围，使得吸光度在仪器的线性范围内。比如，先取一定量的注射液，然后稀释到某个体积，比如250毫升的量瓶，这样可能是一个步骤。\n\n接下来，可能需要进一步稀释，因为第一次稀释后的溶液可能吸光度还是太高或者太低。比如，从第一次稀释后的溶液中再取一部分，比如10毫升，放到另一个量瓶，比如100毫升，再次稀释。这样两次稀释可以得到合适的浓度。\n\n然后，测定吸光度的时候，波长的选择很重要。盐酸甲氧明的最大吸收波长应该查文献或者药典，比如问题中的答案提到的是290纳米，这可能来自药典的规定。需要确认这个波长是否正确，以及吸收系数是否准确。比如，吸收系数137是否对应C1H1NO3·HCl的计算，可能需要根据分子量和浓度来计算，但用户可能不需要详细计算，只需要步骤。\n\n另外，步骤中的精密量取需要注意，比如使用移液管或者自动进样器，确保量取的准确性。摇匀也是关键步骤，确保溶液均匀，避免局部浓度不均导致误差。\n\n可能还需要考虑空白对照，比如用水代替样品，进行同样的操作，以扣除背景吸光度。不过答案中没有提到，可能在标准方法中已经包含，或者步骤简化了。但作为详细步骤，可能需要补充这一点。\n\n最后，计算含量的时候，根据吸收系数和吸光度，应用朗伯-比尔定律，A=εcl，其中ε是摩尔吸光系数，但这里可能用的是百分吸收系数（1% 1cm），所以需要确认单位是否正确。例如，吸收系数137可能是指在1%浓度（1g/100ml）下，1cm光程的吸光度，这样计算时需要将浓度转换为相应的单位。\n\n可能用户是医

In [16]:
messages = [
    {"role": "user", "content": train_ds[0]['input']},
    {"role": "assistant", "content": train_ds[0]['output']},    
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True,
    enable_thinking=True # Switches between thinking and non-thinking modes. Default is True.
)
text
model_inputs = tokenizer([text], return_tensors="pt")


In [17]:
text

'<|im_start|>system\nYou are Qwen, created by Alibaba Cloud. You are a helpful assistant.<|im_end|>\n<|im_start|>user\n医生，我想了解一下如何测定盐酸甲氧明注射液的含量，具体步骤是什么样的？<|im_end|>\n<|im_start|>assistant\n<think>嗯，用户问的是如何测定盐酸甲氧明注射液的含量，具体步骤是什么。首先，我需要回忆一下相关的分析方法，特别是药典中常用的方法。盐酸甲氧明属于药物分析中的常见成分，通常可能用紫外分光光度法或者HPLC之类的。\n\n首先，用户提到的是紫外-可见分光光度法，这应该是比较直接的方法。那步骤的话，首先应该考虑样品的制备。因为注射液浓度可能较高，需要稀释到合适的浓度范围，使得吸光度在仪器的线性范围内。比如，先取一定量的注射液，然后稀释到某个体积，比如250毫升的量瓶，这样可能是一个步骤。\n\n接下来，可能需要进一步稀释，因为第一次稀释后的溶液可能吸光度还是太高或者太低。比如，从第一次稀释后的溶液中再取一部分，比如10毫升，放到另一个量瓶，比如100毫升，再次稀释。这样两次稀释可以得到合适的浓度。\n\n然后，测定吸光度的时候，波长的选择很重要。盐酸甲氧明的最大吸收波长应该查文献或者药典，比如问题中的答案提到的是290纳米，这可能来自药典的规定。需要确认这个波长是否正确，以及吸收系数是否准确。比如，吸收系数137是否对应C1H1NO3·HCl的计算，可能需要根据分子量和浓度来计算，但用户可能不需要详细计算，只需要步骤。\n\n另外，步骤中的精密量取需要注意，比如使用移液管或者自动进样器，确保量取的准确性。摇匀也是关键步骤，确保溶液均匀，避免局部浓度不均导致误差。\n\n可能还需要考虑空白对照，比如用水代替样品，进行同样的操作，以扣除背景吸光度。不过答案中没有提到，可能在标准方法中已经包含，或者步骤简化了。但作为详细步骤，可能需要补充这一点。\n\n最后，计算含量的时候，根据吸收系数和吸光度，应用朗伯-比尔定律，A=εcl，其中ε是摩尔吸光系数，但这里可能用的是百分吸收系数（1% 1cm），所以需要确认单位是否正确。例如，吸收系数137可能是指在1%浓度（1g/100ml）下，1cm光程的吸光度，

此处的token, 没有用chat_template模板，而是直接手动拼接，　模板函数的功能，也仅仅是把各个字段封装成 start, end的字段


In [18]:

train_dataset = train_ds.map(process_func, remove_columns=train_ds.column_names)


Map:   0%|          | 0/2166 [00:00<?, ? examples/s]

In [19]:
train_dataset[0]

{'input_ids': [151644,
  8948,
  198,
  56568,
  101909,
  104316,
  101057,
  3837,
  112735,
  100345,
  20002,
  103936,
  3837,
  107485,
  106646,
  104107,
  111423,
  1773,
  151645,
  198,
  151644,
  872,
  198,
  103998,
  3837,
  104100,
  110050,
  100007,
  115391,
  102029,
  99918,
  100043,
  100316,
  30858,
  107833,
  100058,
  9370,
  104982,
  3837,
  100398,
  105652,
  102021,
  100535,
  11319,
  151645,
  198,
  151644,
  77091,
  198,
  13708,
  766,
  29,
  106287,
  3837,
  20002,
  56007,
  100146,
  100007,
  115391,
  102029,
  99918,
  100043,
  100316,
  30858,
  107833,
  100058,
  9370,
  104982,
  3837,
  100398,
  105652,
  102021,
  1773,
  101140,
  3837,
  35946,
  85106,
  104843,
  100158,
  105470,
  101042,
  39907,
  3837,
  104050,
  99471,
  99548,
  15946,
  103229,
  104339,
  1773,
  102029,
  99918,
  100043,
  100316,
  30858,
  100409,
  104459,
  101042,
  101047,
  101536,
  105024,
  3837,
  102119,
  87267,
  11622,
  114794,
  1

In [20]:

# 得到验证集
eval_df = pd.read_json(test_jsonl_new_path, lines=True)
eval_ds = Dataset.from_pandas(eval_df)
eval_dataset = eval_ds.map(process_func, remove_columns=eval_ds.column_names)


Map:   0%|          | 0/241 [00:00<?, ? examples/s]

In [21]:
len(train_dataset[2]['input_ids'])

933

In [22]:
model.device

device(type='cuda', index=0)

In [23]:





test_df = pd.read_json(test_jsonl_new_path, lines=True)[:3]

test_text_list = []

for index, row in test_df.iterrows():
    instruction = row['instruction']
    input_value = row['input']

    messages = [
        {"role": "system", "content": f"{instruction}"},
        {"role": "user", "content": f"{input_value}"}
    ]
    

    response = predict(messages, model, tokenizer)

    response_text = f"""
    Question: {input_value}

    LLM:{response}
    """
    
#     test_text_list.append(swanlab.Text(response_text))
    print(response_text)


The attention mask is not set and cannot be inferred from input because pad token is same as eos token. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.



    Question: 1895年德国物理学教授伦琴的发现对医学影像学的发展有何具体影响？请从技术进步、学科建立和临床应用三个方面进行分析。

    LLM:<think>嗯，用户问的是1895年德国物理学家伦琴如何影响医学影像学，以及具体的技术进步、学科建立和临床应用方面。首先，我需要回忆一下伦琴的相关知识。伦琴是X线的发明者之一，对吧？不过他可能不太直接参与实际应用。

首先，技术进步方面，我记得之前没提到过，但可能在后期会有所发展。比如CT、MR之类的现代设备可能通过他改进或开发。另外，放射科的设施可能增加，比如更先进的X光机或者扫描仪，这对诊断来说很重要。

然后是学科建立。因为X线确实是基础，所以后续学科如放射科应该成立。另外，图像重建技术可能来自他的研究，比如像计算机断层扫描（CT）或者螺旋CT，这些现在很常用。这可能是因为他提出了直线聚焦理论，后来被应用于成像。

接下来临床应用部分，可能涉及医学影像的应用场景，比如医生用X光检查患者，或者做PET检测癌症。不过具体的例子可能需要查证，比如CT血管成像（CTA）、MRI这些。另外，可能还有其他领域的应用，比如超声或CT/MR融合，但用户的问题主要集中在医学影像上。

还要注意术语是否正确。比如“放射科”是不是正确的？可能用户混淆了不同的名称。另外，是否有其他术语需要解释？

另外，有没有可能遗漏的关键点呢？比如，伦琴发现了X线，而不仅仅是医疗用途？可能他更关注X光本身，而不是医学影像。另外，技术上的突破，比如CT、MR等，可能也是其贡献的一部分。

可能还需要考虑其他因素，比如他可能的研究方向变化，比如转向非接触性检查，或者与其他科学家合作，推动医学影像的进步。不过根据问题，重点放在医学应用。

总结下来，思考过程应该是先确认技术进步，再分解到各个领域，并详细说明每个领域的影响，最后联系到医学中的应用。同时要确保逻辑连贯，没有错误。
</think> 
 当然可以。1895年，德国物理学家伦琴发现了X线。这一发现为医学影像学提供了重要的基础。随着医学影像技术的不断进步，它已经渗透到了医学诊断中。例如，CT、MR等现代医学影像设备都是由他设计和研发的。此外，图像重建技术也可能源于他的工作。这些技术不仅提高了诊断的准确性，也为治疗提供了更多的可能性。希望这些信息对您的研究有所帮助。
    

  

In [25]:
from trl import SFTTrainer
from transformers import TrainingArguments

In [26]:
data_collator = DataCollatorForLanguageModeling(
    tokenizer=tokenizer,
    mlm=False  # we're doing causal LM, not masked LM
)


In [27]:
eval_dataset

Dataset({
    features: ['input_ids', 'attention_mask', 'labels'],
    num_rows: 241
})

In [28]:
torch.cuda.empty_cache()

In [32]:

# args = TrainingArguments(
#     output_dir="./output/Qwen3-1.7B",
#     per_device_train_batch_size=1,
#     per_device_eval_batch_size=1,
#     gradient_accumulation_steps=4,
#     eval_strategy="steps",
#     eval_steps=100,
#     logging_steps=10,
#     num_train_epochs=2,
#     save_steps=400,
#     learning_rate=1e-4,
#     save_on_each_node=True,
#     gradient_checkpointing=True,
#     report_to="swanlab",
#     run_name="qwen3-1.7B",
# )

# trainer = Trainer(
#     model=model,
#     args=args,
#     train_dataset=train_dataset,
#     eval_dataset=eval_dataset,
#     data_collator=DataCollatorForSeq2Seq(tokenizer=tokenizer, padding=True),
# )



args=TrainingArguments(
    per_device_train_batch_size=1,
    per_device_eval_batch_size=1,
    gradient_accumulation_steps=1,
    # Use num_train_epochs = 1, warmup_ratio for full training runs!
    num_train_epochs=2,
    warmup_steps=5,
    #max_steps=60,
    learning_rate=1e-4,
    gradient_checkpointing=True,
    logging_steps=1,
    
    eval_strategy="steps",
    eval_steps=30,

    seed=3407,
    output_dir="outputs",
    report_to="swanlab",
    run_name="qwen3-1.7B-jupyter-trl-v2"
    
    
    #    optim="adamw_8bit",
    #    weight_decay=0.01,
    #    lr_scheduler_type="linear",
    #     fp16=not is_bfloat16_supported(),
    #     bf16=is_bfloat16_supported(),

)


trainer = SFTTrainer(
    model=model,
    args=args,

    train_dataset=train_dataset,
    eval_dataset=eval_dataset,
    data_collator=data_collator,
#    dataset_text_field="text",
#    max_seq_length=max_seq_length,
#    tokenizer=tokenizer,    

)





trainer.train()

# 用测试集的前3条，主观看模型

Truncating train dataset:   0%|          | 0/2166 [00:00<?, ? examples/s]

Truncating eval dataset:   0%|          | 0/241 [00:00<?, ? examples/s]

Output()

Output()

Step,Training Loss,Validation Loss
30,0.1727,1.729462
60,0.1067,1.695816
90,0.2132,1.668192
120,0.2348,1.598775
150,0.2467,1.565442
180,0.2138,1.516079
210,0.209,1.493954
240,0.2409,1.457687
270,0.2855,1.43866
300,0.3452,1.42314






TrainOutput(global_step=722, training_loss=0.20251906229766123, metrics={'train_runtime': 2792.2015, 'train_samples_per_second': 1.551, 'train_steps_per_second': 0.259, 'total_flos': 3.5627337800073216e+16, 'train_loss': 0.20251906229766123})

In [33]:
train_dataset

Dataset({
    features: ['input_ids', 'attention_mask', 'labels'],
    num_rows: 2166
})

In [34]:

test_df = pd.read_json(test_jsonl_new_path, lines=True)[:3]

test_text_list = []

for index, row in test_df.iterrows():
    instruction = row['instruction']
    input_value = row['input']

    messages = [
        {"role": "system", "content": f"{instruction}"},
        {"role": "user", "content": f"{input_value}"}
    ]

    response = predict(messages, model, tokenizer)

    response_text = f"""
    Question: {input_value}

    LLM:{response}
    """
    
    test_text_list.append(swanlab.Text(response_text))
    print(response_text)

swanlab.log({"Prediction": test_text_list})

swanlab.finish()




    Question: 1895年德国物理学教授伦琴的发现对医学影像学的发展有何具体影响？请从技术进步、学科建立和临床应用三个方面进行分析。

    LLM:<think>嗯，用户问的是1895年伦琴发现X光对医学影像学的影响，需要从技术进步、学科建立和临床应用三个角度分析。首先，我得回忆一下伦琴是谁，他是德国的物理学家，对吧？他可能是在研究X射线的时候发现了这个现象。

首先，技术进步方面，X光的发现肯定是技术上的突破。X射线属于电离辐射，能穿透物质，这比传统的可见光或者紫外线强很多。那为什么这能成为医学影像学的基础呢？可能因为它的穿透性，使得医生可以不用切开病人，就能看到内部结构，比如骨骼或者器官。这应该让诊断更快、更安全，减少了组织损伤，所以技术上是革命性的。

然后是学科建立。医学影像学作为一门独立的学科，应该是在伦琴之后才出现的。之前可能医学诊断更多依赖解剖学知识，而X光的出现让影像学成为医学的一部分，比如放射科，专门处理影像检查。可能当时医学界开始将影像学作为诊断的重要手段，而不是仅靠解剖学或病理学。

临床应用方面，X光的应用可能促进了后续的诊断技术，比如CT、MRI、超声这些，这些都是在X光的基础上发展起来的。比如CT扫描就是通过多角度的X光成像，然后结合计算机技术分析图像，这比单一的X光片更全面。另外，X光在临床中的普及可能改变了患者对疾病的诊断方式，比如不再需要依赖活检或手术，而是通过影像学直接观察，减少患者的痛苦和风险。

不过，用户的问题里可能还希望更深入的分析，比如伦琴如何具体推动这些发展。比如他可能在研究X射线时，意识到它的临床应用潜力，或者他可能在教学或临床实践中应用了这些技术，从而促进了学科的发展。另外，技术进步如何影响后续的发展，比如X光设备的改进，或者成像技术的演变，比如从荧光屏到数字图像技术，这些都是技术进步的延续。

还要注意用户可能作为医学生或医学生，想了解医学史，所以需要强调伦琴的贡献不仅停留在技术层面，还影响了学科的建立和临床应用，说明其多方面的影响。可能需要检查是否有其他因素，比如伦琴是否参与了其他医学领域的贡献，或者他的教学和临床实践如何影响了医学影像学的形成。

总结下来，回答的结构应该是先分点，每个部分详细说明，用例子和逻辑连接起来，确保覆盖技术、学科、临床应用，并且突出伦琴的直接和间接影响。可能需要确认