In [4]:
import os
import json
import base64
import pandas as pd
from dashscope import MultiModalConversation
from zhipuai import ZhipuAI
from openai import OpenAI

def get_image_files(directory, extensions=('.png', '.jpg', '.jpeg', '.bmp', '.gif')):
    """
    获取目录中所有图片文件的完整路径。
    """
    files = []
    for file in os.listdir(directory):
        if file.lower().endswith(extensions):
            files.append(os.path.join(directory, file))
    return files

def create_message_dashscope(image_file, prompt):
    """
    针对 dashscope 平台构造消息，使用 file:// 协议的图片路径。
    """
    image_path = f"file://{os.path.abspath(image_file)}"
    messages = [
        {
            "role": "system",
            "content": [{"text": "You are a helpful assistant."}]
        },
        {
            "role": "user",
            "content": [
                {"image": image_path},
                {"text": prompt}
            ]
        }
    ]
    return messages

def call_model_dashscope(api_key, model, messages):
    """
    调用 dashscope 平台的多模态模型，返回模型输出文本。
    """
    try:
        response = MultiModalConversation.call(api_key=api_key, model=model, messages=messages)
        return response["output"]["choices"][0]["message"].content[0]["text"]
    except Exception as e:
        print(f"调用 dashscope 模型 {model} 时出错: {e}")
        return None

def call_model_zhipuai(api_key, model, image_file, prompt):
    """
    调用 ZhipuAI 平台的多模态模型：
      - 先将图片转换为 base64 编码字符串
      - 构造消息时，图片部分采用 type 为 image_url 的格式
    """
    try:
        with open(image_file, 'rb') as img_file:
            img_base = base64.b64encode(img_file.read()).decode('utf-8')
        client = ZhipuAI(api_key=api_key)
        response = client.chat.completions.create(
            model=model,
            messages=[
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "image_url",
                            "image_url": {"url": img_base}
                        },
                        {
                            "type": "text",
                            "text": prompt
                        }
                    ]
                }
            ]
        )
        message = response.choices[0].message
        if isinstance(message, dict) and "text" in message:
            return message["text"]
        else:
            return message
    except Exception as e:
        print(f"调用 ZhipuAI 模型 {model} 时出错: {e}")
        return None

def encode_image(image_path):
    """
    将图片文件转换为 Base64 编码的字符串。
    """
    with open(image_path, "rb") as image_file:
        return base64.b64encode(image_file.read()).decode("utf-8")

def call_model_openai(api_key, model, image_file, prompt):
    """
    调用 OpenAI 平台的多模态模型：
      - 将图片转换为 Base64 字符串，并构造 data URL
      - 使用 OpenAI 的接口调用模型
    """
    try:
        base64_image = encode_image(image_file)
        client = OpenAI(api_key=api_key)
        response = client.responses.create(
            model=model,
            input=[
                {
                    "role": "user",
                    "content": [
                        {"type": "input_text", "text": prompt},
                        {
                            "type": "input_image",
                            "image_url": f"data:image/jpeg;base64,{base64_image}",
                        },
                    ],
                }
            ],
        )
        return response.output_text
    except Exception as e:
        print(f"调用 OpenAI 模型 {model} 时出错: {e}")
        return None

def parse_model_output(output_text):
    """
    尝试将模型输出解析为 JSON 格式，并提取以下字段：
      - crystal_type：晶体类型
      - energy_above_hull：Energy Above Hull（单位 eV/atom）
      - formation_energy：形成能（单位 eV/atom）
      - band_gap：带隙（单位 eV）
      
    若解析失败，则返回全部为 None。
    """
    try:
        data = json.loads(output_text)
        crystal_type = data.get("crystal_type")
        energy_above_hull = data.get("energy_above_hull")
        formation_energy = data.get("formation_energy")
        band_gap = data.get("band_gap")
        return crystal_type, energy_above_hull, formation_energy, band_gap
    except Exception as e:
        print("解析模型输出失败，可能输出格式不符合预期。", e)
        return None, None, None, None

def test_models_on_images(image_dir, prompt, models_config):
    """
    批量对指定目录下的图片使用多个模型进行测试，并收集结果。
    
    每个结果包含：
      - model: 模型名称
      - platform: 所属平台（dashscope、zhipuai 或 openai）
      - image_file: 图片文件路径
      - crystal_type, energy_above_hull, formation_energy, band_gap: 解析后的结构化数据（可能为 None）
      - raw_output: 模型返回的原始文本
    """
    image_files = get_image_files(image_dir)
    if not image_files:
        print("在目录中未找到图片:", image_dir)
        return []
    
    results = []
    for model_info in models_config:
        model_name = model_info['name']
        api_key = model_info['api_key']
        platform = model_info.get("platform", "dashscope").lower()  # 默认 dashscope
        print(f"\n开始测试模型：{model_name} (平台: {platform})")
        for image_file in image_files:
            print(f"处理图片: {image_file}")
            if platform == "zhipuai":
                output_text = call_model_zhipuai(api_key, model_name, image_file, prompt)
            elif platform == "openai":
                output_text = call_model_openai(api_key, model_name, image_file, prompt)
            else:  # 默认 dashscope
                messages = create_message_dashscope(image_file, prompt)
                output_text = call_model_dashscope(api_key, model_name, messages)
            crystal_type, energy_above_hull, formation_energy, band_gap = parse_model_output(output_text)
            results.append({
                "model": model_name,
                "platform": platform,
                "image_file": image_file,
                "crystal_type": crystal_type,
                "energy_above_hull": energy_above_hull,
                "formation_energy": formation_energy,
                "band_gap": band_gap,
                "raw_output": output_text
            })
            print(f"模型输出: {output_text}")
    return results

def save_results_to_csv(results, csv_filename="crystal_analysis_results.csv"):
    """
    将结果列表保存为 CSV 文件。
    """
    df = pd.DataFrame(results)
    df.to_csv(csv_filename, index=False, encoding='utf-8')
    print(f"结果已保存至 {csv_filename}")

if __name__ == "__main__":
    # 修改为你的图片目录
    image_directory = "pic"
    
    # 专业且标准化的 prompt：
    # 要求模型对晶体结构图片进行详细分析，并以 JSON 格式输出晶体类型、Energy Above Hull、形成能及带隙
    prompt_text = (
        "请对以下晶体结构图片尝试进行分析，依据图片中的晶体排列、化学成分及可能的晶格参数，"
        "必须以如下格式提供分析结果：\n"
        "{\n"
        '  "crystal_type": "例如：Cubic, Hexagonal, Orthorhombic等",\n'
        '  "energy_above_hull": "单位 eV/atom",\n'
        '  "formation_energy": "单位 eV/atom",\n'
        '  "band_gap": "单位 eV"\n'
        "}\n"
        "请确保回答准确且专业，切勿输出其他内容。"
    )
    
    # 模型配置（根据实际情况填写 API Key 与模型名称），并标明所属平台
    models = [
        {"name": "qwen-vl-max-latest", "api_key": "sk-6a19a5c4417845cc9b11428c85272484", "platform": "dashscope"},
        {"name": "llama-4-maverick-17b-128e-instruct", "api_key": "sk-6a19a5c4417845cc9b11428c85272484"},
        # {"name": "glm-4v-plus-0111", "api_key": "your_zhipuai_api_key", "platform": "zhipuai"},
        {"name": "gpt-4o", "api_key": "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", "platform": "openai"}
    ]
    
    # 批量测试各平台模型
    results = test_models_on_images(image_directory, prompt_text, models)
    
    # 将测试结果保存为 CSV 文件
    save_results_to_csv(results, csv_filename="crystal_analysis_results.csv")



开始测试模型：qwen-vl-max-latest (平台: dashscope)
处理图片: pic\test.png
模型输出: {
  "crystal_type": "Cubic",
  "energy_above_hull": 0.0,
  "formation_energy": 0.0,
  "band_gap": 3.1
}

开始测试模型：llama-4-maverick-17b-128e-instruct (平台: dashscope)
处理图片: pic\test.png
模型输出: {
  "crystal_type": "Hexagonal",
  "energy_above_hull": 0.0,
  "formation_energy": -0.333,
  "band_gap": 4.5
}

开始测试模型：gpt-4o (平台: openai)
处理图片: pic\test.png
解析模型输出失败，可能输出格式不符合预期。 Expecting value: line 1 column 1 (char 0)
模型输出: 抱歉，我无法从图像中提供具体的晶体结构分析或计算物理性质数据。建议使用材料科学软件如VESTA或者DFT计算工具进行进一步分析。
结果已保存至 crystal_analysis_results.csv
