In [4]:
from openai import OpenAI
import base64
import requests
import json
import os

client = OpenAI(base_url='https://api.xiaoai.plus/v1')  # 初始化 OpenAI 客户端

def query_base64_image_description(image_path, prompt="解释下图里的内容？", max_tokens=1000):

    # 实现 Base64 编码
    def encode_image(path):
        with open(path, "rb") as image_file:
            return base64.b64encode(image_file.read()).decode('utf-8')

    # 获取图像的 Base64 编码字符串
    base64_image = encode_image(image_path)

    # 构造请求的 HTTP Header
    headers = {
        "Content-Type": "application/json",
        "Authorization": f"Bearer {client.api_key}"
    }

    # 构造请求的负载
    payload = {
        "model": "gpt-4-turbo",
        "messages": [
            {
                "role": "user",
                "content": [
                    {"type": "text", "text": prompt},
                    {"type": "image_url", "image_url": {"url": f"data:image/jpeg;base64,{base64_image}"}}
                ]
            }
        ],
        "max_tokens": max_tokens
    }

    # 发送 HTTP 请求
    response = requests.post("https://api.xiaoai.plus/v1/chat/completions", headers=headers, json=payload)

    # 检查响应并提取所需的 content 字段
    if response.status_code == 200:
        response_data = response.json()
        content = response_data['choices'][0]['message']['content']
        return content
    else:
        return f"Error: {response.status_code}, {response.text}"

query_base64_image_description('../images/gpt-4v.jpg')

'这张图片是一本笔记本的两页，内容主要涉及自然语言处理（NLP）中的技术和模型更新。笔记记录了各种技术、模型、更新方法和相关研究机构。\n\n左页笔记：\n1. 提到了Transformer模型，这是自然语言处理领域中常用的一个重要模型。\n2. 提及各种改进方法，如PEFT (可能代表一个特定的Fine-Tuning方法)，PBFT Methods。\n3. 讨论了利用Prompt Tuning进行模型调整的不同方式，例如Adapter、Prefix、P-Tuning V1和V2、Soft Prompts、Hand Prompts。\n4. 列举了一些具体的大型预训练模型，如GPT、BLOOM、MOSS等。\n\n右页笔记：\n1. 讨论了多模态指导微调（multi-modality Instruction Fine-Tuning），以及LLaMA (可能是一个大规模语言模型)。\n2. 提到了LoRA、GLoRA、AdaptLoRA等方法，这些可能是用于微调大型语言模型的技术。\n3. 右页同样提及了代入形式（insertion form），增加类型表示、适配器使用等研究点。\n\n整体上，这些笔记看起来是对最新的自然语言处理技术和模型微调技术的摘要或个人学习记录。'