一个调用小米 MIMO 多模态模型进行图片理解的 MCP Server。
本 MCP 的作用是在不中断 MIMO 2.5 Pro 主模型对话上下文的前提下,通过 MCP 工具调用 MIMO 2.5 模型单独完成图片识别任务。
它不会让 MIMO 2.5 Pro 模型本身具备多模态图片理解能力;图片理解由本 MCP 背后的 MIMO 2.5 模型完成,再把识别结果返回给主对话模型继续推理。
该 MCP 支持:
- 本地图片路径识别
- 网络图片 URL 识别
- Agent 自定义提示词
- API Key、请求地址、模型名称通过 MCP 启动配置传入
- 支持通过 PyPI / uvx 运行
- 支持本地源码运行
本项目会向 MCP 客户端暴露一个工具:
用于调用 MIMO 多模态模型理解图片。
支持的输入方式:
image_path: 单张本地图片路径image_url: 单张网络图片 URLimage_paths: 多张本地图片路径image_urls: 多张网络图片 URLprompt:由 Agent 自己决定的图片理解任务system_prompt:可选系统提示词temperature:输出随机性max_tokens:最大输出长度
为了让 Claude 在图片识别、OCR、截图分析等任务中稳定调用本 MCP,建议在项目的 CLAUDE.md 中加入类似说明:
进行图片识别任务时,只使用 mimo_image_recognition_mcp。如果你只是想使用这个 MCP,推荐使用这种方式。
MCP 配置示例:
{
"mcpServers": {
"mimo-image-recognition": {
"command": "uvx",
"args": [
"--refresh",
"mimo-image-recognition-mcp"
],
"env": {
"MIMO_API_KEY": "用户自己的 API Key",
"MIMO_API_BASE": "https://token-plan-cn.xiaomimimo.com/v1",
"MIMO_MODEL": "mimo-v2.5"
}
}
}
}配置项说明:
| 配置项 | 说明 |
|---|---|
MIMO_API_KEY |
你的 MIMO API Key |
MIMO_API_BASE |
MIMO API 请求地址,通常为 https://api.xiaomimimo.com/v1或https://token-plan-cn.xiaomimimo.com/v1 |
MIMO_MODEL |
要调用的 MIMO 模型名称,例如 mimo-v2.5 |
使用本 MCP 调用 MIMO 接口时,建议不要开启代理。代理可能导致请求超时、连接失败,或影响图片 URL 的访问稳定性。
如果你想修改源码或参与开发,可以使用本地源码方式。
git clone https://github.com/Mriestac/mimo-image-recognition-mcp.git
cd mimo-image-recognition-mcpuv sync{
"mcpServers": {
"mimo-image-recognition": {
"command": "uv",
"args": [
"--directory",
"<你的项目路径>",
"run",
"mimo-image-recognition-mcp"
],
"env": {
"MIMO_API_KEY": "你的 MIMO API Key",
"MIMO_API_BASE": "https://token-plan-cn.xiaomimimo.com/v1",
"MIMO_MODEL": "mimo-v2.5"
}
}
}
}请把 <你的项目路径> 改成你自己本地项目的真实路径。
可以使用 MCP Inspector 调试:
uv run mcp dev src/mimo_image_recognition_mcp/server.py如果能看到:
understand_image
说明 MCP Server 启动成功。
如果你想在 MCP Inspector 中实际调用 MIMO 接口,可以在当前终端临时设置:
$env:MIMO_API_KEY="你的 MIMO API Key"
$env:MIMO_API_BASE="https://api.xiaomimimo.com/v1"
$env:MIMO_MODEL="mimo-v2.5"
uv run mcp dev src/mimo_image_recognition_mcp/server.pyMIT