安装方式
命令行安装
在项目根目录执行以下命令,完成 Skill 安装。
npx bzskills add MiniMax-AI/skills --skill vision-analysis 使用 MiniMax vision MCP 工具对图像进行分析、描述和信息提取。在以下情况下使用:用户分享图像文件路径或 URL(任何包含 .jpg、.jpeg、.png、.gif、.webp、.bmp 或 .svg 文件扩展名的消息),或者在图像附近使用以下任何词语或短语:“分析”、“描述”、“解释”、“理解”、“查看”、“审查”、“提取文本”、“OCR”、“里面是什么”、“什么在里面”、“读取此图像”、“查看此图像”、“告诉我关于”、“解释这个”、“解读这个”,且与图像、截图、图表、图形、原型、线框图或照片相关。也适用于:UI 原型审查、线框图分析、设计评论、从图表中提取数据、对象检测、人物/动物/活动识别。触发条件:任何包含图像文件扩展名(jpg、jpeg、png、gif、webp、bmp、svg)的消息,或任何要求对图像、截图、图表、图形、照片、原型或线框图进行分析/描述/理解/审查/提取文本的请求。
41
下载量
命令行安装
在项目根目录执行以下命令,完成 Skill 安装。
npx bzskills add MiniMax-AI/skills --skill vision-analysis name: vision-analysis
description: 使用 MiniMax vision MCP 工具对图像进行分析、描述和信息提取。在以下情况下使用:用户分享图像文件路径或 URL(任何包含 .jpg、.jpeg、.png、.gif、.webp、.bmp 或 .svg 文件扩展名的消息),或者在图像附近使用以下任何词语或短语:“分析”、“描述”、“解释”、“理解”、“查看”、“审查”、“提取文本”、“OCR”、“里面是什么”、“什么在里面”、“读取此图像”、“查看此图像”、“告诉我关于”、“解释这个”、“解读这个”,且与图像、截图、图表、图形、原型、线框图或照片相关。也适用于:UI 原型审查、线框图分析、设计评论、从图表中提取数据、对象检测、人物/动物/活动识别。触发条件:任何包含图像文件扩展名(jpg、jpeg、png、gif、webp、bmp、svg)的消息,或任何要求对图像、截图、图表、图形、照片、原型或线框图进行分析/描述/理解/审查/提取文本的请求。
license: MIT
metadata:
version: "1.0"
category: ai-vision
sources:
- MiniMax Token Plan MCP (understand_image tool)使用 MiniMax Token Plan 中可用的 MiniMax MiniMax_understand_image MCP 工具分析图像。
MINIMAX_API_KEY 的 MiniMax Token Plan 订阅MiniMax_understand_image 工具可用)第 1 步: 代理应从以下地址获取设置指南:
https://platform.minimaxi.com/docs/token-plan/mcp-guide
第 2 步: 检测用户的环境(OpenCode、Cursor、Claude Code 等)并输出所需的命令。常见示例:
OpenCode — 添加到 ~/.config/opencode/opencode.json 或 package.json:
{
"mcp": {
"MiniMax": {
"type": "local",
"command": ["uvx", "minimax-coding-plan-mcp", "-y"],
"environment": {
"MINIMAX_API_KEY": "YOUR_TOKEN_PLAN_KEY",
"MINIMAX_API_HOST": "https://api.minimaxi.com"
},
"enabled": true
}
}
}
Claude Code:
claude mcp add -s user MiniMax --env MINIMAX_API_KEY=your-key --env MINIMAX_API_HOST=https://api.minimaxi.com -- uvx minimax-coding-plan-mcp -y
Cursor — 添加到 MCP 设置:
{
"mcpServers": {
"MiniMax": {
"command": "uvx",
"args": ["minimax-coding-plan-mcp"],
"env": {
"MINIMAX_API_KEY": "your-key",
"MINIMAX_API_HOST": "https://api.minimaxi.com"
}
}
}
}
第 3 步: 配置完成后,告知用户重启应用并使用 /mcp 验证。
重要提示: 如果用户没有 MiniMax Token Plan 订阅,请告知他们 understand_image 工具需要该订阅——无法使用免费或其他层级 API 密钥。
| 模式 | 使用时机 | 提示策略 |
|---|---|---|
describe | 通用图像理解 | 请求详细描述 |
ocr | 从截图、文档中提取文字 | 请求逐字提取所有文字 |
ui-review | UI 设计稿、线框图、设计文件 | 请求设计评审并给出建议 |
chart-data | 图表、图形、数据可视化 | 请求提取数据点和趋势 |
object-detect | 识别物体、人物、活动 | 请求列出并定位所有元素 |
当消息中包含图片文件路径或 URL(扩展名为:.jpg、.jpeg、.png、.gif、.webp、.bmp、.svg)时,该技能自动触发。
从消息中提取图像路径。
使用 MiniMax_understand_image 工具,并传入针对特定模式的提示:
describe:
请详细描述这张图片。包括:主要对象、环境/背景、色彩/风格、任何可见文字、显著物体以及整体构图。
ocr:
请逐字提取图片中所有可见的文字。保持结构和格式(标题、列表、列)。如果未发现文字,请说明。
ui-review:
你是一位 UI/UX 设计评审专家。请分析此界面设计稿或设计。提供:
(1) 优势——哪些地方做得好,(2) 问题——可用性或设计问题,
(3) 具体、可操作且详细的改进建议。
chart-data:
请提取此图表中的所有数据。列出:图表标题、坐标轴标签、所有数据点/序列及其数值(如可读),以及趋势简要总结。
object-detect:
请列出你识别出的所有不同物体、人物和活动。对每个元素,描述其是什么以及大致在图片中的位置。
清晰返回分析结果。对于 describe 模式,使用可读的叙述文本。对于 ocr 模式,保留结构。对于 ui-review 模式,使用结构化的评审格式。
对于 describe 模式:
## 图像描述
[图像的详细描述内容...]
对于 ocr 模式:
## 提取的文字
[图片中保留的文字结构]
对于 ui-review 模式:
## UI 设计评审
### 优势
- ...
### 问题
- ...
### 建议
- ...
MiniMax_understand_image 工具由 minimax-coding-plan-mcp 软件包提供