安装方式

命令行安装

在项目根目录执行以下命令，完成 Skill 安装。

npx bzskills add MiniMax-AI/skills --skill vision-analysis

ZIP 包安装

点击下方按钮下载 ZIP 包，并解压到本地 Skills 目录。

下载 ZIP 包 →

# 下载 vision-analysis.zip
unzip vision-analysis.zip -d ./skills

skill.md

name: vision-analysis
description: 使用 MiniMax vision MCP 工具对图像进行分析、描述和信息提取。在以下情况下使用：用户分享图像文件路径或 URL（任何包含 .jpg、.jpeg、.png、.gif、.webp、.bmp 或 .svg 文件扩展名的消息），或者在图像附近使用以下任何词语或短语：“分析”、“描述”、“解释”、“理解”、“查看”、“审查”、“提取文本”、“OCR”、“里面是什么”、“什么在里面”、“读取此图像”、“查看此图像”、“告诉我关于”、“解释这个”、“解读这个”，且与图像、截图、图表、图形、原型、线框图或照片相关。也适用于：UI 原型审查、线框图分析、设计评论、从图表中提取数据、对象检测、人物/动物/活动识别。触发条件：任何包含图像文件扩展名（jpg、jpeg、png、gif、webp、bmp、svg）的消息，或任何要求对图像、截图、图表、图形、照片、原型或线框图进行分析/描述/理解/审查/提取文本的请求。
license: MIT
metadata:
    version: "1.0"
    category: ai-vision
    sources:
        - MiniMax Token Plan MCP (understand_image tool)

视觉分析

使用 MiniMax Token Plan 中可用的 MiniMax MiniMax_understand_image MCP 工具分析图像。

前提条件

拥有有效 MINIMAX_API_KEY 的 MiniMax Token Plan 订阅
已配置 MiniMax MCP（MiniMax_understand_image 工具可用）

如果 MCP 工具未配置

第 1 步： 代理应从以下地址获取设置指南：

https://platform.minimaxi.com/docs/token-plan/mcp-guide

第 2 步： 检测用户的环境（OpenCode、Cursor、Claude Code 等）并输出所需的命令。常见示例：

OpenCode — 添加到 ~/.config/opencode/opencode.json 或 package.json：

{
  "mcp": {
    "MiniMax": {
      "type": "local",
      "command": ["uvx", "minimax-coding-plan-mcp", "-y"],
      "environment": {
        "MINIMAX_API_KEY": "YOUR_TOKEN_PLAN_KEY",
        "MINIMAX_API_HOST": "https://api.minimaxi.com"
      },
      "enabled": true
    }
  }
}

Claude Code：

claude mcp add -s user MiniMax --env MINIMAX_API_KEY=your-key --env MINIMAX_API_HOST=https://api.minimaxi.com -- uvx minimax-coding-plan-mcp -y

Cursor — 添加到 MCP 设置：

{
  "mcpServers": {
    "MiniMax": {
      "command": "uvx",
      "args": ["minimax-coding-plan-mcp"],
      "env": {
        "MINIMAX_API_KEY": "your-key",
        "MINIMAX_API_HOST": "https://api.minimaxi.com"
      }
    }
  }
}

第 3 步： 配置完成后，告知用户重启应用并使用 /mcp 验证。

重要提示： 如果用户没有 MiniMax Token Plan 订阅，请告知他们 understand_image 工具需要该订阅——无法使用免费或其他层级 API 密钥。

分析模式

模式	使用时机	提示策略
`describe`	通用图像理解	请求详细描述
`ocr`	从截图、文档中提取文字	请求逐字提取所有文字
`ui-review`	UI 设计稿、线框图、设计文件	请求设计评审并给出建议
`chart-data`	图表、图形、数据可视化	请求提取数据点和趋势
`object-detect`	识别物体、人物、活动	请求列出并定位所有元素

工作流程

第 1 步：自动检测图像

当消息中包含图片文件路径或 URL（扩展名为：.jpg、.jpeg、.png、.gif、.webp、.bmp、.svg）时，该技能自动触发。

从消息中提取图像路径。

第 2 步：选择分析模式并调用 MCP 工具

使用 MiniMax_understand_image 工具，并传入针对特定模式的提示：

describe：

请详细描述这张图片。包括：主要对象、环境/背景、色彩/风格、任何可见文字、显著物体以及整体构图。

ocr：

请逐字提取图片中所有可见的文字。保持结构和格式（标题、列表、列）。如果未发现文字，请说明。

ui-review：

你是一位 UI/UX 设计评审专家。请分析此界面设计稿或设计。提供：
(1) 优势——哪些地方做得好，(2) 问题——可用性或设计问题，
(3) 具体、可操作且详细的改进建议。

chart-data：

请提取此图表中的所有数据。列出：图表标题、坐标轴标签、所有数据点/序列及其数值（如可读），以及趋势简要总结。

object-detect：

请列出你识别出的所有不同物体、人物和活动。对每个元素，描述其是什么以及大致在图片中的位置。

第 3 步：呈现结果

清晰返回分析结果。对于 describe 模式，使用可读的叙述文本。对于 ocr 模式，保留结构。对于 ui-review 模式，使用结构化的评审格式。

输出格式示例

对于 describe 模式：

## 图像描述

[图像的详细描述内容...]

对于 ocr 模式：

## 提取的文字

[图片中保留的文字结构]

对于 ui-review 模式：

## UI 设计评审

### 优势
- ...

### 问题
- ...

### 建议
- ...

注意事项

支持最大 20MB 的图片（JPEG、PNG、GIF、WebP）
如果 MiniMax MCP 已配置文件访问权限，则支持本地文件路径
MiniMax_understand_image 工具由 minimax-coding-plan-mcp 软件包提供