返回全部 Skills

vision-analysis

产品设计 官方认证

使用 MiniMax vision MCP 工具对图像进行分析、描述和信息提取。在以下情况下使用:用户分享图像文件路径或 URL(任何包含 .jpg、.jpeg、.png、.gif、.webp、.bmp 或 .svg 文件扩展名的消息),或者在图像附近使用以下任何词语或短语:“分析”、“描述”、“解释”、“理解”、“查看”、“审查”、“提取文本”、“OCR”、“里面是什么”、“什么在里面”、“读取此图像”、“查看此图像”、“告诉我关于”、“解释这个”、“解读这个”,且与图像、截图、图表、图形、原型、线框图或照片相关。也适用于:UI 原型审查、线框图分析、设计评论、从图表中提取数据、对象检测、人物/动物/活动识别。触发条件:任何包含图像文件扩展名(jpg、jpeg、png、gif、webp、bmp、svg)的消息,或任何要求对图像、截图、图表、图形、照片、原型或线框图进行分析/描述/理解/审查/提取文本的请求。

41

下载量

AI SkillHub 能力展示图

安装方式

命令行安装

在项目根目录执行以下命令,完成 Skill 安装。

npx bzskills add MiniMax-AI/skills --skill vision-analysis

skill.md

name: vision-analysis
description: 使用 MiniMax vision MCP 工具对图像进行分析、描述和信息提取。在以下情况下使用:用户分享图像文件路径或 URL(任何包含 .jpg、.jpeg、.png、.gif、.webp、.bmp 或 .svg 文件扩展名的消息),或者在图像附近使用以下任何词语或短语:“分析”、“描述”、“解释”、“理解”、“查看”、“审查”、“提取文本”、“OCR”、“里面是什么”、“什么在里面”、“读取此图像”、“查看此图像”、“告诉我关于”、“解释这个”、“解读这个”,且与图像、截图、图表、图形、原型、线框图或照片相关。也适用于:UI 原型审查、线框图分析、设计评论、从图表中提取数据、对象检测、人物/动物/活动识别。触发条件:任何包含图像文件扩展名(jpg、jpeg、png、gif、webp、bmp、svg)的消息,或任何要求对图像、截图、图表、图形、照片、原型或线框图进行分析/描述/理解/审查/提取文本的请求。
license: MIT
metadata:
    version: "1.0"
    category: ai-vision
    sources:
        - MiniMax Token Plan MCP (understand_image tool)

视觉分析

使用 MiniMax Token Plan 中可用的 MiniMax MiniMax_understand_image MCP 工具分析图像。

前提条件

  • 拥有有效 MINIMAX_API_KEY 的 MiniMax Token Plan 订阅
  • 已配置 MiniMax MCP(MiniMax_understand_image 工具可用)

如果 MCP 工具未配置

第 1 步: 代理应从以下地址获取设置指南:

https://platform.minimaxi.com/docs/token-plan/mcp-guide

第 2 步: 检测用户的环境(OpenCode、Cursor、Claude Code 等)并输出所需的命令。常见示例:

OpenCode — 添加到 ~/.config/opencode/opencode.jsonpackage.json

{
  "mcp": {
    "MiniMax": {
      "type": "local",
      "command": ["uvx", "minimax-coding-plan-mcp", "-y"],
      "environment": {
        "MINIMAX_API_KEY": "YOUR_TOKEN_PLAN_KEY",
        "MINIMAX_API_HOST": "https://api.minimaxi.com"
      },
      "enabled": true
    }
  }
}

Claude Code

claude mcp add -s user MiniMax --env MINIMAX_API_KEY=your-key --env MINIMAX_API_HOST=https://api.minimaxi.com -- uvx minimax-coding-plan-mcp -y

Cursor — 添加到 MCP 设置:

{
  "mcpServers": {
    "MiniMax": {
      "command": "uvx",
      "args": ["minimax-coding-plan-mcp"],
      "env": {
        "MINIMAX_API_KEY": "your-key",
        "MINIMAX_API_HOST": "https://api.minimaxi.com"
      }
    }
  }
}

第 3 步: 配置完成后,告知用户重启应用并使用 /mcp 验证。

重要提示: 如果用户没有 MiniMax Token Plan 订阅,请告知他们 understand_image 工具需要该订阅——无法使用免费或其他层级 API 密钥。

分析模式

模式使用时机提示策略
describe通用图像理解请求详细描述
ocr从截图、文档中提取文字请求逐字提取所有文字
ui-reviewUI 设计稿、线框图、设计文件请求设计评审并给出建议
chart-data图表、图形、数据可视化请求提取数据点和趋势
object-detect识别物体、人物、活动请求列出并定位所有元素

工作流程

第 1 步:自动检测图像

当消息中包含图片文件路径或 URL(扩展名为:.jpg.jpeg.png.gif.webp.bmp.svg)时,该技能自动触发。

从消息中提取图像路径。

第 2 步:选择分析模式并调用 MCP 工具

使用 MiniMax_understand_image 工具,并传入针对特定模式的提示:

describe:

请详细描述这张图片。包括:主要对象、环境/背景、色彩/风格、任何可见文字、显著物体以及整体构图。

ocr:

请逐字提取图片中所有可见的文字。保持结构和格式(标题、列表、列)。如果未发现文字,请说明。

ui-review:

你是一位 UI/UX 设计评审专家。请分析此界面设计稿或设计。提供:
(1) 优势——哪些地方做得好,(2) 问题——可用性或设计问题,
(3) 具体、可操作且详细的改进建议。

chart-data:

请提取此图表中的所有数据。列出:图表标题、坐标轴标签、所有数据点/序列及其数值(如可读),以及趋势简要总结。

object-detect:

请列出你识别出的所有不同物体、人物和活动。对每个元素,描述其是什么以及大致在图片中的位置。

第 3 步:呈现结果

清晰返回分析结果。对于 describe 模式,使用可读的叙述文本。对于 ocr 模式,保留结构。对于 ui-review 模式,使用结构化的评审格式。

输出格式示例

对于 describe 模式:

## 图像描述

[图像的详细描述内容...]

对于 ocr 模式:

## 提取的文字

[图片中保留的文字结构]

对于 ui-review 模式:

## UI 设计评审

### 优势
- ...

### 问题
- ...

### 建议
- ...

注意事项

  • 支持最大 20MB 的图片(JPEG、PNG、GIF、WebP)
  • 如果 MiniMax MCP 已配置文件访问权限,则支持本地文件路径
  • MiniMax_understand_image 工具由 minimax-coding-plan-mcp 软件包提供