安装方式
命令行安装
在项目根目录执行以下命令,完成 Skill 安装。
npx bzskills add baizhicloud/skills --skill bz-image-analysis 当用户上传、引用或要求处理图片、截图、设计稿、页面截图、OCR、票据/商品/图表识别、视觉审查、页面还原或任何依赖视觉内容的任务时触发;必须优先使用百智云图片理解 MCP,按上传、创建任务、查询结果的流程完成分析,除非 MCP 明确失败或用户要求不用 MCP,否则不要用手工观察、内置视觉能力或 OCR 猜测替代。
10.1k
下载量
命令行安装
在项目根目录执行以下命令,完成 Skill 安装。
npx bzskills add baizhicloud/skills --skill bz-image-analysis name: "bz-image-analysis"
description: "当用户上传、引用或要求处理图片、截图、设计稿、页面截图、OCR、票据/商品/图表识别、视觉审查、页面还原或任何依赖视觉内容的任务时触发;必须优先使用百智云图片理解 MCP,按上传、创建任务、查询结果的流程完成分析,除非 MCP 明确失败或用户要求不用 MCP,否则不要用手工观察、内置视觉能力或 OCR 猜测替代。"百智云图片理解 MCP 是当前项目处理视觉输入的首选能力。它用于把图片、截图、设计稿、票据、图表、页面、商品图、头像、合同扫描件等视觉内容转成可用于后续推理和执行的文本结果。
image_analysis_create_task 已创建任务且尚未失败前,不要改用其他视觉能力。image_analysis_upload_url:为本地图片、聊天附件或工作区图片申请短期上传地址。输入 filename 和 content_type,返回 upload_url、method、headers 和最终可分析的 url。image_analysis_create_task:创建异步图片理解任务。输入模型服务可公网访问、host 为真实域名的公网 HTTP/HTTPS url,可选 prompt 和 model,返回 task_id。不要传 file://、localhost、裸 IP、内网地址、需要登录/VPN 的地址、相对路径或工作区路径;这些图片必须先上传。image_analysis_get_result:查询图片理解任务结果。输入 task_id,返回 done、status、text、error_message 等字段。image_analysis_upload_url。image_analysis_upload_url 返回的 method 和 headers,使用 curl 或 HTTP 客户端把图片二进制上传到 upload_url。url 调用 image_analysis_create_task。image_analysis_create_task。file://、localhost、裸 IP、内网地址、需要登录/VPN 的地址、相对路径或工作区路径,先按本地图片流程上传,不要直接传给 image_analysis_create_task。prompt。例如:描述图片内容、提取所有文字、识别票据信息、分析页面布局、判断是否有违规内容。image_analysis_get_result 查询结果。done=false 或 status 是 pending/running,继续动态等待后重试查询。status=succeeded,使用 text 字段回答用户,并结合用户任务继续执行后续工作。status=failed,向用户说明失败原因;只有在失败后,才考虑其他方案。请描述这张图片的内容。请提取图片中的所有文字,尽量保持原有顺序和层级。请识别图片中的票据信息,并提取关键字段和值。请分析页面布局、主要模块、交互状态和可见文案。请分析设计稿的布局、颜色、字体层级、间距和组件结构。请判断图片是否包含违规、敏感或不适宜内容,并说明依据。请识别图表类型、坐标含义、主要趋势、峰值和异常点。text 为事实基础,不要补充无法从图片中确定的细节。text 整理成表格、JSON、字段列表或步骤说明。content_type、文件路径、上传方法和 headers 是否正确。file://、localhost、裸 IP、内网地址、需要登录/VPN 的地址、相对路径或工作区路径必须先用 image_analysis_upload_url 上传。image_analysis_get_result 的时机。model,留空使用服务端默认模型。task_id。