很多企业都有供应商走查的需求。

比如商家入驻、仓库抽查、履约检查、门店巡检,现场人员会拍一段视频回来,企业再安排审核员复核。

审核员要看什么?

看仓库环境是否规范,货品摆放是否合理,标签有没有拍清楚,现场有没有明显风险,走查人员有没有覆盖关键点。

这件事听起来简单,真正做起来很耗人。

审核员要反复打开视频,快进、暂停、回看、截图,再根据 SOP 写审批报告。

视频少的时候,还能靠人工扛。

视频一多,问题就来了。

第一,费时间。

每条视频都要看,关键画面还要来回拖进度条。审核员真正花掉的时间,不只是在“看”,还在找证据。

第二,费精力。

同样一个风险点,不同人判断尺度可能不一样。有人觉得可以过,有人觉得需要复核。

第三,报告难写。

报告不能只写“有风险”,还要说清楚风险在哪里,截图是什么,对应哪一段视频,是否需要整改。

所以我后来做这个 Skill 的出发点很明确:

AI 先帮审核员把视频里的证据整理出来,最终判断仍然交给人。

我先拆的是审核员的工作习惯

我观察审核员复核视频时,发现他们并不是从头到尾平均看。

他们其实有一套固定顺序:

  • 先看现场环境;
  • 再看货品摆放;
  • 再看标签和物料;
  • 再看拍摄有没有覆盖关键区域;
  • 最后判断风险等级和是否需要人工复核。

这就是审核员的隐性技能。

平时它藏在人的经验里,只有老手自己知道。

要把它变成 Skill,第一步就是把这套经验拆出来。

我把它拆成四件事:

  1. 看什么:环境、货品、标签、通道、拍摄覆盖度。
  2. 怎么看:按 SOP 顺序检查,不随机扫视频。
  3. 怎么判:区分已发现问题、未见异常、证据不足、需要人工复核。
  4. 怎么写:把风险点、截图、时间线和整改建议整理成报告。

拆清楚以后,Agent 才知道自己该干什么。

把审核员经验拆成四层工作框架

这个 Skill 做了什么

直接把完整视频丢给模型,效果并不稳定。

视频太大,处理慢;视频太长,模型容易漏重点;如果只给一个结论,审核员也没法追溯证据。

所以我把流程改成了这样:

视频输入 -> 本地压缩 -> 抽帧切片 -> 证据拼图 -> Agent 识别 -> 汇总评级 -> 生成报告

视频复核 Skill 的处理流程图

这里面有几个关键动作。

先压缩视频,解决文件太大的问题。

再按时间抽帧,把长视频拆成一张张可追溯的证据图。

然后把多张截图合成证据拼图,减少模型调用次数,也方便按编号追踪。

接着让 Agent 按 SOP 看图,输出每一组画面的观察结果。

最后由总 Agent 汇总,给出风险点、证据截图、复核建议和报告内容。

审核员拿到的就不再是一堆视频,而是一份结构化报告。

他可以先看结论和证据,再决定哪些地方需要回看原视频。

这个变化很小,但对审核员很重要。

以前他的时间花在“从视频里找证据”。

现在他的时间可以更多花在“判断证据是否成立”。

这个 Skill 节约的是一整段重复劳动

我觉得这个场景最有意思的地方,是它没有试图把审核员拿掉。

企业走查、供应商审核、风控质检,这些事情最后都要有人负责。

AI 可以帮忙看,可以帮忙整理,可以帮忙生成初稿,但最终判断仍然需要人确认。

所以这个 Skill 的价值在于前置处理。

它把最耗时的部分先做掉:

  • 帮审核员抽出关键画面;
  • 帮审核员整理风险点;
  • 帮审核员保留截图证据;
  • 帮审核员生成报告初稿;
  • 帮审核员标出需要人工复核的地方。

这样一来,审核员不用从 0 开始看完整视频。

他只需要从报告和证据开始复核。

这就是我理解的“蒸馏同事技能”。

把同事每天重复做的判断动作拆出来,变成一套可执行流程。

它还能复用到更多企业现场场景

商家走查只是一个例子。

很多企业都有类似需求。

门店巡店,要看陈列、卫生、价格标签、活动物料、员工着装。

仓库抽查,要看货品摆放、通道占用、消防通道、标签规范。

工厂质检,要看设备状态、作业规范、物料位置、异常画面。

施工现场验收,要看安全帽、围挡、材料堆放、危险区域。

服务过程复核,要看双录视频、客服流程、培训考核、交付验收。

这些场景表面不同,底层流程很像:

现场视频 -> SOP 检查 -> 风险识别 -> 证据留存 -> 报告复核

换一个企业,只需要换三件事:

第一,换 SOP。

不同业务有不同检查项。

第二,换风险规则。

什么算轻微问题,什么算重大风险,什么必须人工复核,要按企业自己的标准来。

第三,换报告模板。

管理层、审核员、供应商、整改人,看的重点不一样。

把这三件事换掉,这套 Skill 就可以迁移。

视频复核 Skill 可迁移到更多企业现场场景

我的收获

这次做完以后,我对 Skill 的理解更实际了。

Skill 不是写一段很聪明的提示词。

它更像是把一个熟练员工的工作方法拆开:

  • 哪些步骤固定;
  • 哪些判断有标准;
  • 哪些地方需要证据;
  • 哪些环节必须交回给人。

拆清楚以后,Agent 才能真的帮上忙。

这个视频复核 Skill 最后做的事情也很朴素:

把审核员从“反复看视频、截图、写报告”的重复劳动里解放一部分出来。

让他把时间花在更重要的复核和判断上。

这可能就是很多企业 AI 落地最值得先做的地方。

不一定从宏大的智能系统开始。

先找一个员工每天都在重复做、又有明确判断标准的工作。

把它拆开,写成流程,再交给 Agent。

一个真正有用的职场 Skill,往往就是这样长出来的。