我把审核员的视频复核经验，蒸馏成了一个 Skill

很多企业都有供应商走查的需求。

比如商家入驻、仓库抽查、履约检查、门店巡检，现场人员会拍一段视频回来，企业再安排审核员复核。

审核员要看什么？

看仓库环境是否规范，货品摆放是否合理，标签有没有拍清楚，现场有没有明显风险，走查人员有没有覆盖关键点。

这件事听起来简单，真正做起来很耗人。

审核员要反复打开视频，快进、暂停、回看、截图，再根据 SOP 写审批报告。

视频少的时候，还能靠人工扛。

视频一多，问题就来了。

第一，费时间。

每条视频都要看，关键画面还要来回拖进度条。审核员真正花掉的时间，不只是在“看”，还在找证据。

第二，费精力。

同样一个风险点，不同人判断尺度可能不一样。有人觉得可以过，有人觉得需要复核。

第三，报告难写。

报告不能只写“有风险”，还要说清楚风险在哪里，截图是什么，对应哪一段视频，是否需要整改。

所以我后来做这个 Skill 的出发点很明确：

AI 先帮审核员把视频里的证据整理出来，最终判断仍然交给人。

我先拆的是审核员的工作习惯

我观察审核员复核视频时，发现他们并不是从头到尾平均看。

他们其实有一套固定顺序：

先看现场环境；
再看货品摆放；
再看标签和物料；
再看拍摄有没有覆盖关键区域；
最后判断风险等级和是否需要人工复核。

这就是审核员的隐性技能。

平时它藏在人的经验里，只有老手自己知道。

要把它变成 Skill，第一步就是把这套经验拆出来。

我把它拆成四件事：

看什么：环境、货品、标签、通道、拍摄覆盖度。
怎么看：按 SOP 顺序检查，不随机扫视频。
怎么判：区分已发现问题、未见异常、证据不足、需要人工复核。
怎么写：把风险点、截图、时间线和整改建议整理成报告。

拆清楚以后，Agent 才知道自己该干什么。

把审核员经验拆成四层工作框架

这个 Skill 做了什么

直接把完整视频丢给模型，效果并不稳定。

视频太大，处理慢；视频太长，模型容易漏重点；如果只给一个结论，审核员也没法追溯证据。

所以我把流程改成了这样：

视频输入 -> 本地压缩 -> 抽帧切片 -> 证据拼图 -> Agent 识别 -> 汇总评级 -> 生成报告

视频复核 Skill 的处理流程图

这里面有几个关键动作。

先压缩视频，解决文件太大的问题。

再按时间抽帧，把长视频拆成一张张可追溯的证据图。

然后把多张截图合成证据拼图，减少模型调用次数，也方便按编号追踪。

接着让 Agent 按 SOP 看图，输出每一组画面的观察结果。

最后由总 Agent 汇总，给出风险点、证据截图、复核建议和报告内容。

审核员拿到的就不再是一堆视频，而是一份结构化报告。

他可以先看结论和证据，再决定哪些地方需要回看原视频。

这个变化很小，但对审核员很重要。

以前他的时间花在“从视频里找证据”。

现在他的时间可以更多花在“判断证据是否成立”。

这个 Skill 节约的是一整段重复劳动

我觉得这个场景最有意思的地方，是它没有试图把审核员拿掉。

企业走查、供应商审核、风控质检，这些事情最后都要有人负责。

AI 可以帮忙看，可以帮忙整理，可以帮忙生成初稿，但最终判断仍然需要人确认。

所以这个 Skill 的价值在于前置处理。

它把最耗时的部分先做掉：

帮审核员抽出关键画面；
帮审核员整理风险点；
帮审核员保留截图证据；
帮审核员生成报告初稿；
帮审核员标出需要人工复核的地方。

这样一来，审核员不用从 0 开始看完整视频。

他只需要从报告和证据开始复核。

这就是我理解的“蒸馏同事技能”。

把同事每天重复做的判断动作拆出来，变成一套可执行流程。

它还能复用到更多企业现场场景

商家走查只是一个例子。

很多企业都有类似需求。

门店巡店，要看陈列、卫生、价格标签、活动物料、员工着装。

仓库抽查，要看货品摆放、通道占用、消防通道、标签规范。

工厂质检，要看设备状态、作业规范、物料位置、异常画面。

施工现场验收，要看安全帽、围挡、材料堆放、危险区域。

服务过程复核，要看双录视频、客服流程、培训考核、交付验收。

这些场景表面不同，底层流程很像：

现场视频 -> SOP 检查 -> 风险识别 -> 证据留存 -> 报告复核

换一个企业，只需要换三件事：

第一，换 SOP。

不同业务有不同检查项。

第二，换风险规则。

什么算轻微问题，什么算重大风险，什么必须人工复核，要按企业自己的标准来。

第三，换报告模板。

管理层、审核员、供应商、整改人，看的重点不一样。

把这三件事换掉，这套 Skill 就可以迁移。

视频复核 Skill 可迁移到更多企业现场场景

我的收获

这次做完以后，我对 Skill 的理解更实际了。

Skill 不是写一段很聪明的提示词。

它更像是把一个熟练员工的工作方法拆开：

哪些步骤固定；
哪些判断有标准；
哪些地方需要证据；
哪些环节必须交回给人。

拆清楚以后，Agent 才能真的帮上忙。

这个视频复核 Skill 最后做的事情也很朴素：

把审核员从“反复看视频、截图、写报告”的重复劳动里解放一部分出来。

让他把时间花在更重要的复核和判断上。

这可能就是很多企业 AI 落地最值得先做的地方。

不一定从宏大的智能系统开始。

先找一个员工每天都在重复做、又有明确判断标准的工作。

把它拆开，写成流程，再交给 Agent。

一个真正有用的职场 Skill，往往就是这样长出来的。