分享一下自己工作中实际用到的可以用AI提效的案例
业务背景
制造业质检场景中,质检员在车间巡检时需要填写大量检验记录:工序名称、设备编号、检验数据、不合格描述等。车间环境嘈杂、手上可能还拿着各种工具,手动扣字输入效率极低,一张质检单填完要3-5分钟。
实现思路
整个链路分三段:
- 语音采集 → 浏览器 MediaRecorder / APP 原生录音,拿到音频文件
- ASR 语音转文字 → 调用语音识别模型,将音频转为纯文本
- LLM 结构化解析 → 将自然语言交给大语言模型,通过设计好的 prompt 指令,将口语化描述解析为表单字段对应的JSON结构,自动回填到表单
关键设计点:
- prompt 中明确列出待提取字段、类型约束和返回格式,确保 LLM 输出稳定可解析
- 不合格类别等下拉字段,把下拉列表直接放进 prompt,让 LLM 做模糊匹配
- 语音回填的字段有视觉标识(绿色边框),方便质检员确认和修正
- 一次语音可以描述多条不合格项,LLM 自动拆分逐条回填
实际效果
质检员按住按钮说一句"焊接工序,设备编号SB-003,检验编号JY-2024-056",3秒内三个字段自动填好。填写效率从单项1-2分钟降到20秒以内。
开发 Prompt
下面是 uni-app 的相关提示词,大家在用的时候改成自己实际项目;
复制下面的内容,把【】替换为实际信息即可。
Prompt (点击了解更多详细信息)
参考demo
改成html,demo中是用的火山引擎
demo.txt (11.3 KB)
1 个帖子 - 1 位参与者