企业AI赋能案例(一):语音录入填充表单

企业AI赋能案例(一):语音录入填充表单
企业AI赋能案例(一):语音录入填充表单

分享一下自己工作中实际用到的可以用AI提效的案例


业务背景

制造业质检场景中,质检员在车间巡检时需要填写大量检验记录:工序名称、设备编号、检验数据、不合格描述等。车间环境嘈杂、手上可能还拿着各种工具,手动扣字输入效率极低,一张质检单填完要3-5分钟。

实现思路

整个链路分三段:

  1. 语音采集 → 浏览器 MediaRecorder / APP 原生录音,拿到音频文件
  2. ASR 语音转文字 → 调用语音识别模型,将音频转为纯文本
  3. LLM 结构化解析 → 将自然语言交给大语言模型,通过设计好的 prompt 指令,将口语化描述解析为表单字段对应的JSON结构,自动回填到表单

关键设计点:

  • prompt 中明确列出待提取字段、类型约束和返回格式,确保 LLM 输出稳定可解析
  • 不合格类别等下拉字段,把下拉列表直接放进 prompt,让 LLM 做模糊匹配
  • 语音回填的字段有视觉标识(绿色边框),方便质检员确认和修正
  • 一次语音可以描述多条不合格项,LLM 自动拆分逐条回填

实际效果

质检员按住按钮说一句"焊接工序,设备编号SB-003,检验编号JY-2024-056",3秒内三个字段自动填好。填写效率从单项1-2分钟降到20秒以内。

开发 Prompt

下面是 uni-app 的相关提示词,大家在用的时候改成自己实际项目;
复制下面的内容,把【】替换为实际信息即可。


Prompt (点击了解更多详细信息)

参考demo

改成html,demo中是用的火山引擎
demo.txt (11.3 KB)

1 个帖子 - 1 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文