企业AI赋能案例(一)：语音录入填充表单

发布时间：2026-06-01T19:20:05+08:00 阅读：0 分类：tech

企业AI赋能案例(一)：语音录入填充表单

分享一下自己工作中实际用到的可以用AI提效的案例

业务背景

制造业质检场景中，质检员在车间巡检时需要填写大量检验记录：工序名称、设备编号、检验数据、不合格描述等。车间环境嘈杂、手上可能还拿着各种工具，手动扣字输入效率极低，一张质检单填完要3-5分钟。

实现思路

整个链路分三段：

语音采集 → 浏览器 MediaRecorder / APP 原生录音，拿到音频文件
ASR 语音转文字 → 调用语音识别模型，将音频转为纯文本
LLM 结构化解析 → 将自然语言交给大语言模型，通过设计好的 prompt 指令，将口语化描述解析为表单字段对应的JSON结构，自动回填到表单

关键设计点：

prompt 中明确列出待提取字段、类型约束和返回格式，确保 LLM 输出稳定可解析
不合格类别等下拉字段，把下拉列表直接放进 prompt，让 LLM 做模糊匹配
语音回填的字段有视觉标识（绿色边框），方便质检员确认和修正
一次语音可以描述多条不合格项，LLM 自动拆分逐条回填

实际效果

质检员按住按钮说一句"焊接工序，设备编号SB-003，检验编号JY-2024-056"，3秒内三个字段自动填好。填写效率从单项1-2分钟降到20秒以内。

开发 Prompt

下面是 uni-app 的相关提示词，大家在用的时候改成自己实际项目；
复制下面的内容，把【】替换为实际信息即可。

Prompt （点击了解更多详细信息）

参考demo

改成html，demo中是用的火山引擎
demo.txt (11.3 KB)

1 个帖子 - 1 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文