RAG开发落地求助, 佬友们救我救我

RAG开发落地求助, 佬友们救我救我
RAG开发落地求助, 佬友们救我救我

需要做一个 jsa工作安全风险分析助手 的rag

已经有的材料:

数百份 jsa工作安全风险分析.xsxl 的excel文件

需要达成的目的:

  1. 可以稳定的询问出已经存在的文档内容
  2. 当询问内容不存在时需要根据已有内容给出建议
  3. 需要按模板将建议再转换为 excel 文件, 然后再回到知识库中
  4. 需要根据用户会话区分, 不同用户有自己的上下文隔离

目前方案和打算:

  1. 使用dify的chatflow
  2. 计划流程为: 用户询问->意图识别->问题整理->rag检索->大模型总结->格式化输出
  3. 知识库使用父子分块

疑问:

  1. 父子切块如何切召回更合理? 目前按自己的理解写了脚本切块, 但是感觉怪怪的, 有没有佬救一下.
这是excel文件截图, 我将人名马赛克了 (点击了解更多详细信息) 这是我做的父子切块md文件, 大概思路就是按步骤切子分块 (点击了解更多详细信息) 这是dify中知识库内显示的切块 (点击了解更多详细信息)
  1. 是继续选择dify还是别的技术栈, 似乎chatflow的边界很难控制, 控制多了像人机, 控制少了不稳定.
  2. 这种rag怎么做基准测试? 有没有推荐的测试方案哇
  3. 计划流程是对的吗? 我也是到处找资料搞出来的
  4. 其实意图识别和问题整理我想要加入大模型来介入, 但是大模型如何多轮重入和工作流怎么画一点头绪没有

2 个帖子 - 2 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文