×

深信服社区»版块 云计算类 AI应用创新平台 深信服IT部RAG问答机器人实践过程与技巧分享 ...

深信服IT部RAG问答机器人实践过程与技巧分享

查看数: 6295 | 评论数: 3 | 收藏 0
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2025-4-11 21:22

正文摘要:

本帖最后由 森林 于 2025-4-11 21:24 编辑 深信服IT部RAG问答机器人实践过程与技巧分享一、概述RAG(Retrieval-Augmented Generation)问答机器人是一种结合信息检索(Retrieval)与生成模型(Generation)的智能 ...

回复

sangfor020 发表于 2025-4-28 16:20
知识管理及问答系统的构建过程:
1.知识库的创建与文件内容入库:
  • 知识库创建步骤:首先创建一个知识库,并选择文本文档类型用于上传文件。
  • 文件上传及清洗:上传文件后进行关键配置,包括文件清洗。
  • 文件分片处理:为了适应LLM模型的上下文限制,文件需要分成多个片段,分片时要考虑切分方式、分片长度和重叠度。
  • 增强与清洗:对文档内容进行干扰内容或敏感内容的清洗,并开启知识增强策略提升检索准确性。

2.QA内容与企业网站入库:
  • FAQ问答对入库:创建FAQ知识库,下载示例文件并上传。
  • 企业网站内容读取:通过开发读取企业知识库或网站的数据库内容。
  • API接口与定时任务:调用API接口进行数据入库,并建议设置定时任务同步网站更新内容。


3.RAG问答应用创建与配置:
  • 创建RAG智能问答机器人:在应用中选择“智能RAG”类型创建问答机器人。
  • 知识检索配置:添加知识库并进行检索模式配置,包括语义检索、全文检索和混合检索。
  • 召回数量与重排模型:配置召回数量和召回阀值,并通过重排模型二次排序提高精确度。


4.LLM模型选择与效果调优:
  • 模型选择与提示词调整:选择合适的LLM模型并根据业务特色调整提示词。
  • 效果评估与调整:通过准备测试集和评估任务进行效果评估,并根据评估结果进行调整。
  • 会话日志与问答调优:通过应用会话日志分析用户提问和回答记录,针对性地进行调优。


5.问答机器人调优技巧:
  • 检索配置调整:增加召回数量,降低召回阀值以提升答案完整度。
  • 知识分片与QA优化:调整文件分片规则和清洗规则,扩写相似问和润色答案。
  • 提示词与近义词库:调整提示词,创建近义词库和专有名词库以提高模型理解能力。
  • 上下文关联与知识分类:使用上下文关联推理和知识分类提高回答准确性。
  • 生成子问题与用户引导:改写、拆分和替换用户问题生成子问题,并通过欢迎语和输入联想优化用户提问。

水之蓝色 发表于 2025-4-17 21:12
整理知识库是个枯燥的事情,还得靠人工整理,如果没有知识库,ai仅通过"检索+生成"双引擎,采集合成后展现问题答案,有时候不准确,有时候所答非所问,这一点很让人头疼。
_家宁 发表于 2025-4-13 00:18
分享很好,有助于工作