RAG应用效果调优案例之——稳定输出上下文中的图片
  

王红伟94 1891

{{ttag.title}}
本帖最后由 王红伟94 于 2025-5-21 13:36 编辑



一、问题背景

在RAG应用中,经常需要对原始文档中的图片连同相关的文本一同输出在答案中,例如产品外观、设计图、尺寸图等,方便用户直接在答案中进行参考。

但用户往往碰到一些场景,例如:本来上下文中有图片,但是答案中却没有图片;或者答案中的图片不能正常显示出来。这些情况都非常影响用户的体验,导致用户还要再次回到原始文档中去获取图片内容。

我们基于AI PaaS平台在实际项目中的落地和效果优化经验,总结了以下方法,可以针对上述不输出图片的问题进行优化。

RAG应用输出的最终答案中是否带图片与文档有直接的关系,主要取决于这几个前提:用户原始文档中包含图片,图片描述和上下文具有语义关联;在构建知识库后,图片转成的URL地址和上下文在相同分片中,这样图片才能和上下文一起被召回。

示例1:原始文档有清晰的章节结构,图片与上下文切分在一个分片中
原始文档:

对应的分片信息:

示例2:原始文档没有明确的章节,图片与上下文语义关联比较弱

原始文档:

分片信息:

二、优化方法介绍
1. 大模型回答不展示图片,原因在于原始文档中的图片信息与上下文缺少语义关联。

排查方法:
先确认rerank(召回重排)的输出中是否带有图片数据。

在引用编排页面的预览调试,或者会话日志记录,都有类似下图所示的工作流输出,点击召回重排的内容查看。

确认是否有图片URL地址

如果rerank输出中没有图片URL信息:
● 检查期望输出的图片所在的切片是否有与问题相关的内容,由于知识库检索只能根据文本内容进行检索,如果没有包含与问题相关的文本,该切片是无法被检索到的。
解决办法:可以编辑该切片内容,加上相关关键字。如果原本文档里面有相关内容,但是切片中没有,可以添加一些与图片内容相关度较高的关键词。
示例,下图在原始分片中添加了“电气火灾监控系统架构图如下所示:"的文本信息。

原始切片:

● 如果图片所在切片包含相关内容,但是没有被检索出出来,则需要修改检索相关参数,例如提高召回个数、降低召回阈值等。示例如下:


2. 大模型对图片URL地址进行了篡改,导致图片不能正常显示
示例:

排查方法:确认分片中的图片URL地址与答案中的URL地址是否完全相同,如果不同,则说明是大模型在生成答案阶段对该分片中的URL地址进行了修改。

优化方法:修改大模型提示词,对输出内容限定做修改,在原始提示词中增加以下内容:
  1. - 如果背景知识中包含与问题相关的图片内容,请确保仅选择这些图片进行回答。
  2. - 输出图片时,必须保证使用背景知识中提供的图片地址,不得更改或生成其他地址。
  3. - 不允许自动生成背景知识中没有提供的图片信息
复制代码

这样通过精准限定提示词,就就能够缓解大模型在生成结果时,对图片的URL地址做修改。

打赏鼓励作者,期待更多好文!

打赏
暂无人打赏

发表新帖
热门标签
全部标签>
每日一问
标准化排查
【 社区to talk】
产品连连看
纪元平台
新版本体验
高手请过招
安装部署配置
功能体验
社区新周刊
技术笔记
信服课堂视频
sangfor周刊
平台使用
2024年技术争霸赛
GIF动图学习
畅聊IT
答题自测
专家问答
技术圆桌
在线直播
MVP
网络基础知识
升级
安全攻防
上网策略
测试报告
日志审计
问题分析处理
流量管理
每日一记
运维工具
用户认证
原创分享
解决方案
VPN 对接
项目案例
SANGFOR资讯
专家分享
技术顾问
信服故事
SDP百科
功能咨询
终端接入
授权
设备维护
资源访问
地址转换
虚拟机
存储
迁移
排障笔记本
产品预警公告
玩转零信任
S豆商城资讯
技术争霸赛
「智能机器人」
追光者计划
2023技术争霸赛专题
卧龙计划
华北区拉练
天逸直播
以战代练
秒懂零信任
技术晨报
技术盲盒
山东区技术晨报
文档捉虫
齐鲁TV
华北区交付直播
每周精选
北京区每日一练
场景专题
故障笔记
排障那些事
西北区每日一问
升级&主动服务
高频问题集锦
POC测试案例
全能先锋系列
安全效果
云化安全能力
专家说
热门活动
产品动态
行业实践
产品解析
关键解决方案

本版版主

8
4
2

发帖

粉丝

关注

3
5
0

发帖

粉丝

关注

0
1
0

发帖

粉丝

关注

28
9
1

发帖

粉丝

关注

1
0
0

发帖

粉丝

关注

本版达人