RAG应用效果调优案例之——稳定输出上下文中的图片
  

王红伟94 9983

{{ttag.title}}
本帖最后由 王红伟94 于 2025-5-21 13:36 编辑



一、问题背景

在RAG应用中,经常需要对原始文档中的图片连同相关的文本一同输出在答案中,例如产品外观、设计图、尺寸图等,方便用户直接在答案中进行参考。

但用户往往碰到一些场景,例如:本来上下文中有图片,但是答案中却没有图片;或者答案中的图片不能正常显示出来。这些情况都非常影响用户的体验,导致用户还要再次回到原始文档中去获取图片内容。

我们基于AI PaaS平台在实际项目中的落地和效果优化经验,总结了以下方法,可以针对上述不输出图片的问题进行优化。

RAG应用输出的最终答案中是否带图片与文档有直接的关系,主要取决于这几个前提:用户原始文档中包含图片,图片描述和上下文具有语义关联;在构建知识库后,图片转成的URL地址和上下文在相同分片中,这样图片才能和上下文一起被召回。

示例1:原始文档有清晰的章节结构,图片与上下文切分在一个分片中
原始文档:

对应的分片信息:

示例2:原始文档没有明确的章节,图片与上下文语义关联比较弱

原始文档:

分片信息:

二、优化方法介绍
1. 大模型回答不展示图片,原因在于原始文档中的图片信息与上下文缺少语义关联。

排查方法:
先确认rerank(召回重排)的输出中是否带有图片数据。

在引用编排页面的预览调试,或者会话日志记录,都有类似下图所示的工作流输出,点击召回重排的内容查看。

确认是否有图片URL地址

如果rerank输出中没有图片URL信息:
● 检查期望输出的图片所在的切片是否有与问题相关的内容,由于知识库检索只能根据文本内容进行检索,如果没有包含与问题相关的文本,该切片是无法被检索到的。
解决办法:可以编辑该切片内容,加上相关关键字。如果原本文档里面有相关内容,但是切片中没有,可以添加一些与图片内容相关度较高的关键词。
示例,下图在原始分片中添加了“电气火灾监控系统架构图如下所示:"的文本信息。

原始切片:

● 如果图片所在切片包含相关内容,但是没有被检索出出来,则需要修改检索相关参数,例如提高召回个数、降低召回阈值等。示例如下:


2. 大模型对图片URL地址进行了篡改,导致图片不能正常显示
示例:

排查方法:确认分片中的图片URL地址与答案中的URL地址是否完全相同,如果不同,则说明是大模型在生成答案阶段对该分片中的URL地址进行了修改。

优化方法:修改大模型提示词,对输出内容限定做修改,在原始提示词中增加以下内容:
  1. - 如果背景知识中包含与问题相关的图片内容,请确保仅选择这些图片进行回答。
  2. - 输出图片时,必须保证使用背景知识中提供的图片地址,不得更改或生成其他地址。
  3. - 不允许自动生成背景知识中没有提供的图片信息
复制代码

这样通过精准限定提示词,就就能够缓解大模型在生成结果时,对图片的URL地址做修改。

打赏鼓励作者,期待更多好文!

打赏
1人已打赏

发表新帖
热门标签
全部标签>
有一说一
纪元平台
功能体验
存储
专家分享
迁移
每日一问
GIF动图学习
每周精选
信服课堂视频
虚拟机
项目案例
地址转换
追光者计划
技术笔记
安全攻防
问题分析处理
流量管理
终端接入
「智能机器人」
专家说
声音值千金
工具体验官
解决方案
VPN 对接
标准化排查
答题自测
新版本体验
上网策略
资源访问
排障笔记本
产品预警公告
技术晨报
社区新周刊
升级
日志审计
设备维护
技术争霸赛
以战代练
场景专题
全能先锋系列
产品解析
产品连连看
功能咨询
秒懂零信任
文档捉虫
齐鲁TV
高频问题集锦
【 社区to talk】
云化安全能力
故障笔记
排障那些事
2025年技术争霸赛
安装部署配置
测试报告
SDP百科
山东区技术晨报
华北区交付直播
MVP
每日一记
运维工具
原创分享
sangfor周刊
SANGFOR资讯
授权
玩转零信任
升级&主动服务
行业实践
产品知识周周练
畅聊IT
专家问答
技术圆桌
在线直播
信服故事
卧龙计划
平台使用
技术盲盒
北京区每日一练
产品动态
用户认证
技术顾问
天逸直播
POC测试案例
安全效果
关键解决方案
S豆商城资讯
2023技术争霸赛专题
高手请过招
产品体验官
VMware替换
网络基础知识
华北区拉练
西北区每日一问
热门活动
2024年技术争霸赛

本版版主

8
11
2

发帖

粉丝

关注

2
7
0

发帖

粉丝

关注

0
3
0

发帖

粉丝

关注

36
18
1

发帖

粉丝

关注

1
1
0

发帖

粉丝

关注

本版达人