本帖最后由 徐金涛93 于 2025-4-8 22:58 编辑
2025年3月底,深信服刚刚发布了AIPaaS_1.0.3版本,我们梳理了产品部署应用的性能容量规格。
其中,重要的规格和影响如下: 1、内存系统资源达到80%,建议要扩容资源 2、默认规格,12C24G,支持30w分片和50个会话并发(切片大小1000分片的情况下,30w分片:约10G pdf【20M pdf ,约500分片】) 3、扩容cpu,内存,存储,需要后台脚本适配,见运维手册 4、知识库批量解析,单个纯文本的doc 不支持超过 20M,富文本不影响(带图片) 5、doc文档存在识别乱码的风险,不支持解析的版本,如果出现可以wps手动保存一下版本再重新解析。 6、知识增强使用大模型比较耗时,默认不开。适用场景(回答总结类的问题) 7、模型管理仅支持对接aicp 部署的模型 8、知识库暂不支持超过10000条的分片查询数据,超过接口会报错,不影响rag检索 9、使用大模型参数推荐,单轮对话,按AICP默认配置8K即可。多轮对话,3轮对话,需要调整到16K以上。
具体规格指标见表格(鼠标单击图片放大,如需查找细化内容,下载PDF附件文件):
|