环境版本信息: HCI:6.10.0R2、VDC:5.9.1R2、虚拟机:Win10、显卡:RTX6000 问题描述: 客户环境物理服务器上有显卡,且之前给虚拟机使用过该显卡运行其他分析软件,后来客户考虑到部分不用显卡的用户挂载着显卡属于浪费,于是客户就将不用的给回收掉了。现在做仿真需要安装CUDA提示需要装英伟达的显卡,客户在添加编辑网卡时添加硬件里没有显卡的选项。 排查步骤: 1. 检查服务器上显卡是否正常 2. 检查已挂载显卡虚拟机是否正常 3. 检查虚拟机显卡驱动版本、服务器显卡驱动版本是否和超融合版本对标 4. 检查同模板下其他未挂载显卡的虚拟机是否支持添加显卡 5. 检查不同模板所派生出来的未挂载显卡的虚拟机是否支持添加显卡 6. 创建全新的模板并派生虚拟机进行添加显卡测试 7. 检查显卡型号是否存在限制 8. 检查虚拟机高级设置里是否开启了Q35主板 问题根因: 1. 在VDI场景下RTX6000、RTX8000原来不支持直通,后面在版本过程中发现VDI的3D虚拟机使用RTX6000和RTX8000在Q35主板上会有问题,所以就做了页面限制。 2. [2023080300043]【需求】【系统阶段处理】【李星通知暂停编码】【老功能】HCI上适用RTX系列显卡,3D虚拟机在配置直通显卡后,后台会默认修改为适用Q35主板,无法再配置为使用vGPU,此场景对VDI业务存在影响 总之就是在后台做了限制,新版本RTX系列显卡和Q35主板存在互斥的属性,开启其中一个另一个就用不了【Q35主板只有创建的时候才可以开启,创建完成后不支持开启该选项】 解决方案: 1.把开启Q35主板需要添加显卡的虚拟机打个快照 2.登录HCI找到无法添加显卡的虚拟机点击控制台查看虚拟机ID 3.使用后台共计登录超融合后台,然后查看虚拟机文件路径 find /cfs/ -name vmid.conf 4.进入虚拟机更改虚拟机文件信息 vim 粘贴查到的虚拟机文件路径 5. 进入虚拟机文件后按a开始编辑,输入光标跳转到Q35这一行按两下D键,然后保存。 6. 保存之后返回HCI控制台,找到编辑的虚拟机点击高级设置查看Q35主板是否已关闭 7. 确认关闭后在返回添加硬件的位置添加显卡即可 附: 1、搭建测试虚拟机时不涉及内部系统时可以不安装系统节约时间,按如下操作步骤即可 2后台备份虚拟机文件 find / -name *对应虚拟机vmid.conf* 然后cp 对应第一步查询到的对应虚拟机的vmid.conf文件到/sf/data/local下
3.相关类似案例
|