本帖最后由 999的demo 于 2024-8-5 00:42 编辑
3D虚拟机部署场景,需要提前准备好3D授权服务器镜像、HCI主机显卡驱动、3D虚拟机显卡驱动 授权服务器版本 目前授权服务器分为旧授权服务器和DLS授权服务器(旧授权服务器将在2023年7月EOL,届时NVIDIA将不提供任何技术支持,也不支持在此服务器增加或缩减授权) 因此目前在部署时授权服务器都采用新的DLS服务器来进行部署 注意事项: 11.1的显卡驱动不支持DLS部署,使用Grid11.1驱动时只能使用旧授权服务器授权(旧授权服务器最大能够支持为13.2的显卡驱动授权) 从Grid13.2之后,不再支持Wind7;若必须使用Win7 3D桌面,则只能使用Grid11.1驱动 旧授权服务器的授权是基于设备的MAC地址授权的,新的DLS服务器是根据服务器设备信息来授权的 不同VDI版本虚拟机/HCI安装的显卡驱动 从VDI5.5.2版本开始,对于3D交付项目优先使用Grid 13.2驱动,NVIDIA授权服务器优先采用新的DLS服务器
GPU HCI需要开通的授权 如果只是显卡直通给虚拟机,则只需要开通HCI的aGPU授权就可以
如果使用vGPU的切分场景,则需要同事开通aGPU的授权和英伟达vGPU授权(包括vCS、vDWS、EDU) 即需要给3D授权服务器授权(下载3D授权服务器的token,然后去英伟达申请授权) vCS: 面向AI和科学计算场景(vCS不支持Windows虚拟机,最小切割粒度为4G,最大为32G) vDWS: 面向工作站的用户,用于专业图形和计算场景,会发挥出GPU的全部实力 EDU: 面向教育场景销售的VDWS授权,实际功能与vDWS一致,只是价格低一点 VPC: 面向普通办公场景,可配置的单桌面显存上限为2GB vApp: 虚拟应用/共享桌面场景 注意事项 l 超融合平台上已经分配显卡的虚拟机不再支持热迁移 l 单台服务器禁止使用两个不同型号的显卡,同集群的不同主机可以支持使用不同型号的GPU l 当A、B两张显卡插在紧邻着的两个PCIE插槽时,如果B显卡存在核心损坏时,显卡B的核心会被识别为显卡A的,因此需要及时更换显卡 l 并不是所有的显卡都支持vGPU,对于不支持vGPU的显卡可以使用直通模式 l 不论是直通场景还是vGPU场景,虚拟机必须安装和HCI平台对应版本的英伟达显卡驱动(不过对于直通场景的显卡驱动需要从英伟达官网下载 官方驱动 | NVIDIA)
3D显卡的两种分配方式 3D显卡支持直通分配和切分分配给虚拟机,单台显卡无法同时支持切分和直通 3D显卡直通分配(对显卡无虚拟化的要求) 将显卡1:1映射到虚拟机中,使得虚拟机能够直接使用物理GPU的功能和性能(适用于高性能计算和图像处理等场景) 每个GPU只能透传给一个虚拟机使用,无法同时让多个虚拟机使用,也无法透传给其它物理主机上的虚拟机使用 3D显卡切分分配 一个核心只有一种切分方式(例如英伟达A16是4个核心,那就可以有4种切分方式)
vGPU切分相关知识 在vGPU场景下,显卡的显存资源师分配且独占的,显卡的计算资源会依据调度器进行调度,该版本支持三种调度器:抢占、等分、固定配比 抢占(Best Eddort):当多虚拟机运行在该显卡时,会根据工作负载情况抢占算力资源; 等分(Equal Share):当多虚拟机运行在该显卡时,会均分算力资源 固定配比(FixedShare):当多虚拟机运行在该显卡时,会依据虚拟机所配置的显存比例来分配算力资源 显卡分配的两种模式 密度模式——适用于存在多种虚拟显卡类型虚拟机经常开关机的场景 配置了相同型号虚拟显卡的虚拟机会优先在同一GPU核心上运行 以空闲出更多核心供其他虚拟显卡类型虚拟机运行 性能模式——适用于大部分虚拟机为相同虚拟显卡类型的场景 3D虚拟机优先选择显存空闲最大的GPU核心运行,确保已开机的虚拟机都能得到最大的GPU核心算力 显卡切分 T4指的是虚拟显卡对应的物理显卡型号 2指的是该虚拟显卡可以使用显存的上限为2GB B/Q/C指的是该虚拟显卡的显卡类型 B(Basic)基本级别显卡,代表性能为基础或入门级别的显卡;适用于一般办公、网页浏览等简单应用,能够满足一般的图形处理要求 Q(Quality)品质级别显卡,代表性能为均衡和优质的显卡;适用于一般的游戏、轻度视频编辑等需求 C(Customized)定制级别显卡,代表着性能较高或者专业级别的显卡;适用于高端游戏、专业设计软件等对图形性能要求高的应用 |