配置清单: dell r730*3 22核心*6 每台160g 内存 显卡m4000*6 每服务器两块显卡,使用虚拟存储
客户原环境: 使用两台联想服务器连接 两台联想-emc存储,用于办公使用。
这次新增也是要用作办公,问题就来了,带GPU的主机无法加入不带GPU的集群。也是这次实施的头疼点。
显卡虚拟化实施基本与普通的桌面云一致,只是在硬件选型上有几个注意点,完全可以参考配置指导。 我就来说说第三方服务器的一些注意事项,也是我这次遇到的!
第三方服务器增加GPU需要RISER3卡和显卡供电线,否者会报错,供电不足等问题,推荐的m4000显卡TDP为120w,使用单6pin供电 双GPU(M4000)电源至少双750w,如果使用更高功耗的卡,例如M10,建议配置到双1100w的电源。 其他注意的的参考标准化文档即可。 实施过程: 上架,三台主机配置non-raid,装系统,配置好ip,接好网线,赶紧逃离机房(带GPU的主机噪音堪比飞机发动机)。使用原来的VDC连接两个VMP集群即可,没必要两个VDC。
问题就在于两个集群之间的授权和数据问题。
授权问题可以替换为acenter的key给两个集群授权(其实该场景,用传统key也行,但是下单的时候没有要key,干脆就替换成acenter的key了),安装acenter按照配置文档做即可。
由于没有VMP还没有跨集群迁移,如果需要迁移,只能够在后台让400迁移,大约15t的数据,关键是还有一些个人磁盘加密的,这个就造成了很大困难。经过多方确认,有两种迁移方案可选,都是要保证相同的VMP,VDC版本
第一种:替换主机的方法 三台3d桌面云服务器先恢复出厂设置,拆下显卡,加入到原有集群,连接外置存储。 1)将外置存储上的虚拟机运行位置手动指定到新加入的主机,看看所有虚拟机是否能开机; 2)如果可以开机,就进行下一步,把原有4台的2D服务器主机退出集群,新建虚拟存储,将包括vdc在内的虚拟机迁移到虚拟存储; 3)然后在3D桌面云服务器上重新加上显卡,进行测试。
第二种:不做镜像迁移,在3D虚拟机新建虚拟机,未加密的个人磁盘由400复制过去,加密个人磁盘复制过去后由研发修改VDC数据库(加密磁盘复制过去也是加密的)。
最终我们采用了第二种方式,优势就在于对于业务中断很小,可以一台一台迁移,风险低。
第一天, 先让技服专家迁移一台未加密个人磁盘过3d桌面云的虚拟机,完美,包括桌面的文件也会一同迁移到桌面。
第二天, 让研发与400测试迁移一台加密个人磁盘到新集群,与未加密一样的效果,只是修改数据库时间较长。
问题到这里基本上是解决了,现在是以每天几台的速度缓慢迁移,由于之前主机管理口业务口都在一个口,迁移速度只有50m/s,只能慢慢等待了,剩下的,都是时间问题
最后希望研发GG,MM加把劲,能够让显卡主机和无显卡主机放到一个集群,与国际大厂肩并肩。 |