解决方法:
a. 确认当前显卡驱动是最新版本。下面截图的版本号只是一个例子,正确版本号以提供包的readme为准
确认方法:
b. 在Windows系统服务中重启服务NVIDIA Display Container LS
重启nv服务后,桌面右键菜单恢复正常:
常见问题2:NVIDIA控制面板里只有许可证界面,缺失了其他界面,如下图所示:
解决方法:
a.确认当前显卡驱动是最新版本。确认方法见问题1的解决方法a
b.在Windows系统服务中重启服务(可能需要多次重启)
重启nv服务后,NVIDIA控制面板恢复正常
常见问题3:不想让桌面右下角弹出vGPU授权提示(如下图)
解决方法:
手动在注册表中添加注册表项DisableExpirationPopups并设置为1
注册表路径:HKEY_LOCAL_MACHINE\SOFTWARE\NVIDIA Corporation\Global\GridLicensing
DisableExpirationPopups这个注册表项默认不存在,而且默认会弹提示框。其值为1代表不弹提示框;其值为0代表要弹提示框。
常见问题4:3D虚拟机无法获取到英伟达授权
常见问题5: 无法接入web管理界面http://服务器ip:8080/licserver/
解决办法:
a. 接入授权服务器后台,执行systemctl restart tomcat命令重启Tomcat服务
说明:ssh vgpu@授权服务器的IP 22
vgpu用户登录服务器后台,密码为vgpu123
登录后执行su提权,root密码也为vgpu123
b. 不重启服务,直接在vmp上重启整个授权服务器。(注意打上快照)
常见问题6:打开web页面提示Connection refused
解决办法:
稍等一会(大约10分钟左右),服务还没起来。
常见问题7:打开bin文件的导入页面提示
解决方法:
1、授权服务器服务还未起来,等待1-2min。若等待不能解决,则是步骤2的原因
2、可能数据库损坏,按如下操作:
a. 接入授权服务器后台,执行systemctl status flexnetls-nvidia命令查看授权服务的运行状态
正常的状态应该是active (running)
当状态不正常时,执行systemctl restart flexnetls-nvidia重启服务
或者直接重启整个授权服务器
b. 如果重启服务后仍未解决,建议恢复数据库或恢复快照来解决。
c. 如果以上2种方法都无法解决,建议重新导入vma,部署新的授权服务器
(建议重新部署的原因:测试环境下已验证过:这种情况下删除后台文件,重启服务,重启系统都无法解决,NVIDIA公司也无法解决)
常见问8:导入bin文件报错
解决方法:
a. 确认授权服务器的系统时间正确(比如与北京时间一致)
b. 确认从获取该bin文件到当前未超过24小时(超过24小时,该文件会失效)
如果超过需要从NVIDIA重新获取一份bin文件
c. 检查授权服务器的mac地址
确认mac地址与bin文件一致
d. 确认该授权服务器曾经是否已导入过license文件
已成功导入过无法再导入,需重新部署授权服务器
上面已为大家简单概述了几种常见的问题,下面再给大家介绍一下英伟达授权服务器的日常操作
a. 接入授权服务器后台,执行systemctl status flexnetls-nvidia命令查看授权服务的运行状态
同样,执行systemctl status tomcat查看tomcat的运行状态
正常的状态应该是active (running)
当状态不正常时,执行systemctl restart flexnetls-nvidia、systemctl restart tomcat重启服务
或者直接重启整个授权服务器
b. 在后台删除授权记录相关文件,并重启授权服务
rm /var/opt/flexnetls/nvidia/flexnetls_licenses*
systemctl restart flexnetls-nvidia
C. 查看后台日志文件
日志文件路径:/var/opt/flexnetls/nvidia/logs
包含两种类型的日志:
第一类为记录访问授权管理系统行为的日志,包括用户点击管理系统界面的行为、客户机申请授权的行为,记录在access_*.request.log日志文件中。
每条日志信息主要包括以下信息:访问源IP、访问时间、具体的访问链接等。
d. 实际上,服务端的大部分问题NVIDIA都没有给解决方案,只有一个终极办法能解决:重新导入vma部署一个新的授权服务器。
整体就是这些了,欢迎大家把自己遇到的也留言发出