如何用GPU算力卡P100玩黑神话悟空?

精力有限,只记录关键信息,希望未来能够有助于其他人。

文章目录

  • 综述
  • 背景
  • 评估
    • 游戏性能需求
    • 显卡需求
    • CPU和内存系统需求
    • 主机需求
    • 显式需求
  • 实操
    • 硬件安装
    • 安装操作系统Win11
    • 安装驱动
    • 修改注册表
    • 选择程序使用什么GPU
  • 安装黑神话悟空
  • 其他

综述

用P100 + PCIe Gen3.0 + Dell720服务器(32C64G),运行黑神话悟空画质中等流畅运行。

背景

假设有一张P100-PCIE-16G的 GPU卡。和Dell720服务器。是否能够玩黑神话。
本文记录了从硬件、软件评估,再到实操,再到解决各种软硬件问题最终流畅运行黑神话的过程。
重要的不是玩这个游戏,而是通过一系列技术分析和实操,一步步跑起来。挺有意思的。特此记录。

评估

游戏性能需求

首先黑神话悟空的最低配置是1080P。

显卡需求

如果有P100的GPU卡,P100是帕斯卡架构,对标2080的架构。另外从CUDA核心、显存大小上理论上是可行的,只是没有Tensorcore和Rcore。其中Tensorcore是用来做张量计算,游戏卡不需要。Rcore光线追踪可以不开。
在这里插入图片描述

在这里插入图片描述

CPU和内存系统需求

Dell720服务器是 E5-2670的CPU,2个socket,32核心。
该部分最开始无法确认是否可用,主要考虑2个问题:

  1. 操作系统,包括安装win11系统(不是winserver)。最终常识是可以虽然Win11删除了很多E系列的CPU
  2. CPU的主频是否够,待实测
  3. 内存是否够,内存虽说是服务器内存条不能用在主机上,但是都是内存64G容量是够了。频率还不清楚,包括和GPU互访问的速率
  4. CPU支持的PCIe是3.0,速率最高128GTs,理论上应该是够了,因为毕竟游戏才132G,就算全部加载都可以。

主机需求

功耗:服务器750W单电源,如果不够,可以再加一个电源,所以功耗没问题。
PCIe:插槽和长度,7个可扩展插槽,足够。并且P100本来就在运行。

显式需求

GPU没有显式接口,可以先用主机BMC的VGA显示。后面在考虑添加HDMI。
最后是VGA跑起来了,HDMI是通过加了一张100块钱的显卡搞定显式输出,游戏用GPU运算。

实操

时间有限,简单记录一点。

硬件安装

GPU P100插入服务器,这个本来就在上面,本文忽略。
但需要提的是,Dell服务器每个PCIe slot有8Pin的电源接口,直接买一根GPU的电源线。直接搞定。

安装操作系统Win11

进入BIOS,外加老毛桃等在PE中装机。本文忽略
但是安装后需要通过设备管理器查看到GPU设备,不在显式设备中,而在3D视频卡里面。如果到这一步说明GPU能够被Win11识别。
(了解PCIe协议的,这里的本质是PCIe的总线,能够扫描到GPU P100的配置空间,然后将数据读出来,vendor ID是 15F8,我是通过在Linux上使用过P100知道vendor id是15f8,然后windows中设备管理器的属性中能够看到vendor id也是15f8才确认一定是P100)

安装驱动

这个坑最多,主要2个点。

  1. 安装驱动:NV最新的驱动可以驱动P100,但是关闭了P100将模式从TCC(服务器模式)修改为WDDM(游戏模式)。区别参考兄弟篇:https://blog.csdn.net/essencelite/article/details/141928130
  2. 修改注册表配置

关于可用驱动就直接写链接了 ,如何安装参考官网。不用关注驱动列表中是否支持P100,实际是支持的。
538.67 驱动下载:添加链接描述
本文直接参考本文附录。
在这里插入图片描述

其他坑:
驱动版本528.02不可用
驱动版本552.55不可用
无法下载可以直接在本周后面驱动。
主动安装好以后可以在命令行使用nvidia-smi查看,并且能够看到模式是TCC

修改注册表

打开注册表:“HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Class{4d36e968-e325-11ce-bfc1-08002be10318}” 目录下根据0000或者0001或者0002,根据系统显卡列表。
可以在DriverDesc字段看是否有P100的描述

修改注册表:
修改:“AdapterType”,类型DWORD32,,从2修改为1
修改:“FeatureScore”,类型DWORD32,,从CF修改为D1 (注意是16进制)
新建:“GridLicensedFeatures”,类型DWORD32,值7
保存注册表。
然后在设备管理器中禁用P100,然后启用P100就会生效。

再次使用nvidia-smi,可以看到显卡模式修改WDDM模式了。
如果有多张NV的卡需要再其他卡里面添加,删除AdapterType,并且添加一个DWORD32位值,命名为EnableMsHybrid,值为1。表示多显卡共存。
然后启用禁用网卡。

选择程序使用什么GPU

进入系统设置->显示设置>点击显示 > 图形设置->显示卡,然后选择对应的程序使用什么GPU

安装黑神话悟空

具体就不介绍了,安装steam-> 购买黑神话悟空->下载安装->运行
最后安装运行能够稳定的运行,并且在任务管理器中的性能标签,能够看到GPU运行中,并且利用率到了80%,成功搞定。
只是需要注意的是,windows的风扇控制不是太好,容易造成GPU太高,可以下载一个风扇插件,或者把机盖稍微打开一点就会全速运行了。
最后运行的几个关键配置情况:

  1. 画质:中等(这个超过想象了,本以为只能用低)
  2. 显示器输出1080P
  3. 运行期间CPU利用率基本在10%一下,GPU利用率在80%左右,GPU显存卡内16G+共享40G,基本只用了十几个G。硬件配置完美搞定。并且PCIe总线的速率和CPU主频都完美搞定。
  4. 运行中屏幕不卡,并且动作也不错。
  5. 不过一点调整到高登记画质,确实就比较卡了。估计只能跑几帧。另外光线追踪确实开不了。

其他

服务器默认显示是VGA,可以买一张百十来块前的小显卡支持1080P的显式基本就能玩起来了。效果还不错。把你的服务器也搞一张P100玩起来吧。
另外显式的问题还可以通过steam串流,使用Pico或者quest的VR眼镜用起来,完美解决服务器显式不足的问题,并且还能巨屏。

最后上2张简单的图吧:
在这里插入图片描述
在这里插入图片描述

参考链接:
https://www.nvidia.cn/data-center/tesla-p100/
https://forums.developer.nvidia.com/t/how-to-open-wddm-mode-supporting-graphics-acceleration-under-windows-for-p100/166994
https://blog.csdn.net/ginys/article/details/139723015

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/873573.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

一台手机一个ip地址吗?手机ip地址泄露了怎么办

在数字化时代,‌手机作为我们日常生活中不可或缺的一部分,‌其网络安全性也日益受到关注。‌其中一个常见的疑问便是:‌“一台手机是否对应一个固定的IP地址?‌”实际上,‌情况并非如此简单。‌本文首先解答这一问题&a…

Linux_kernel移植rootfs10

一、动态更改内核 1、low level(静态修改) 【1】将led_drv.c拷贝到kernel/drivers/char/目录中 【2】修改当前目录下的Makefile文件 obj-y led_drv.o #将新添加的驱动文件加入到Makefile文件中 【3】退回kernel目录,执行make uImage …

C语言学习笔记 Day16(C10文件管理--下)

Day16 内容梳理: C语言学习笔记 Day14(文件管理--上)-CSDN博客 C语言学习笔记 Day15(文件管理--中)-CSDN博客 目录 Chapter 10 文件操作 10.5 文件状态 10.6 文件的随机读写 fseek()、rewind() (1&…

【初阶数据结构】详解栈和队列(来自知识星空的一抹流光)

文章目录 前言1. 栈1.1 栈的概念及结构1.2 栈的实现1.2.1 "栈"实现的选择 1.3 栈的代码实现1.3.1 栈的结构体定义(用的是顺序表)1.3.2 栈的头文件设置1.3.3 栈的各功能的实现 2. 队列2.1 队列的概念及结构2.2 "队列"实现的选择2.3 队…

【即时通讯】轮询方式实现

技术栈 LayUI、jQuery实现前端效果。django4.2、django-ninja实现后端接口。 代码仓 - 后端 代码仓 - 前端 实现功能 首次访问页面并发送消息时需要设置昵称发送内容为空时要提示用户不能发送空消息前端定时获取消息,然后展示在页面上。 效果展示 首次发送需要…

深入理解数据库的 4NF:多值依赖与消除数据异常

在数据库设计中, "范式" 是一个常常被提到的重要概念。许多初学者在学习数据库设计时,经常听到第一范式(1NF)、第二范式(2NF)、第三范式(3NF)以及 BCNF(Boyce-…

滑动窗口在算法中的应用

滑动窗口是一种经典的算法技巧,就像在处理一系列动态数据时,用一扇可以滑动的“窗口”来捕捉一段连续的子数组或子字符串。通过不断地移动窗口的起点或终点,我们能够以较低的时间复杂度来解决一系列问题。在这篇文章中,我们将通过…

维信小程序禁止截屏/录屏

一、维信小程序禁止截屏/录屏 //录屏截屏,禁用wx.setVisualEffectOnCapture({visualEffect:hidden});wx.setVisualEffectOnCapture(Object object) 测试安卓手机: 用户截屏,被禁用 用户录屏,录制的是空白内容/黑色内容的视频。 二、微信小…

C++ | Leetcode C++题解之第386题字典序排数

题目&#xff1a; 题解&#xff1a; class Solution { public:vector<int> lexicalOrder(int n) {vector<int> ret(n);int number 1;for (int i 0; i < n; i) {ret[i] number;if (number * 10 < n) {number * 10;} else {while (number % 10 9 || numbe…

EasyPlayer.js网页H5 Web js播放器能力合集

最近遇到一个需求&#xff0c;要求做一款播放器&#xff0c;发现能力上跟EasyPlayer.js基本一致&#xff0c;满足要求&#xff1a; 需求 功性能 分类 需求描述 功能 预览 分屏模式 单分屏&#xff08;单屏/全屏&#xff09; 多分屏&#xff08;2*2&#xff09; 多分屏…

【阿一网络安全】如何让你的密码更安全?(二) - 非对称加密

上次《【阿一网络安全】如何让你的密码更安全&#xff1f;(一) - 对称加密》提到加密算法的对称加密&#xff0c;我们这次来聊聊非对称加密。 和对称加密不同&#xff0c;非对称加密的加密密钥和解密密钥不同。 非对称加密 大概过程就是&#xff0c;发送方使用公钥对明文数据…

mac 安装redis

官网下载指定版本的redis https://redis.io/ 目前3.2.0 是最新最稳定的 版本 这里是历史版本下载 下载指定版本 安装 1.放到自定义目录下并解压 2.打开终端&#xff0c;执行命令 cd redis的安装目录下 make test -- 此命令的作用是将redis源代码编译成可执行文件&#xff0c…

SPI驱动学习五(如何编写SPI设备驱动程序)

目录 一、SPI驱动程序框架二、怎么编写SPI设备驱动程序1. 编写设备树2. 注册spi_driver3. 怎么发起SPI传输3.1 接口函数3.2 函数解析 三、示例1&#xff1a;编写SPI_DAC模块驱动程序1. 要做什么事情2. 硬件2.1 原理图2.2 连接 3. 编写设备树4. 编写驱动程序5. 编写app层操作程序…

C++语法知识点合集:11.模板

文章目录 一、非类型模板参数1.非类型模板参数的基本形式2.指针作为非类型模板参数3.引用作为非类型模板参数4.非类型模板参数的限制和陷阱&#xff1a;5.几个问题 二、模板的特化1.概念2.函数模板特化3.类模板特化(1)全特化(2)偏特化(3)类模板特化应用示例 三、模板分离编译1.…

微带结环行器仿真分析+HFSS工程文件

微带结环行器仿真分析HFSS工程文件 工程下载&#xff1a;微带结环行器仿真分析HFSS工程文件 我使用HFSS版本的是HFSS 2024 R2 参考书籍《微波铁氧体器件HFSS设计原理》和视频微带结环行器HFSS仿真 1、环形器简介 环行器是一个有单向传输特性的三端口器件&#xff0c;它表明…

使用Qt编程QtNetwork无法使用

使用 VS 构建 Qt 项目时 QtNetwork 无法使用的问题 - 摘叶飞镖 - 博客园 (cnblogs.com) 另外,强烈建议在使用QNetworkAccessManager之前看看这篇文章: Qt 之 QNetworkAccessManager踏坑记录-CSDN博客 C Qt开发&#xff1a;QNetworkAccessManager网络接口组件 阅读目录 1.1 …

在Ubuntu上运行QtCreator相关程序

背景&#xff1a;希望尝试在Linux系统上跑一下使用QtCreator相关的程序&#xff0c;因为有一些工作岗位要求有Linux上使用Qt的经验。 (1)我是把Windows上的程序移过来的&#xff0c;Windows上文件名称是不区分大小写的。 而Ubuntu上是区分的 所以一部分头文件需要进行修改&am…

idea创建SpringBoot项目

目录 1. 新建一个SpringBoot项目 2. 使用Springboot官网创建项目 3. 使用阿里云地址创建SpringBoot项目 4. 使用maven创建SpringBoot项目 5. 在Idea中隐藏指定文件/文件夹 1. 新建一个SpringBoot项目 Springboot2 要求jdk版本: 1.8 maven: 3.3 内嵌的tomcat: tomcat9 我们…

深度学习(一)-感知机+神经网络+激活函数

深度学习概述 深度学习的特点 优点 性能更好 不需要特征工程 在大数据样本下有更好的性能 能解决某些传统机器学习无法解决的问题 缺点 小数据样本下性能不如机器学习 模型复杂 可解释性弱 深度学习与传统机器学习相同点 深度学习、机器学习是同一问题不同的解决方法 …

11.5.软件系统分析与设计-面向对象的程序设计与实现

面向对象的程序设计与实现 设计模式 Java代码 C代码