宿舍自慰英伟达H100那么牛, 为啥不行玩《黑传闻悟空》?

提及玩“黑传闻”的电脑成就宿舍自慰，公共齐在吹我方的4090显卡。

然而比4090贵了几十倍的H100，不异是“GPU”，为啥却不行用来玩游戏？

这个问题，猛一看，很弱鸡啊。

但问到具体原因，许多东说念主却说不出个456来。

今天我就简便捋捋，除了接口以外，其他更首要的原因↓

01、架构讨论的各异

最中枢的小数在于两者的架构各异，架构决定了互相的中枢智商不一样。

RTX4090聘任了N记的Ada Lovelace架构，专注于游戏和高档图形解决，这种架构在游戏性能上有贼拉牛B的优化，包括高档的图形渲染工夫如色泽跟踪和DLSS。

RTX4090统统包含 16384 个 CUDA 中枢和 512个第四代 Tensor 中枢，以及 128 个第三代 RT（色泽跟踪）中枢。

底下这个是其单个SM的架构图，4090由128个这么的SM构成。

宿舍自慰

升迁游戏体验的几大黑科技，齐是靠这些核“肝”出来的。

比如光追效力主要依靠RT核，而DLSS包括抗锯齿、超隔离率、色泽重建等等，主要依赖Tensor中枢和CUDA中枢提供的AI增强图形效力。

玩烧机游戏的齐懂，开不开光追效力，体验全齐不一样。

而H100的则是基于Hopper架构，主要针对大边界并行解决和AI任务进行优化，而非图形渲染。

H100包括了16896个CUDA中枢和528个第四代Tensor中枢，提防，莫得对图像渲染至关首要的光追中枢（RT Core）。

下图是H100单个SM的架构暗示，H100由132个这么的SM构成。

看对比图就发现辞别了，天然H100领有更多的CUDA中枢和Tensor中枢，但这些中枢是面向复杂计较和深度学习模子熟悉的。

比如，H100的CUDA中枢支捏FP64、FP32、TF32、BF16、INT8等多种数据类型的高效计较。

而4090的CUDA中枢就不一样了，东说念主家主攻图形密集利用，只针对单精度和双精度作念了优化。

02、运行和API的解救大不一样

H100除了内核优化和讨论的硬伤，还有一个大问题。

N记为游戏级GPU（也4090为代表的Geforce系列）提供了特等的游戏运行，优化游戏性能和兼容性。H100则莫得。

这等于导致H100无法支捏DirectX、OpenGL、Vulkan等主流游戏API（严格说是表面上支捏），也不支捏Unity、子虚、Godot这些主流的游戏引擎。

比如，黑传闻悟空聘任的等于子虚引擎5。

基本上，这两条就息交了拿H100玩游戏的任何念思。天然咱们不错堆砌一些意义↓

老本的问题：我一个4090齐买不起的小卡拉米，我会磋议拿贵几十倍的H100来玩游戏吗？

电源和散热的问题：H100的功耗和热输出讨论用于机架式做事器环境，对用游戏PC来说，有极大的挑战。

是以呢，4090这种GPU，不错叫显卡，能够图形加快卡。

而H100这种GPU，更准确的叫法其实是GPGPU（General-Purpose GPU），我更愿称之为AI加快卡。

好了，不扯了。

是期间把我的顾惜20多年的TNT2翻出来插上，畅玩《黑传闻悟空》了

宿舍自慰

宿舍 自慰 英伟达H100那么牛, 为啥不行玩《黑传闻悟空》?