创建或修改目录:/www/wwwroot/104.219.215.234/data 失败!
宿舍 自慰 英伟达H100那么牛, 为啥不行玩《黑传闻悟空》? - 开心色播

宿舍 自慰 英伟达H100那么牛, 为啥不行玩《黑传闻悟空》?

宿舍 自慰 英伟达H100那么牛, 为啥不行玩《黑传闻悟空》?

提及玩“黑传闻”的电脑成就宿舍 自慰,公共齐在吹我方的4090显卡。

然而比4090贵了几十倍的H100,不异是“GPU”,为啥却不行用来玩游戏?

这个问题,猛一看,很弱鸡啊。

但问到具体原因,许多东说念主却说不出个456来。

今天我就简便捋捋,除了接口以外,其他更首要的原因↓

01、架构讨论的各异

最中枢的小数在于两者的架构各异,架构决定了互相的中枢智商不一样。

RTX4090聘任了N记的Ada Lovelace架构,专注于游戏和高档图形解决,这种架构在游戏性能上有贼拉牛B的优化,包括高档的图形渲染工夫如色泽跟踪和DLSS。

RTX4090统统包含 16384 个 CUDA 中枢和 512个第四代 Tensor 中枢,以及 128 个第三代 RT(色泽跟踪)中枢。

底下这个是其单个SM的架构图,4090由128个这么的SM构成。

宿舍 自慰

升迁游戏体验的几大黑科技,齐是靠这些核“肝”出来的。

比如光追效力主要依靠RT核,而DLSS包括抗锯齿、超隔离率、色泽重建等等,主要依赖Tensor中枢和CUDA中枢提供的AI增强图形效力。

玩烧机游戏的齐懂,开不开光追效力,体验全齐不一样。

而H100的则是基于Hopper架构,主要针对大边界并行解决和AI任务进行优化,而非图形渲染。

H100包括了16896个CUDA中枢和528个第四代Tensor中枢,提防,莫得对图像渲染至关首要的光追中枢(RT Core)。

下图是H100单个SM的架构暗示,H100由132个这么的SM构成。

骚女qq

看对比图就发现辞别了,天然H100领有更多的CUDA中枢和Tensor中枢,但这些中枢是面向复杂计较和深度学习模子熟悉的。

比如,H100的CUDA中枢支捏FP64、FP32、TF32、BF16、INT8等多种数据类型的高效计较。

而4090的CUDA中枢就不一样了,东说念主家主攻图形密集利用,只针对单精度和双精度作念了优化。

02、运行和API的解救大不一样

H100除了内核优化和讨论的硬伤,还有一个大问题。

N记为游戏级GPU(也4090为代表的Geforce系列)提供了特等的游戏运行,优化游戏性能和兼容性。H100则莫得。

这等于导致H100无法支捏DirectX、OpenGL、Vulkan等主流游戏API(严格说是表面上支捏),也不支捏Unity、子虚、Godot这些主流的游戏引擎。

比如,黑传闻悟空聘任的等于子虚引擎5。

基本上,这两条就息交了拿H100玩游戏的任何念思。天然咱们不错堆砌一些意义↓

老本的问题:我一个4090齐买不起的小卡拉米,我会磋议拿贵几十倍的H100来玩游戏吗?

电源和散热的问题:H100的功耗和热输出讨论用于机架式做事器环境,对用游戏PC来说,有极大的挑战。

是以呢,4090这种GPU,不错叫显卡,能够图形加快卡。

而H100这种GPU,更准确的叫法其实是GPGPU(General-Purpose GPU),我更愿称之为AI加快卡。

好了,不扯了。

是期间把我的顾惜20多年的TNT2翻出来插上,畅玩《黑传闻悟空》了

宿舍 自慰



创建或修改目录:/www/wwwroot/104.219.215.234/data 失败!
JzEngine Create File False