联华证券_线上实盘杠杆炒股_实盘股票配资开户-常州期货配资 英伟达H100那么牛,为啥不能玩《黑神话悟空》?
你的位置:联华证券_线上实盘杠杆炒股_实盘股票配资开户 > 联华证券 > 常州期货配资 英伟达H100那么牛,为啥不能玩《黑神话悟空》?
常州期货配资 英伟达H100那么牛,为啥不能玩《黑神话悟空》?
发布日期:2024-10-15 21:53    点击次数:203

常州期货配资 英伟达H100那么牛,为啥不能玩《黑神话悟空》?

央行购金方面,虽然中国央行6月未采取行动加大储备购金,但印度央行却增持超9吨,整体央行的购金潮仍在。具体来看如下,国家外汇管理局公布2024年6月末外汇储备规模数据,我国央行黄金储备报7280万盎司,与5月末持平。连续两个月,我国央行黄金储备保持不变。世界黄金协会分析师根据印度储备银行每周数据的计算,印度储备银行的黄金储备在6月份增加了9吨以上,为2022年7月以来的最高水平。这也意味着印度的黄金储备今年增加了37吨,达到841吨。

鲍威尔在新闻发布会上,也表达了对通胀下降速度的满意,如果有更多的经济数据支撑,并不排除年内可能降息的可能。

说起玩“黑神话”的电脑配置,大家都在吹自己的4090显卡。

可是比4090贵了几十倍的H100,同样是“GPU”,为啥却不能用来玩游戏?

这个问题,猛一看,很弱鸡啊。

但问到具体原因,很多人却说不出个456来。

今天我就简单捋捋原因↓

01

架构设计的差异

最核心的一点在于两者的架构差异,架构决定了彼此的核心能力不一样。

RTX4090采用了N记的Ada Lovelace架构,专注于游戏和高级图形处理,这种架构在游戏性能上有贼拉牛B的优化,包括高级的图形渲染技术如光线追踪和DLSS。

RTX4090总共包含 16384 个 CUDA 核心和 512个第四代 Tensor 核心,以及 128 个第三代 RT(光线追踪)核心。

下面这个是其单个SM的架构图,4090由128个这样的SM组成。

提升游戏体验的几大黑科技,都是靠这些核“肝”出来的。

比如光追效果主要依靠RT核,而DLSS包括抗锯齿、超分辨率、光线重建等等,主要依赖Tensor核心和CUDA核心提供的AI增强图形效果。

玩烧机游戏的都懂,开不开光追效果,体验完全不一样。

而H100的则是基于Hopper架构,主要针对大规模并行处理和AI任务进行优化,而非图形渲染。

H100包括了16896个CUDA核心和528个第四代Tensor核心,注意,没有对图像渲染至关重要的光追核心(RT Core)。

下图是H100单个SM的架构示意,H100由132个这样的SM组成。

看对比图就发现差别了,虽然H100拥有更多的CUDA核心和Tensor核心,但这些核心是面向复杂计算和深度学习模型训练的。

比如,H100的CUDA核心支持FP64、FP32、TF32、BF16、INT8等多种数据类型的高效计算。

而4090的CUDA核心就不一样了,人家主攻图形密集应用,只针对单精度和双精度做了优化。

02

驱动和API的支撑大不一样

H100除了内核优化和设计的硬伤,还有一个大问题。

N记为游戏级GPU(也4090为代表的Geforce系列)提供了专门的游戏驱动,优化游戏性能和兼容性。H100则没有。

这就是导致H100无法支持DirectX、OpenGL、Vulkan等主流游戏API(严格说是理论上支持),也不支持Unity、虚幻、Godot这些主流的游戏引擎。

比如,黑神话悟空采用的就是虚幻引擎5。

基本上,这两条就断绝了拿H100玩游戏的任何念想。当然我们可以堆砌一些理由↓

成本的问题:我一个4090都买不起的小卡拉米,我会考虑拿贵几十倍的H100来玩游戏吗?

电源和散热的问题:H100的功耗和热输出设计用于机架式服务器环境,对用游戏PCI来说,有极大的挑战。

所以能,4090这种GPU,可以叫显卡,或者图形加速卡。

而H100这种GPU,更准确的叫法其实是GPGPU(General-Purpose GPU),我更愿称之为AI加速卡。

好了,不扯了。

是时候把我的珍藏20年的TNT2翻出来插上,畅玩《黑神话悟空》了



相关资讯