您现在的位置是:首页 > 财经 > 正文

NVIDIA的下一代GPU架构Ampere以及将使用它的首批产品

发布时间:2021-05-30 15:15:55来源:

导读 今天举行的 2020 年数字 GPU 技术大会主题演讲中,该公司及其首席执行官黄仁勋将在虚拟舞台上宣布 NVIDIA 的下一代 GPU 架构 Ampe

今天举行的 2020 年数字 GPU 技术大会主题演讲中,该公司及其首席执行官黄仁勋将在虚拟舞台上宣布 NVIDIA 的下一代 GPU 架构 Ampere 以及将使用它的首批产品。

就像 3 年前的 Volta 展示——现在是 NVIDIA GTC 展示的传统——今天的重点是非常高端的市场。NVIDIA在2017年推出了基于Volta的GV100 GPU以及V100加速器。V100 对公司来说是一个巨大的成功,在 Volta 架构的新颖张量核心和只能由 800mm 2 + GPU提供的纯粹蛮力的支持下,大大扩展了他们的数据中心业务。现在到 2020 年,该公司希望通过 Volta 的继任者 Ampere 架构继续实现这种增长。

现在是一家比以往更加神秘的公司,英伟达一直将其未来的 GPU 路线图放在胸前。虽然 Ampere 代号(以及其他代号)已经流传了很长一段时间,但直到今天早上我们才终于确认 Ampere 存在,以及我们关于架构的第一个细节。由于 NVIDIA 数字演示的性质——以及 NVIDIA 的新闻发布会上提供的信息有限——我们还没有完全了解 Ampere 的所有细节。然而,至少在今天早上,NVIDIA 正在为其数据中心计算和 AI 客户介绍架构的亮点,以及 Ampere 为帮助他们的工作负载带来的重大创新。

为 Ampere 系列开球的是 A100。正式地,这是 GPU 和包含它的加速器的名称;至少目前它们是同一个,因为只有一个加速器使用 GPU。

NVIDIA 加速器规格比较

A100 V100 P100

FP32 CUDA 核心 6912 5120 3584

升压时钟 ~1.41GHz 1530MHz 1480MHz

内存时钟 2.4Gbps HBM2 1.75Gbps HBM2 1.4Gbps HBM2

内存总线宽度 5120 位 4096 位 4096 位

内存带宽 1.6TB/秒 900GB/秒 720GB/秒

显存 40GB 16GB/32GB 16 GB

单精度 19.5 TFLOP 15.7 TFLOP 10.6 TFLOP

双精度 9.7 TFLOP

(1/2 FP32速率) 7.8 TFLOP

(1/2 FP32 速率) 5.3 TFLOP

(1/2 FP32 速率)

INT8张量 624 TOP 不适用 不适用

FP16 张量 312 TFLOP 125 TFLOP 不适用

TF32张量 156 TFLOP 不适用 不适用

互连线 NVLink 3

12 个链接(600GB/秒) NVLink 2

6 个链接(300GB/秒) NVLink 1

4 个链接(160GB/秒)

图形处理器 GA100

(826mm2) GV100

(815mm2) GP100

(610mm2)

晶体管数量 54.2B 21.1B 15.3B

TDP 400W 300W/350W 300W

制造工艺 台积电 7N 台积电 12nm FFN 台积电16nm FinFET

界面 SXM4 SXM2/SXM3 SXM

建筑学 安培 伏打 帕斯卡

A100 旨在成为 V100 加速器的继任者,其目标与我们对 NVIDIA 新的旗舰计算加速器的期望一样高。领先的 Ampere 部件建立在台积电的 7nm 工艺之上,并包含高达 540 亿个晶体管,是之前 V100 的 2.5 倍。NVIDIA 已经使用了 7nm 工艺提供的全密度改进,然后是一些,因为由此产生的 GPU 芯片尺寸为 826mm 2,甚至比 GV100 还要大。英伟达在上一代做得很大,为了超越自己,他们在这一代做得更大。

稍后我们将更多地讨论各个规格,但从高层次来看,很明显 NVIDIA 在某些领域的投资比其他领域更多。从理论上讲,FP32 的性能仅比 V100 略有提高。与此同时,张量性能得到了极大的提升——FP16 张量几乎是 2.5 倍——NVIDIA 大大扩展了可用于 INT8/4 支持的格式,以及一种名为 TF32 的新 FP32-ish 格式。内存带宽也得到了显着扩展,多个 HBM2 内存堆栈提供总共 1.6TB/秒的带宽来满足 Ampere 的需求。

NVIDIA将以其现在常见的SXM尺寸形式提供此加速器的初始版本,这是一种夹层式卡,非常适合在服务器中安装。在一代又一代的基础上,功耗再次上升,这可能适合称为安培的一代。总的来说,A100 的额定功率为 400W,而 V100 的各种版本的额定功率为 300W 和 350W。这使得 SXM 外形对 NVIDIA 的努力变得更加重要,因为 PCIe 卡不适合这种功耗。

标签:

上一篇
下一篇

最新文章