您现在的位置是:首页 > 财经 > 正文
NVIDIA的下一代GPU架构Ampere以及将使用它的首批产品
发布时间:2021-05-30 15:15:55来源:
今天举行的 2020 年数字 GPU 技术大会主题演讲中,该公司及其首席执行官黄仁勋将在虚拟舞台上宣布 NVIDIA 的下一代 GPU 架构 Ampere 以及将使用它的首批产品。
就像 3 年前的 Volta 展示——现在是 NVIDIA GTC 展示的传统——今天的重点是非常高端的市场。NVIDIA在2017年推出了基于Volta的GV100 GPU以及V100加速器。V100 对公司来说是一个巨大的成功,在 Volta 架构的新颖张量核心和只能由 800mm 2 + GPU提供的纯粹蛮力的支持下,大大扩展了他们的数据中心业务。现在到 2020 年,该公司希望通过 Volta 的继任者 Ampere 架构继续实现这种增长。
现在是一家比以往更加神秘的公司,英伟达一直将其未来的 GPU 路线图放在胸前。虽然 Ampere 代号(以及其他代号)已经流传了很长一段时间,但直到今天早上我们才终于确认 Ampere 存在,以及我们关于架构的第一个细节。由于 NVIDIA 数字演示的性质——以及 NVIDIA 的新闻发布会上提供的信息有限——我们还没有完全了解 Ampere 的所有细节。然而,至少在今天早上,NVIDIA 正在为其数据中心计算和 AI 客户介绍架构的亮点,以及 Ampere 为帮助他们的工作负载带来的重大创新。
为 Ampere 系列开球的是 A100。正式地,这是 GPU 和包含它的加速器的名称;至少目前它们是同一个,因为只有一个加速器使用 GPU。
NVIDIA 加速器规格比较
A100 V100 P100
FP32 CUDA 核心 6912 5120 3584
升压时钟 ~1.41GHz 1530MHz 1480MHz
内存时钟 2.4Gbps HBM2 1.75Gbps HBM2 1.4Gbps HBM2
内存总线宽度 5120 位 4096 位 4096 位
内存带宽 1.6TB/秒 900GB/秒 720GB/秒
显存 40GB 16GB/32GB 16 GB
单精度 19.5 TFLOP 15.7 TFLOP 10.6 TFLOP
双精度 9.7 TFLOP
(1/2 FP32速率) 7.8 TFLOP
(1/2 FP32 速率) 5.3 TFLOP
(1/2 FP32 速率)
INT8张量 624 TOP 不适用 不适用
FP16 张量 312 TFLOP 125 TFLOP 不适用
TF32张量 156 TFLOP 不适用 不适用
互连线 NVLink 3
12 个链接(600GB/秒) NVLink 2
6 个链接(300GB/秒) NVLink 1
4 个链接(160GB/秒)
图形处理器 GA100
(826mm2) GV100
(815mm2) GP100
(610mm2)
晶体管数量 54.2B 21.1B 15.3B
TDP 400W 300W/350W 300W
制造工艺 台积电 7N 台积电 12nm FFN 台积电16nm FinFET
界面 SXM4 SXM2/SXM3 SXM
建筑学 安培 伏打 帕斯卡
A100 旨在成为 V100 加速器的继任者,其目标与我们对 NVIDIA 新的旗舰计算加速器的期望一样高。领先的 Ampere 部件建立在台积电的 7nm 工艺之上,并包含高达 540 亿个晶体管,是之前 V100 的 2.5 倍。NVIDIA 已经使用了 7nm 工艺提供的全密度改进,然后是一些,因为由此产生的 GPU 芯片尺寸为 826mm 2,甚至比 GV100 还要大。英伟达在上一代做得很大,为了超越自己,他们在这一代做得更大。
稍后我们将更多地讨论各个规格,但从高层次来看,很明显 NVIDIA 在某些领域的投资比其他领域更多。从理论上讲,FP32 的性能仅比 V100 略有提高。与此同时,张量性能得到了极大的提升——FP16 张量几乎是 2.5 倍——NVIDIA 大大扩展了可用于 INT8/4 支持的格式,以及一种名为 TF32 的新 FP32-ish 格式。内存带宽也得到了显着扩展,多个 HBM2 内存堆栈提供总共 1.6TB/秒的带宽来满足 Ampere 的需求。
NVIDIA将以其现在常见的SXM尺寸形式提供此加速器的初始版本,这是一种夹层式卡,非常适合在服务器中安装。在一代又一代的基础上,功耗再次上升,这可能适合称为安培的一代。总的来说,A100 的额定功率为 400W,而 V100 的各种版本的额定功率为 300W 和 350W。这使得 SXM 外形对 NVIDIA 的努力变得更加重要,因为 PCIe 卡不适合这种功耗。
标签:
猜你喜欢
- 今日消息 内蒙古8月26日新增本土确诊病例5例、本土无症状感染者2例
- 今日消息 2022年中秋假期首日火车票明天开售
- 今日消息 美国8月消费者信心指数最终读数为58.2
- 今日消息 未达到回购方案下线且完成率较低,松炀资源及时任董事长遭上交所通报批评
- 今日消息 振东制药收半年报问询函:要求说明营收和净利润大幅下滑、扣非净利润亏损的原因
- 今日消息 美股开盘:美股三大指数涨跌不一,道指涨0.13%,中概股大涨
- 今日消息 江苏国泰:上半年归母净利润9.31亿元,同比增151.08%,汇兑收益约1.72亿元
- 今日消息 国药控股:上半年营收350亿元,同比增长14%
- 今日消息 美国7月商品贸易逆差初值891亿美元
- 今日消息 北京君正:上半年归母净利润同比增长43.94%
最新文章
- 今日消息 Meta旗下VR平台Horizon副总裁将离职,主要负责元宇宙相关研发
- 今日消息 天津昨日全域核酸检测结果已出,共发现20例核酸阳性感染者
- 今日消息 甘肃8月27日新增无症状感染者21例
- 今日消息 美国外卖平台DoorDash发生数据泄露事件,部分客户和司机信息被读取
- 今日消息 山东德州新增本土无症状感染者4例
- 今日消息 陕西8月27日新增本土确诊13例、无症状感染者44例
- 今日消息 内蒙古8月27日新增本土确诊病例4例、无症状感染者3例
- 今日消息 捷克众议院批准芬兰和瑞典加入北约
- 今日消息 浙江8月27日新增本土阳性1例,为社区筛查发现
- 今日消息 俄罗斯将开始为匈牙利扩建核电站
- 今日消息 江西8月27日新增本土无症状感染者24例
- 今日消息 河南8月27日新增本土确诊2例、无症状52例
- 今日消息 广东8月27日新增本土确诊12例、无症状4例、无症状转确诊1例
- 今日消息 新疆维吾尔自治区8月27日新增本土确诊4例、无症状57例
- 今日消息 北京文化:2022上半年净亏损收窄至2516万,营业成本同比减少98.32%
- 今日消息 黑龙江8月27日新增本土确诊病例1例、无症状7例
- 今日消息 重庆8月27日新增本土确诊12例、无症状7例
- 今日消息 海南8月27日新增本土确诊70例、无症状125例
- 今日消息 北京8月27日新增2例本土确诊病例、1例本土无症状感染者
- 今日消息 山西8月27日新增本土确诊病例9例、无症状感染者2例
- 今日消息 内蒙古二连浩特新增阳性感染者5人,全域继续实行静默管理
- 今日消息 天津西青多地调整为高、中风险区,精武镇、李七庄街实施全域静态管理
- 今日消息 山东8月27日新增本土无症状感染者2例
- 今日消息 西藏日喀则8月27日新增本土新冠病毒感染者144例