全站搜索
设为首页加入收藏
联系我们
公司新闻
 
公司新闻
为何全球TOP10超级计算机8台都选英伟达?三大原因
作者:    发布于:2020-06-25 08:36    文字:【】【】【

本周,又是一年一度的高功能核算大会ISC。6月23日,又逢超级核算机TOP500榜单更新的时刻。依据TOP500刚刚发布的超算TOP500榜单,我国布置了226台位列榜首,美国布置了114台名列第二,日本以30台位居第三。


2020年6月更新的TOP500超算体系排名

细看这份最新的榜单,能够发现TOP10的超级核算机中有8台选用了英凯发旗舰厅伟达GPU、InfiniBand网络技能,或一起选用了两种技能。TOP500榜单的体系中,有333套(三分之二)选用了英伟达的技能。

TOP500超算体系选用NVIDIA GPU、Mellanox网络技能,或一起选用了这两种技能数量

三年前的2017年6月,TOP500榜单运用英伟达和Mellanox(被英伟达以69亿美元收买)的体系为203套,不到TOP500个超算体系的一半。为什么在超算范畴英伟达能发展如此迅猛?TOP100超算为何要选英伟达?

高速数据互联技能遍及

英伟达乐意以高价收买Mellanox的重要原因是高速数据互联在大数据年代变得越来越重要,在超算体系里尤为显着。自2019年11月以来,TOP500榜单上运用HDR InfiniBand的体系数量简直增加了一倍。共有141台超级核算机运用了InfiniBand,自2019年6月以来增长了12%。

现在,TOP500榜单上有将近四分之三(74%)的全新InfiniBand体系选用了NVIDIA Mellanox HDR 200G InfiniBand,这是智能高速数据互联技能敏捷遍及的一个表现。别的,在TOP500超级核算机中,有305套体系运用了NVIDIA Mellanox InfiniBand和Ethernet网络(占61%)。

InfiniBand为排名前10的超级核算机中的7台提速

ISC期间,英伟达又宣告推出Mellanox UFM Cyber-AI渠道,新的渠道运用AI剖析技能检测安全要挟和运转问题并猜测网络故障,能够大幅削减InfiniBand数据中心的停机时刻。

收买Mellanox和智能高速数据互联敏捷遍及是让英伟达的产品在TOP500榜单中份额敏捷进步的一个要害,但作为超算体系,功能更为要害。

超高功能体系像积木相同建立

特别是,当下AI和剖析已成为科学核算中的新需求,全球各地的研讨者都正在运用深度学习和数据剖析猜测各种最具潜力的范畴,从而展开试验。GTC2020上,英伟达就表明坐落美国阿贡国家试验室的研讨者运用24台NVIDIA DGX A100体系组成的集群对数十亿种药物进行扫描,以寻觅COVID-19的医治办法。

英伟达最新发布的安培(Ampere)架构GPU A100正是推进超算体系选用英伟达产品的要害之一。在一台6U服务器中集成了8颗A100 GPU以及NVIDIA Mellanox HDR InfiniBand网络技能的NVIDIA DGX A100 AI体系单节点功能到达了创纪录的5 petaflops。由140台 DGXA100体系组成的新一代DGX SuperPOD的AI算力更是高达700 Petaflop。

这关于竞赛现已到了百万兆级超算而言,含义严重,而且,这个体系具有很好的扩展性。英伟达表明, DGX SuperPOD架构规划展现了怎么像搭积木相同运用高功能NVIDIA Mellanox InfiniBand交换机衔接20台DGX A100体系。4名操作人员仅需不到1个小时,就能组装起一套由20台体系组成的DGX A100集群,创建出一套功能能够到达2-petaflops的体系。

据悉,经过增加NVIDIA Mellanox InfiniBand交换机层,英伟达工程师将14套别离装备有20台DGX A100体系的模块组的相衔接,打造出了Selene。Selene体系具有:

280台 DGX A100体系

2240颗NVIDIA A100 GPU

494台NVIDIA Mellanox Quantum 200G InfiniBand交换机

56 TB/s的网络架构

7PB的高功能全闪存

Selene最重要的功能标准之一是能够供给超越1 exaflops的AI功能。而且,在TPCx-BB要害数据剖析基准测验中,运用了16台DGX A100体系就发明了新纪录,功能表现高出其他体系20倍。

在ISC 2020期间,英伟达还宣告推出PCIe版别的A100,为的是弥补上月发布的四卡和八卡NVIDIA HGX A100装备,这样,服务器制造商就能够供给从内置单个A100 GPU的体系到内置10个或10个以上GPU的服务器,进一步更好地满意超算体系构建需求。

除了功能,TOP500超算体系也十分重视能耗,这也是英伟达能招引超算体系制造商的另一大原因。

能效均匀进步2.8倍

依据英伟达的说法,在能效方面,TOP500超算运用英伟达GPU的体系与不运用的比较,能效(以gigaflops/watt为单位)均匀高出2.8倍。最能证明这个优势的是上面说到的英伟达内部研讨集群新成员Selene。

据悉,Selene在Linpack基准测验中以27.5 petaflops的功能表现,在最新Green500榜单中排名第二,TOP500榜单中排名第七。Selene的功耗为20.5 gigaflops/watt,与Green500榜单上的榜首名相差不大,但排名榜首的MN-3体系体积更小,功能表现排在第394位。

NVIDIA GPU均匀进步TOP500超级核算机能效2.8倍

值得一提的是,Selene是TOP100体系中仅有打破20 20 gigaflops/watt能效表现大关的体系,也是全球功能排名第二的工业超级核算机,仅次于意大利动力巨子Eni S.p.A.的No. 6 体系。

而Selene的能效比TOP500体系的均匀表现比未运用英伟达GPU的超算体系高出了6.8倍。这种功能和能效是归功于A100 GPU中的第三代Tensor Core中心,最新一代Tensor Core可认为传统的64位数学模拟及精度较低的AI作业供给加快。

雷锋网小结

高功能核算处理器是一家公司产品功能领导力的表现,更是生态实力的表现。英伟达在ISC 2020期间宣告,今年夏天估计有30款搭载A100的服务器上市,年末还会有20多款体系上市。包含华硕、Atos、思科、Dell Technologies、富士通、技嘉科技、HPE、浪潮、联想、One Stop Systems、Quanta/QCT和Supermicro。

黄仁勋在GTC2020上着重,DGX A100体系能够完成高利用率和低总具有本钱。当以高价格广为人知的英伟达高功能GPU开端着重整体具有本钱和能效时,关于商场时的其他竞赛者而言无疑是一个坏消息,这也正是招引更多超算体系运用英伟达产品的要害因素。

而且,英伟达也推出了为安培架构和A100优化的软件支撑,包含CUDA 11、50多个CUDA-X库的新版别; 多形式对话式AI服务结构NVIDIA Jarvis;深度引荐使用结构 NVIDIA Merlin; RAPIDS开源数据科学软件库套件;NVIDIA HPC SDK。

正在经过软硬件产品协助开发者构建并加快HPC、基因组学、5G、数据科学、机器人学等范畴的使用的英伟达,未来要点的进步方向会在哪?

脚注栏目
脚注信息
版权所有Copyright © 2013 关键词凯发k8官-凯发k8ag-凯发旗舰厅 All Rights Reserved