精品国产成人一区二区三区-女子十八毛片-欧洲性猛交-无码不卡一区二区三区在线观看-www.四虎在线-伊人网国产-国精产品自偷自偷综合下载-不卡av网站-俄罗斯黄色大片-一本久久知道综合久久-国产精品日韩一区二区-日韩精品色-免费人成网ww555kkk在线-黄色在线观看免费-日韩在线免费-久久久久99人妻一区二区三区-十八禁真人啪啪免费网站

機電之家 > 機電號 > 正文 申請入駐

英偉達全新GPU A100問市,Ampere架構賦予驚人性能

在今年五月,英偉達發(fā)布了基于全新Ampere架構打造的GPU A100。


See the source image


據(jù)該公司CEO黃仁勛介紹,A100 采用臺積電當時最先進的7 納米工藝打造,擁有 540 億個晶體管,面積高達 826mm2,GPU 的最大功率也達到了 400W。又因為同時搭載了三星 HBM2 顯存、第三代 Tensor Core和帶寬高達600GB/s 的新版 NVLink,英偉達的A100在多個應用領域也展現(xiàn)出強悍的性能。 

 image.png


從英偉達提供的數(shù)據(jù)可以看到,如果用 PyTorch 框架跑 AI 模型,相比上一代 V100 芯片,A100 在 BERT 模型的訓練上性能提升 6 倍,BERT 推斷時性能提升 7 倍。而根據(jù)MLPerf組織在十月底發(fā)布的最新推理基準測試(Benchmark)MLPerf Inference v0.7結果,英偉達A100 Tensor Core GPU在云端推理的基準測試性能是最先進英特爾CPU的237倍。


但英偉達不止步于此。在昨日,他們發(fā)布了面向AI超級計算的全球最強GPU——A100 80GB;與此同時,他們還帶來了一體式AI數(shù)據(jù)中心NVIDIA DGX Station A100以及NVIDIA Mellanox 400G InfiniBand產品。


全球最強的AI超算GPU


據(jù)英偉達方面介紹,公司全新的 A100 80GB GPU的最大特點在于采用了HBM2E內存技術,能將A100 40GB GPU的高帶寬內存增加一倍至80GB,這樣的設計也讓英偉達成為業(yè)內首個實現(xiàn)了2TB/s以上的內存帶寬的企業(yè)。 

 image.png


“若想獲得HPC和AI的最新研究成果,則需要構建最大的模型,而這需要比以往更大的內存容量和更高的帶寬。A100 80GB GPU所提供的內存是六個月前推出的前代產品的兩倍,突破了每秒2TB的限制,使研究人員可以應對全球科學及大數(shù)據(jù)方面最嚴峻的挑戰(zhàn)。”NVIDIA應用深度學習研究副總裁Bryan Catanzaro表示。


此外,第三代Tensor Core核心、MIG技術、結構化稀疏以及第三代NVLink和NVSwitch,也是全新GPU能夠獲得市場認可的保證。

                                               image.png


從英偉達提供的資料我們可以看到,該公司的第三代Tensor Core核心通過全新TF32,能將上一代Volta架構的AI吞吐量提高多達20倍;通過FP64,新核心更是能將HPC性能提高多達2.5倍;而通過 INT8,新核心也可以將AI推理性能提高多達20倍,并且支持BF16數(shù)據(jù)格式。


MIG技術則能將單個獨立實例的內存增加一倍,并可最多提供七個MIG,讓每個實例具備10GB內存。英偉達方面表示,該技術是一種安全的硬件隔離方法,在處理各類較小的工作負載時,可實現(xiàn)GPU最佳利用率。例如在如RNN-T等自動語言識別模型的AI推理上,單個A100 80GB MIG實例可處理更大規(guī)模的批量數(shù)據(jù),將生產中的推理吞吐量提高1.25倍。


至于結構化稀疏,則可以將推理稀疏模型的速度提高2倍;包括第三代NVLink和NVSwitch在內的新一代互連技術,則可使GPU之間的帶寬增加至原來的兩倍,將數(shù)據(jù)密集型工作負載的GPU數(shù)據(jù)傳輸速度提高至每秒600 gigabytes。


除了性能提升以外,基于A100 40GB的多樣化功能設計的A100 80GB GPU也成為需要大量數(shù)據(jù)存儲空間的各類應用的理想選擇。


以DLRM等推薦系統(tǒng)模型為例,他們?yōu)锳I訓練提供了涵蓋數(shù)十億用戶和產品信息的海量表單。但A100 80GB可實現(xiàn)高達3倍加速,使企業(yè)可以重新快速訓練這些模型,從而提供更加精確的推薦;在TB級零售大數(shù)據(jù)分析基準上,A100 80GB將其性能提高了2倍,使其成為可對最大規(guī)模數(shù)據(jù)集進行快速分析的理想平臺;對于科學應用,A100 80GB可為天氣預報和量子化學等領域提供巨大的加速。


“作為NVIDIA HGX AI超級計算平臺的關鍵組件,A100 80GB還可訓練如GPT-2這樣的、具有更多參數(shù)的最大模型?!庇ミ_方面強調。


下一代400G InfiniBand


在發(fā)布A100 80GB的同時,英偉達還帶了下一代的400G InfiniBand產品。在講述英偉達的新品之前,我們有必要先了解一下什么是InfiniBand。


所謂InfiniBand,是一種網(wǎng)絡通信協(xié)議,它提供了一種基于交換的架構,由處理器節(jié)點之間、處理器節(jié)點和輸入/輸出節(jié)點(如磁盤或存儲)之間的點對點雙向串行鏈路構成。每個鏈路都有一個連接到鏈路兩端的設備,這樣在每個鏈路兩端控制傳輸(發(fā)送和接收)的特性就被很好地定義和控制。而早前被英偉達收購的Mellanox則是這個領域的專家。


資料顯示,Mellanox為服務器,存儲和超融合基礎設施提供包括以太網(wǎng)交換機,芯片和InfiniBand智能互連解決方案在內的大量的數(shù)據(jù)中心產品,其中,更以InfiniBand互連,是這些產品中重中之重。


image.png


據(jù)英偉達介紹,公司推出的第七代Mellanox InfiniBand NDR 400Gb/s上帶來了更低的延遲,與上一代產品相比,新的產品更是實現(xiàn)了數(shù)據(jù)吞吐量的翻倍。又因為英偉達為這個新品帶來了網(wǎng)絡計算引擎,這就讓其能夠獲得額外的加速。


 image.png


英偉達進一步指出,作為一個面向AI超級計算的業(yè)界最強大的網(wǎng)絡解決方案,Mellanox NDR 400G InfiniBand交換機,可提供3倍的端口密度和32倍的AI加速能力。此外,它還將框式交換機系統(tǒng)的聚合雙向吞吐量提高了5倍,達到1.64 petabits/s,從而使用戶能夠以更少的交換機,運行更大的工作負載。


“基于Mellanox InfiniBand架構的邊緣交換機的雙向總吞吐量可達51.2Tb/s,實現(xiàn)了具有里程碑意義的每秒超過665億數(shù)據(jù)包的處理能力?!庇ミ_方面強調。而通過提供全球唯一的完全硬件卸載和網(wǎng)絡計算平臺,NVIDIA Mellanox 400G InfiniBand實現(xiàn)了大幅的性能飛躍,可加快相關研究工作的進展。


“我們的AI客戶的最重要的工作就是處理日益復雜的應用程序,這需要更快速、更智能、更具擴展性的網(wǎng)絡。NVIDIA Mellanox 400G InfiniBand的海量吞吐量和智能加速引擎使HPC、AI和超大規(guī)模云基礎設施能夠以更低的成本和復雜性,實現(xiàn)無與倫比的性能?!?NVIDIA網(wǎng)絡高級副總裁Gilad Shainer表示。


從他們提供的數(shù)據(jù)我們可以看到,包括Atos、戴爾科技、富士通、浪潮、聯(lián)想和SuperMicro等公司在內的全球領先的基礎設施制造商,計劃將Mellanox 400G InfiniBand解決方案集成到他們的企業(yè)級產品中去。此外,包括DDN、IBM Storage以及其它存儲廠商在內的領先的存儲基礎設施合作伙伴也將支持NDR。


全球唯一的千兆級工作組服務器


為了應對不同開發(fā)者對AI系統(tǒng)的需求,在推出芯片和連接解決方案的同時,英偉達在2017年還推出一體式的AI數(shù)據(jù)中心NVIDIA DGX Station。作為世界上首款面向 AI 開發(fā)前沿的個人超級計算機,開發(fā)者只需要對其執(zhí)行簡單的設置,就可以用Caffe、TensorFlow等去做深度學習訓練、高精度圖像渲染和科學計算等傳統(tǒng)HPC應用,避免了裝驅動和配置環(huán)境等麻煩,這很適合高校、研究所、以及IT力量相對薄弱的企業(yè)。


 image.png


昨日,英偉達今日發(fā)布了全球唯一的千兆級工作組服務器NVIDIA DGX StationA100 。作為開創(chuàng)性的第二代人工智能系統(tǒng),DGX Station A100加速滿足位于全球各地的公司辦公室、研究機構、實驗室或家庭辦公室中辦公的團隊對于機器學習和數(shù)據(jù)科學工作負載的強烈需求。而為了支持諸如BERT Large推理等復雜的對話式AI模型,DGX Station A100比上一代DGX Station提速4倍以上。對于BERT Large AI訓練,其性能更是提高近3倍。


image.png


從性能來看,英偉達方面表示,DGX Station A100的AI性能可達2.5 petaflops,是唯一一臺配備四個通過NVIDIA NVLink完全互連的全新NVIDIA A100 Tensor Core GPU的工作組服務器,可提供高達320GB的GPU內存,能夠助力企業(yè)級數(shù)據(jù)科學和AI領域以最速度取得突破。


作為唯一支持NVIDIA多實例GPU(MIG)技術的工作組服務器,單一的DGX Station A100最多可提供28個獨立GPU實例以運行并行任務,并可在不影響系統(tǒng)性能的前提下支持多用戶。


為了支持更大規(guī)模的數(shù)據(jù)中心工作負載,DGX A100系統(tǒng)還將配備全新NVIDIA A100 80GB GPU使每個DGX A100系統(tǒng)的GPU內存容量增加一倍(最高可達640GB),從而確保AI團隊能夠使用更大規(guī)模的數(shù)據(jù)集和模型來提高準確性。


“全新DGX A100 640GB系統(tǒng)也將集成到企業(yè)版NVIDIA DGX SuperPODTM 解決方案,使機構能基于以20 個DGX A100系統(tǒng)為單位的一站式AI超級計算機,實現(xiàn)大規(guī)模AI模型的構建、訓練和部署。”英偉達方面強調。


該公司副總裁兼 DGX系統(tǒng)總經理Charlie Boyle則表示:“DGX Station A100將AI從數(shù)據(jù)中心引入可以在任何地方接入的服務器級系統(tǒng)。數(shù)據(jù)科學和AI研究團隊可以使用與NVIDIA DGX A100系統(tǒng)相同的軟件堆棧加速他們的工作,使其能夠輕松地從開發(fā)走向部署。”


從英偉達提供的資料我們可以看到,配備A100 80GB GPU的NVIDIA DGX SuperPOD系統(tǒng)將率先安裝于英國的Cambridge-1超級計算機,以加速推進醫(yī)療保健領域研究,以及佛羅里達大學的全新HiPerGator AI超級計算機,該超級計算機將賦力這一“陽光之州”開展AI賦能的科學發(fā)現(xiàn)。


在今年發(fā)布的第二季財報上,英偉達數(shù)據(jù)中心業(yè)務首超游戲,成為公司營收最大的業(yè)務板塊。從營收增長上看,與去年同期相比,英偉達數(shù)據(jù)中心業(yè)務業(yè)務大幅增長167%,由此可以看到英偉達在這個市場影響力的提升以及公司對這個市場的信心。


考慮到公司深厚的技術積累和過去幾年收購所做的“查漏補缺”,英偉達必將成為Intel在數(shù)據(jù)中心的最強勁挑戰(zhàn)者。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“機電號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of JDZJ Hao, which is a social media platform and only provides information storage services.

/企業(yè)主營產品/
/閱讀下一篇/

超值推薦 小螞蟻15萬蟻粉款蟻炫版 用實

相關推薦
熱點推薦
AI驅動的電容老化預測:邊緣計算單元與歷史數(shù)據(jù)訓練的協(xié)同模型

AI驅動的電容老化預測:邊緣計算單元與歷史數(shù)據(jù)訓練的協(xié)同模型

東莞市平尚電子科技有限公司
2025/6/11 16:01:55
智能尾燈矩陣:貼片二極管反向恢復時間對LED驅動諧波的抑制

智能尾燈矩陣:貼片二極管反向恢復時間對LED驅動諧波的抑制

東莞市平尚電子科技有限公司
2025/6/11 15:09:28
平尚科技貼片電阻溫漂補償算法精度優(yōu)化至±0.05%

平尚科技貼片電阻溫漂補償算法精度優(yōu)化至±0.05%

東莞市平尚電子科技有限公司
2025/6/11 10:58:13
冗余電源動態(tài)切換:電解電容-固態(tài)電容無縫切換的故障安全機制

冗余電源動態(tài)切換:電解電容-固態(tài)電容無縫切換的故障安全機制

東莞市平尚電子科技有限公司
2025/6/7 14:46:46
車規(guī)電阻選型指南:ADAS雷達信號鏈的精度與成本平衡

車規(guī)電阻選型指南:ADAS雷達信號鏈的精度與成本平衡

東莞市平尚電子科技有限公司
2025/5/30 11:11:36
L4級自動駕駛的感知冗余方案——平尚科技牛角電容賦能高可靠電源架構

L4級自動駕駛的感知冗余方案——平尚科技牛角電容賦能高可靠電源架構

東莞市平尚電子科技有限公司
2025/5/29 16:24:11
日立鐵路和 Connected Places Catapult 聯(lián)合推出 AI 鐵路維護技術

日立鐵路和 Connected Places Catapult 聯(lián)合推出 AI 鐵路維護技術

2025ARTS上海國際先進軌道交通技術展覽會
2025/2/28 17:10:57
2025廣州新能源汽車功率半導體展:科技賦能綠色出行

2025廣州新能源汽車功率半導體展:科技賦能綠色出行

廣州嘉實沃森展覽有限公司
2025/2/21 9:46:06
新能源電池的固廢回收管理解決方案

新能源電池的固廢回收管理解決方案

北京佳惠信達科技有限公司
2025/2/13 17:47:23
聚焦2025廣州新能源汽車功率半導體展,共探行業(yè)新未來

聚焦2025廣州新能源汽車功率半導體展,共探行業(yè)新未來

廣州嘉實沃森展覽有限公司
2025/2/5 9:25:13
AUTO TECH China 2025華南展:助力汽車零部件行業(yè)新發(fā)展

AUTO TECH China 2025華南展:助力汽車零部件行業(yè)新發(fā)展

廣州嘉實沃森展覽有限公司
2025/1/8 10:58:17
闖王無人值守全自動洗車機:智能洗車新風尚,開啟便捷養(yǎng)車新時代!

闖王無人值守全自動洗車機:智能洗車新風尚,開啟便捷養(yǎng)車新時代!

上海闖王實業(yè)有限公司
2025/1/5 20:12:26
玻璃貼膜使用的場所

玻璃貼膜使用的場所

長安仕佳室內裝飾材料經銷處
2024/7/10 17:55:42
160388文章數(shù) 2583關注度
往期回顧 全部

機械相關熱點

機械相關推薦

頭條要聞

機械要聞

機械資訊

往期機械要聞

永登县| 永修县| 分宜县| 福州市| 梁山县| 夏邑县| 池州市| 罗田县| 东至县| 娄烦县| 岱山县| 天气| 都兰县| 米脂县| 临潭县| 青州市| 高雄县| 文成县| 英山县| 甘洛县| 清河县| 宁安市| 马山县| 谢通门县| 溧水县| 辛集市| 湘阴县| 荣昌县| 榆林市| 清原| 庆阳市| 安平县| 岳阳市| 玉龙| 呼玛县| 隆子县| 曲沃县| 手机| 时尚| 保德县| 临清市|