在2017年的NVIDIA GPU Technology Conference (GTC)中,NVIDIA推出了針對全新人工智能(AI)和高性能計算(HPC)打造的GPU計算架構(gòu)Volta,并推出基于Volta的Tesla V100數(shù)據(jù)中心GPU。該公司稱新產(chǎn)品的計算效能達120 Teraflops,相當于100個CPU的性能總和。
Volta是NVIDIA的第七代GPU架構(gòu),采用210億個晶體管構(gòu)建,并提供相當于100個CPU的深度學習功能。它比NVIDIA目前的GPU架構(gòu)Pascal效能高出5倍,峰值的Teraflops效能則比兩年前推出的Maxwell架構(gòu)提高15倍。
該公司稱,這個效能表現(xiàn)超過摩爾定律的預測4倍。
人工智能的需求正在各行各業(yè)快速展開。在汽車、醫(yī)療等行業(yè),數(shù)據(jù)科學家和研究人員們更多地依賴神經(jīng)網(wǎng)絡來推動他們的技術進展,例如讓自動駕駛車輛的運輸更安全、提供新的智能客戶體驗,以及加強抗癌研究等。
“人工智能帶來了智能的自動化,將推動自工業(yè)革命以來最大的一次社會進展。”NVIDIA創(chuàng)辦人兼首席執(zhí)行官黃仁勛指出,深度學習讓計算器軟件擁有學習能力,帶來了突破性的人工智能,而Volta是NVIDIA數(shù)千名工程師花費三年時間開發(fā)的成果,目的是在各個行業(yè)都實現(xiàn)用人工智能改變生活的潛力。
劍指高性能數(shù)據(jù)中心
所有行業(yè)應用的基礎--數(shù)據(jù)中心,也由于日漸復雜的網(wǎng)絡,需要提供更強大的處理能力。他們需要有效的擴展,以支持快速采用高度準確的基于人工智能的服務,如自然語言虛擬助手以及個性化搜索和推薦系統(tǒng)。
今年以來數(shù)據(jù)中心對芯片的需求持續(xù)增長,第一季度NVIDIA的數(shù)據(jù)中心營收達到4.09億美元,勁增48.4%,優(yōu)于市場預期。盡管NVIDIA的數(shù)據(jù)中心營收和對手英特爾(Intel)相比仍有4-5倍以上的差距,但該公司認為其GPU架構(gòu)在高性能計算領域優(yōu)勢遠超過傳統(tǒng)CPU。
NVIDIA表示,針對計算科學和數(shù)據(jù)科學應用,Volta提供了新的平臺。通過將CUDA內(nèi)核和新的Volta Tensor Core配置在統(tǒng)一架構(gòu)中,采用單一Tesla V100 GPU的服務器可以替代搭載數(shù)百個CPU的傳統(tǒng)HPC服務器。
截至目前,Tesla GPU已經(jīng)應用在全球主要網(wǎng)絡和云服務提供商,包括Alphabet的谷歌(Google)、臉書(Facebook)、IBM、微軟(Microsoft)和阿里巴巴等。
為了加強數(shù)據(jù)中心應用,Tesla V100 GPU的搭載了640個Tensor內(nèi)核,并在GPU架構(gòu)中采用CUDA和Tensor配對的架構(gòu),在單一GPU中提供超級計算機的人工智能運算效能。而為了實現(xiàn)芯片內(nèi)的高速互連,新的NVLink吞吐量也較上一代的NVLink提高二倍,以在GPU之間以及GPU到CPU之間提供高速通信能力。
另外,與三星(Samsung)合作開發(fā)的900GB/s HBM2 DRAM實現(xiàn)了比上一代GPU多出50%的內(nèi)存帶寬,可支持Volta在高性能計算應用中所需的計算吞吐量。