在2017年的NVIDIA GPU Technology Conference (GTC)中,NVIDIA推出了針對全新人工智能(AI)和高性能計算(HPC)打造的GPU計算架構(gòu)Volta,并推出基于Volta的Tesla V100數(shù)據(jù)中心GPU。該公司稱新產(chǎn)品的計算效能達120 Teraflops,相當(dāng)于100個CPU的性能總和。
Volta是NVIDIA的第七代GPU架構(gòu),采用210億個晶體管構(gòu)建,并提供相當(dāng)于100個CPU的深度學(xué)習(xí)功能。它比NVIDIA目前的GPU架構(gòu)Pascal效能高出5倍,峰值的Teraflops效能則比兩年前推出的Maxwell架構(gòu)提高15倍。
該公司稱,這個效能表現(xiàn)超過摩爾定律的預(yù)測4倍。
人工智能的需求正在各行各業(yè)快速展開。在汽車、醫(yī)療等行業(yè),數(shù)據(jù)科學(xué)家和研究人員們更多地依賴神經(jīng)網(wǎng)絡(luò)來推動他們的技術(shù)進展,例如讓自動駕駛車輛的運輸更安全、提供新的智能客戶體驗,以及加強抗癌研究等。
“人工智能帶來了智能的自動化,將推動自工業(yè)革命以來最大的一次社會進展。”NVIDIA創(chuàng)辦人兼首席執(zhí)行官黃仁勛指出,深度學(xué)習(xí)讓計算器軟件擁有學(xué)習(xí)能力,帶來了突破性的人工智能,而Volta是NVIDIA數(shù)千名工程師花費三年時間開發(fā)的成果,目的是在各個行業(yè)都實現(xiàn)用人工智能改變生活的潛力。
劍指高性能數(shù)據(jù)中心
所有行業(yè)應(yīng)用的基礎(chǔ)--數(shù)據(jù)中心,也由于日漸復(fù)雜的網(wǎng)絡(luò),需要提供更強大的處理能力。他們需要有效的擴展,以支持快速采用高度準(zhǔn)確的基于人工智能的服務(wù),如自然語言虛擬助手以及個性化搜索和推薦系統(tǒng)。
今年以來數(shù)據(jù)中心對芯片的需求持續(xù)增長,第一季度NVIDIA的數(shù)據(jù)中心營收達到4.09億美元,勁增48.4%,優(yōu)于市場預(yù)期。盡管NVIDIA的數(shù)據(jù)中心營收和對手英特爾(Intel)相比仍有4-5倍以上的差距,但該公司認(rèn)為其GPU架構(gòu)在高性能計算領(lǐng)域優(yōu)勢遠(yuǎn)超過傳統(tǒng)CPU。
NVIDIA表示,針對計算科學(xué)和數(shù)據(jù)科學(xué)應(yīng)用,Volta提供了新的平臺。通過將CUDA內(nèi)核和新的Volta Tensor Core配置在統(tǒng)一架構(gòu)中,采用單一Tesla V100 GPU的服務(wù)器可以替代搭載數(shù)百個CPU的傳統(tǒng)HPC服務(wù)器。
截至目前,Tesla GPU已經(jīng)應(yīng)用在全球主要網(wǎng)絡(luò)和云服務(wù)提供商,包括Alphabet的谷歌(Google)、臉書(Facebook)、IBM、微軟(Microsoft)和阿里巴巴等。
為了加強數(shù)據(jù)中心應(yīng)用,Tesla V100 GPU的搭載了640個Tensor內(nèi)核,并在GPU架構(gòu)中采用CUDA和Tensor配對的架構(gòu),在單一GPU中提供超級計算機的人工智能運算效能。而為了實現(xiàn)芯片內(nèi)的高速互連,新的NVLink吞吐量也較上一代的NVLink提高二倍,以在GPU之間以及GPU到CPU之間提供高速通信能力。
另外,與三星(Samsung)合作開發(fā)的900GB/s HBM2 DRAM實現(xiàn)了比上一代GPU多出50%的內(nèi)存帶寬,可支持Volta在高性能計算應(yīng)用中所需的計算吞吐量。