AD

2017年9月18日星期一

Nvidia探索將多GPU封裝到一塊:輕鬆打破舊架構極限

商業計算、可選研究、以及 4K 多屏遊戲等需求,不斷推升著對現代 GPU 的性能需求。根據一份近期的研究報告,Nvidia 認為正在迅速接近當前 GPU 架構模型的極限,因此需要尋找新的方法去攻堅。當前這個想法仍處於模擬階段,但文中提到的"多芯片模塊 GPU"(MCM-GPU)的概念,有望最終將多顆 GPU 模塊整合到一處。

在意識到 Nvidia 將很快難以通過當前架構榨取 GPU 性能之後,亞利桑那州立大學、英偉達、德州大學奧斯汀分校、以及巴塞羅那超算中心攜手展開了研究。

此前,廠商還可以通過在每次製程迭代時堆積更多的流處理器來提升 GPU 性能。但遺憾的是,在單一模塊中塞入更多晶體管的方法,已經變得越來越困難。

以 Nvidia V100 GPU 為例,其已經需要代工廠商(台積電)將製程推到 12nm 的極限。此外,製造規模越來越大的模塊,其成本和相關問題也不可忽視(比如因製造錯誤遇到的數量減少)。

雖然 Nvidia 可以通過將多顆 GPU 裝在一塊 PCB 上的方式來提升顯卡性能(比如 Tesla K10 和 K80),但當前仍有一些未能解決的問題 —— 比如跨多 GPU 的任務分配就需要編程來提升硬件效率。

於是研究人員們另辟蹊徑,決定在封裝技術上尋找新方法,讓 Nvidia 可以將多個 GPU 模塊(GPMs)封裝到一塊。這些 GPMs 比當代 GPU 要小一些,製造起來也更容易和便宜。

盡管人們對其性能仍有疑問,但研究人員聲稱近期基板技術的發展(PDF)已經能夠幫助其部署一種快速、強健的模塊通信互聯架構。從理論上來講,其帶寬可達數 TB/s 。

在 Nvidia 內部 GPU 模擬中,研究團隊將 MCM-GPU 堆到了 256 組 SMs,而 Pascal 架構僅為 56 組 SMs 。然後團隊基於當前架構進行了預測,結果顯示 MCM-GPU 可提速 45.5% 。

此外,在同一板子上進行的多 GPU 性能對比表明,MCM-GPU 有 26.8% 的領先優勢。最後,有消息稱 AMD 公司也有類似的點子(基於 Navi GPU)。

[編譯自:TechReport , 來源:Nvidia(PDF)]

相關文章
或許Model 3不該少了它:抬頭顯示屏2017年08月13日
買齊蘋果官方轉換頭需花費多少?- 5700元2017年08月13日
聯想Moto X4本月24日發布:預計3000元左右2017年08月13日
傳銷女骨幹以相親為名 用QQ色誘16名男青年迫其入夥2017年08月13日
亞馬遜為不可靠的日食觀測鏡購買者提供退款服務2017年08月13日
八個月內連破三道大關 海外比特幣價格突破4000美元,再創新高2017年08月13日
京東微聯上傳用戶WiFi密碼 回應:不會導致泄露2017年08月13日
監管批設收緊 網絡小貸牌照受捧轉讓三四千萬2017年08月13日
FCC決定將"網絡中立"評論時間延長兩周2017年08月13日
"賺它一個億"等,這樣奇葩的公司名字以後沒法取了2017年08月13日

没有评论:

发表评论