国产色婷婷国产综合在线理论片a_欧美性受xxxx黑人xyx_国产精品成人在线观看_影音先锋欧美在线资源_国产91在线播放_久久久久亚洲精品成人网小说_成人444kkkk在线观看_天堂va蜜桃一区二区三区漫画版_欧美大片在线观看_美女网站视频久久

Nvidia發布下一代GPU架構 芯粒技術成為新亮點

來源:半導體行業觀察

Nvidia不久前發布了下一代GPU架構,架構名字為“Hopper”(為了紀念計算機科學領域的先驅之一Grace Hopper)。

根據Nvidia發布的具體GPU規格,我們認為Nvidia對于Hopper的主要定位是進一步加強對于人工智能方面的算力,而其算力升級依靠的不僅僅是硬件部分,還有不少算法和軟件協同設計部分,本文將為讀者做詳細分析。

我們認為,在Nvidia更下一代的GPU中,我們有望看到芯粒技術成為新的亮點來突破其瓶頸。

Hopper的能有多強

根據Nvidia公布的數據,基于Hopper架構的GPU(H100)使用TSMC的4nm工藝設計,將會是Ampere架構(使用TSMC 7nm工藝)之后的又一次重大升級,其16位浮點數峰值算力(FP16)將會由之前的312 TFLOPS增加到1000 TFLOPS,INT8峰值算力則由之前的624TOPS增加到2000TOPS。

由此可見FP16(常用于人工智能訓練)和INT8(常用于人工智能推理)的峰值算力基本上都是翻了三倍,這個H100相對A100峰值算力提升的比例基本符合A100和再上一代GPU V100的提升數字。

而根據Nvidia官方公布的具體任務能提升,我們也可以看到大多數人工智能相關任務的能提升基本在2-4倍之間(尤其是使用transformer類模型的能提升較為突出,接4倍),初看也和峰值算力提升三倍基本吻合。

但是如果我們仔細分析Nvidia H100具體芯片指標,我們認為在人工智能任務中,H100的提升不僅僅是來自于一些硬件指標(例如核心數量,DRAM帶寬,片上存儲器)的提升,更是來自于Nvidia做了算法硬件協同設計。

例如,Nvidia在Hopper架構中引入了為Transformer系列模型專門設計的八位浮點數(FP8)計算支持,并且還加入了專門的Transformer engine硬件模塊來確保transformer模型的運行效率。因此,我們看到在Nvidia公布的人工智能任務能提升中,使用transformer的任務(如GPT-3)的能提升要高于傳統的基于CNN(如Mask R-CNN)的能提升。

存儲方面提升相對較小

在人工智能等高能計算中,存儲(包括DRAM接口帶寬和片上存儲容量)和計算單元一樣重要,在很多時候存儲甚至會成為整體能的瓶頸,例如峰值算力無法持續,導致均計算能力遠低于峰值算力。

在Hopper架構中,我們看到了峰值算力提升大約是Ampere的三倍,然而在DRAM帶寬和片上存儲方面,Hopper相對于Ampere的提升較小,只有1.5倍和1.25倍。

在DRAM帶寬方面,我們看到H100有兩個版本,其中使用最新一代HBM3的版本的內存帶寬是3TB/s,相比于A100(2TB/s)的提升為1.5倍,相比峰值算力的三倍提升相對較小。

反觀A100相對更上一代V100的內存帶寬提升為2.2倍,因此我們認為H100的HBM3內存帶寬提升幅度確實相對上一代來說較小。我們認為,HBM3帶寬提升較小可能和功耗有關。

仔細分析Hopper發布的GPU,我們發現Hopper架構的GPU目前有兩個品類,一個是使用HBM3內存的版本,而另一個是仍然使用HBM2e的版本。

HBM3版本的H100相對于使用HBM2e版本的H100在其他芯片架構上(包括計算單元)的差距不過10%(HBM3版本的計算單元較多),但是在功耗(TDP)上面,HBM3版本的H100的TDP比HBM2e版本H100整整高出兩倍(700W vs. 350W)。即使是相對于上一代使用7nm的Ampere架構,其功耗也提高了兩倍,因此能效比方面提升并不多,或者說即使更先進的芯片工藝也沒法解決HBM3的功耗問題。

因此,我們認為H100 HBM3版本DRAM內存帶寬增加可能是受限于整體功耗。而當DRAM帶寬提升較小時,如何確保DRAM帶寬不成為能瓶頸就是一個重要的問題,因此Nvidia會提出FP4和Transformer Engine等算法-硬件協同設計的解決方案,來確保在執行下游任務的時候仍然效率不會受限。

除了DRAM帶寬之外,另一個值得注意的點是Hopper GPU的片上存儲增長僅僅是從A100的40MB增長到了H100的50MB;相對來說,A100的片上存儲相對于更上一代V100則是增加了6倍。

我們目前尚不清楚H100上片上存儲增長這么少的主要原因,究竟是因為Nvidia認為40-50MB對于絕大部分任務已經夠用,還是因為工藝良率的原因導致再加SRAM會大大提升成本。

但是,無論如何,隨著人工智能模型越來越復雜, 對于片上存儲的需求越來越高,片上存儲容量較小就會需要有更好的人工智能模型編譯器和底層軟件庫來確保模型執行過程中能有最高的效率(例如,確保能把模型數據更好地劃分以盡量在片上存儲中執行,而盡可能少地使用DRAM)。

Nvidia在這一點上確實已經有了很深厚的積累,各種高能相關的軟件庫已經有很好的成熟度。

我們估計Nvidia有強大的軟件生態作為后盾也是它有能力在設計中放較少片上存儲(以及較小的DRAM帶寬)的重要原因。

這一點結合之前Nvidia在Hopper引入的新模型-芯片結合設計技術,例如能大大降低內存需求的FP4技術,以及為了Transformer模型專門設計的Transformer Engine,這些其實從正反兩面論證了我們的觀點,即Hopper架構很多的能提升事實上是來自于軟硬件結合設計,而并非僅僅是芯片/硬件能提升。

Nvidia下一步突破點在哪里?

如前所述,Nvidia的Hopper架構GPU的芯片領域的突破相比上一代Ampere架構并沒有特別大,而是主要由軟硬件結合設計實現能提升。

我們看到在存儲領域(包括DRAM接口和片上存儲容量)的提升尤其小,而這可能也會是Nvidia進一步提升GPU能的一個重要瓶頸,當然突破了之后也會成為一個重要的技術壁壘。

如前所述,HBM3的功耗可能是一個尚未解決的問題,而如何在芯片上放入更多的片上存儲器則將會被良率和成本所限制。

在存儲成為瓶頸的時候,芯片粒(chiplet)將會成為突破瓶頸的重要技術。正如之前所討論的,當片上存儲容量更大時,GPU對于DRAM等片外存儲的需求就會越來越少,而片上存儲的瓶頸則是良率和成本。

一般來說,芯片的良率和其芯片面積成負相關,當芯片面積越大時,則芯片良率會相應下降,尤其是在先進工藝中,良率更是一個重要考量。

而芯片粒則是可以大大改善這個問題:芯片粒技術并不是簡單地增加芯片的面積(例如更多片上存儲),而是把這些模塊分散在不同的芯片粒中,這樣一來整個芯片粒的芯片面積就會大大下降,從而改善良率。

此外,隨著GPU規模越來越大,為了能更好地控制整體良率,使用芯片粒技術也是一個自然地選擇。

我們認為,在今天HBM3技術的功耗遇到瓶頸的時候,或者說HBM技術整體從功耗上遇到挑戰的時候,下一步的重要方向一定是從簡單地增加DRAM帶寬和在單個芯片上放更多晶體管變到更精細地設計架構和片上存儲,這也就讓芯片粒占到了舞臺中央

事實上芯片粒和GPU的結合對于業界來說并不陌生。事實上Nvidia最有力地競爭對手AMD已經把芯片粒技術使用在GPU上,此外在片上存儲部分AMD也發布了3D V-Cache,可望成為下一代繼續增加片上存儲的重要技術。

Nvidia在芯片粒方面也有相關布局,這次與Hopper同時間發布的用于芯片粒互聯的UCIe標準也意味著Nvidia在芯片粒領域的投資

我們認為,在Nvidia未來公布的GPU中,非常有可能可以看到芯片粒技術的大量應用,而這結合Nvidia的軟硬件協同優化技術有可能會成為下一代Nvidia GPU的最大亮點。

標簽: 高端顯卡 游戲玩家 性能提升

推薦

財富更多》

動態更多》

熱點

国产色婷婷国产综合在线理论片a_欧美性受xxxx黑人xyx_国产精品成人在线观看_影音先锋欧美在线资源_国产91在线播放_久久久久亚洲精品成人网小说_成人444kkkk在线观看_天堂va蜜桃一区二区三区漫画版_欧美大片在线观看_美女网站视频久久
成人网在线播放| 91精品国产综合久久香蕉麻豆 | 日本高清不卡一区| 91精品欧美久久久久久动漫 | 亚洲精品免费看| 99久久国产综合精品色伊| 91麻豆精品国产91久久久更新时间 | 日本一区二区不卡视频| 成人激情文学综合网| 一区二区三区四区乱视频| 欧美日韩小视频| 国产suv精品一区二区883| 亚洲欧美成aⅴ人在线观看| 91精品国产综合久久香蕉的特点| 久久av老司机精品网站导航| 日本一区二区三区dvd视频在线| 99久久99久久免费精品蜜臀| 日本91福利区| 亚洲大片一区二区三区| 亚洲欧洲一区二区三区| 26uuu国产日韩综合| 91精品国产综合久久久蜜臀粉嫩| 成人在线一区二区三区| 高清在线成人网| 国产精品99久久久久久有的能看| 午夜精品久久久久影视| 亚洲女同女同女同女同女同69| 久久久久久久综合狠狠综合| 欧美变态tickling挠脚心| 日韩视频中午一区| 欧美v日韩v国产v| 久久综合狠狠综合久久激情| 精品国产一区二区亚洲人成毛片| 欧美电影精品一区二区| 国产精品人人做人人爽人人添| 国产精品久久久久久久第一福利| 亚洲欧洲精品一区二区三区| 一级女性全黄久久生活片免费| 亚洲另类中文字| 日本不卡一区二区| 老司机精品视频导航| 成人黄色国产精品网站大全在线免费观看| 国产精品一区二区在线看| 91在线观看一区二区| 欧美在线色视频| 2021中文字幕一区亚洲| 亚洲电影第三页| av在线不卡观看免费观看| 欧美成人激情免费网| 日韩精品亚洲一区二区三区免费| 丁香亚洲综合激情啪啪综合| 日韩美女视频在线| 美国欧美日韩国产在线播放| 欧美性生交片4| 亚洲国产成人tv| 久久久天堂av| 精品无码三级在线观看视频| 日韩一区二区在线观看视频播放| 一区二区三区在线看| 91精品福利视频| 五月天欧美精品| 欧美日韩国产一级二级| 亚洲国产精品麻豆| 欧美一区二视频| 成人性生交大合| 一个色妞综合视频在线观看| 欧美四级电影网| 日韩高清在线不卡| 久久九九久久九九| 91麻豆自制传媒国产之光| 一区二区三区日韩欧美精品| 91精品91久久久中77777| 午夜免费久久看| 日韩毛片一二三区| 日韩视频一区二区三区在线播放| 国产一区二区日韩精品| 亚洲福利视频一区| 国产精品超碰97尤物18| 91美女蜜桃在线| 国产一区视频在线看| 亚洲综合男人的天堂| 国产欧美日韩麻豆91| 欧美日韩国产一级二级| 欧美日韩国产高清一区二区| 在线精品观看国产| 91国偷自产一区二区三区成为亚洲经典| 亚洲成a天堂v人片| 亚洲国产精品久久久男人的天堂| 国产精品婷婷午夜在线观看| 精品免费一区二区三区| 在线不卡一区二区| 欧美日韩亚洲另类| 欧美mv日韩mv国产| 欧美国产日韩亚洲一区| 亚洲国产精品传媒在线观看| 国产精品久久久久久久久晋中| 欧美激情一区二区三区不卡| 亚洲欧美二区三区| 亚洲国产成人av网| 免费在线观看一区二区三区| 精品一区二区在线免费观看| 成人手机电影网| 7777精品伊人久久久大香线蕉的| 精品粉嫩aⅴ一区二区三区四区| 欧美成人一级视频| 亚洲午夜精品网| 国产电影精品久久禁18| 欧美日韩在线精品一区二区三区激情| 91.成人天堂一区| 一区二区三区欧美| 成人毛片在线观看| 欧美一级搡bbbb搡bbbb| 一区二区三区四区视频精品免费| 国产一区二区在线电影| 91精品国产综合久久久久久漫画| 国产精品久久久久久久久图文区| 国产一区二区三区久久久 | 国产精品一二三四五| 日韩欧美www| 国产一区二区在线视频| 精品国产伦一区二区三区免费| 石原莉奈在线亚洲三区| 欧美性受xxxx| 国产在线精品一区二区| 国产视频在线观看一区二区三区| 日本免费新一区视频| 精品处破学生在线二十三| 成人夜色视频网站在线观看| 国产亚洲成年网址在线观看| av一本久道久久综合久久鬼色| 亚洲美腿欧美偷拍| 日韩一区二区三区电影在线观看| 国产一区二区三区久久久| 日韩理论片中文av| 欧美一区二区在线观看| av中文字幕一区| 国产一区二区三区四区五区入口 | 中文字幕亚洲综合久久菠萝蜜| 色94色欧美sute亚洲13| 床上的激情91.| 韩国精品一区二区| 日韩av电影免费观看高清完整版 | 国产精品久久久久桃色tv| 精品视频一区 二区 三区| av在线不卡电影| 成人av免费网站| 国产99久久精品| av成人免费在线观看| 成人手机电影网| 91久久精品一区二区三| 欧美专区在线观看一区| 欧美理论在线播放| 欧美一区二区观看视频| 精品少妇一区二区三区| 国产色产综合色产在线视频| 国产精品青草久久| 一区二区三区四区不卡视频 | 亚洲婷婷国产精品电影人久久| 国产精品伦理一区二区| 亚洲欧美日韩国产成人精品影院| 亚洲视频图片小说| 亚洲第一成人在线| 国产精品一级片在线观看| 色菇凉天天综合网| 精品国产a毛片| 亚洲综合激情网| 成人网男人的天堂| 欧美精品一区二区三区四区 | 亚洲卡通欧美制服中文| 国产乱子伦视频一区二区三区| 色妞www精品视频| 国产日韩三级在线| 欧美aaa在线| 欧美特级限制片免费在线观看| 国产欧美日韩综合精品一区二区| 五月天丁香久久| 欧美日韩视频在线一区二区 | 国产日韩成人精品| 国产美女视频91| 国产精品欧美久久久久无广告| 国产在线精品一区二区三区不卡| 精品少妇一区二区三区日产乱码| 日韩va欧美va亚洲va久久| 欧美精品电影在线播放| 久久精品久久精品| 亚洲国产高清不卡| 欧美综合视频在线观看| 久久黄色级2电影| 亚洲欧洲日韩在线| 欧美日本一区二区三区| 精品一区二区三区av| 中文字幕第一区| 欧美丰满高潮xxxx喷水动漫| 国产成人午夜片在线观看高清观看| 国产性做久久久久久| 欧美视频在线观看一区| 粉嫩高潮美女一区二区三区| 午夜久久福利影院| 亚洲免费观看高清完整版在线观看熊 | 中文久久乱码一区二区|