close

  這幾天PC業界最火爆的新聞肯定就是NVIDIA發布新一代RTX 30系列顯卡,沒有之一。新的顯卡自然是使用了搭配有一系列新技術的新核心,比如說第二代RT Core啊,第三代Tensor Core啊這些。而對於RTX 3080和RTX 3090這兩張高端顯卡,它們GPU核心的外部,作為倉庫的顯存也有很大的變化,具體一點就是從GDDR6升級成了全新的GDDR6X。

3080顯存_01.PNG

  想必還有很多讀者記得當年在高端Pascal顯卡上面出現的GDDR5X顯存,它是NVIDIA和美光聯手合作研發出來的顯存種類,隨後被提交給了JEDEC進行標準化。不過可惜的是,除了美光之外,沒有其他內存廠採用該標準生產顯存產品,而顯卡市場上,除了高端的幾張Pascal顯卡外,也沒有別的顯卡採用GDDR5X顯存,就連NVIDIA自己也在之後就轉向了更高速的GDDR6顯存。

  NVIDIA在2018年的Turing顯卡上面首次應用了GDDR6顯存,在當時,GDDR6顯存能夠提供比疲態盡顯的GDDR5高的多的帶寬,也讓GDDR5X黯然失色。在GDDR6顯存正值壯年的現在,NVIDIA卻再次聯手美光,在短短的兩年之後就推出了它的進階版本,那麼到底是什麼原因讓NVIDIA決心換用GDDR6X,它的背後隱藏了哪些技術,又能帶來哪些好處呢?本期超能課堂就講一講GDDR6X顯存和它背後的全新技術。

帶寬最高提升50%,突破1000GB/s大關
  顯存是顯卡用來存放各種計算、渲染用素材的倉庫,GPU在執行圖形計算任務的時候,會不停地從這個倉庫裡面拿東西,而CPU也會不停地把數據傳遞過來,要GPU塞進倉庫裡面備用。那麼這個倉庫的大小,存取素材的快慢會很明顯地影響到GPU的工作效率,也就是說,顯存的大小和顯存的帶寬都會對顯卡的整體性能產生影響。

  而在如今,1080p分辨率早已普及,不少玩家已經開始用上1440p分辨率或者是4K分辨率的顯示器或電視,在更高的分辨率下,遊戲的材質、紋理等原始數據的體積越來越大,在進行圖形計算時所需的數據交換帶寬越來越高,這就需要顯卡設計廠使用有更高帶寬和容量的顯存系統,這也是NVIDIA和AMD兩家一直在提升他們顯卡的顯存規格的緣由。

3080顯存_02.PNG

  上一代的GDDR6顯存將數據的預取寬度從GDDR5時代的8-bit拓寬到了16-bit,這讓它的等效頻率再次倍增,能夠達到14~16Gbps左右,在顯存位寬相同的情況下,其帶寬較8Gbps的GDDR5顯存高75%~100%,進步非常巨大。而GDDR6X做到了更高的等效頻率,其範圍為19~21Gbps,也就是說,同顯存位寬的情況下,它能夠增加35%~50%的顯存帶寬,達到912GB/s~1008GB/s ,正式突破了1000GB/s這個大關。

  但是GDDR6X如果強行用傳統方式,也就是提昇運行頻率的方式去獲取帶寬的話,會遇到非常大的困難,比如說受到工藝的製約,它的運行頻率去不到更高,即便是能夠實現更高的等效頻率,其信號的純淨度也會大打折扣,在電氣性能上無法滿足要求。

  那麼該如何去推高它的等效頻率呢?NVIDIA和美光選擇從信號的調製方式上入手。

PAM4信號調製方式
  原本的GDDR系顯存在傳輸數據時使用的是非常原始的二進制信號,再具體一點,該系列顯存使用的是NRZ(Non-Return-to-Zero)調製,或者叫做PAM2調製。這種信號調製方式很簡單,它用高電平代表1,低電平代表0。如果要提高它的數據傳輸速率,只要提高顯存的時鐘頻率即可。但現在由於受到製程工藝等各方面因素的限制,顯存的時鐘頻率在現階段已經很難再攀高,那麼該怎麼辦呢?廠商想到了用新的信號調製機制來提高信號傳輸的效率,他們選擇了已經有較為廣泛的PAM4。

3080顯存_03.PNG

  PAM是一種用模擬信號脈衝編碼信息的信號調製方式,PAM4是其中較為簡單的一種。與NRZ這種僅有高和低兩種狀態的二進制信號不同的是,PAM4有4種不同的電平值,也就是有4種不同的狀態,而每種狀態對應著一組0和1的組合,也就是說,它的每個狀態對應了2個bit的數據量,較NRZ是翻倍的。

  如果這麼說還有些模糊的話,這裡可以將PAM4信號類比成MLC閃存存放數據的方式。我們知道,MLC閃存的每個單元可以存放2-bit的數據,在電信號層面上它表現為4種不同的電平,每個電平之間有固定的電壓間隔,主控在讀取和寫入的時候都按照固定的規則將數據和電信號進行轉換。

3080顯存_04.PNG

  那麼GDDR6X也是如此,根據NVIDIA公佈出來的信息,GDDR6X有四種不同的電平信號,每個電平信號之間的電壓差為250mV。

  在採用PAM4調製之後,顯存系統的信號純淨度有了一個很大的提升,有圖為證:

上為GDDR6,下為GDDR6X

3080顯存_05.PNG

  在換用PAM4之後,如果繼續沿用原本的16n突發讀取長度,那麼每次將會讀取到32-bit的數據,為了保證兼容性,GDDR6X將Burst Length降回了GDDR5時代的8n,這樣每次的預取數據仍然為16-bit。

NVIDIA的黑魔法加持
  為了更好的配合和利用GDDR6X顯存,NVIDIA還應用了一些自己的黑魔法技術,比如MTA(Max Transition Avoidance)編碼就是其中之一。

  MTA編碼是NVIDIA的專利技術,它是一項用於配合PAM4信號調製方式的技術,原理是將原本全長為16-bit的突發數據分割成兩部分進行發送,以降低信號在傳輸過程中出現的誤碼、損耗等問題。

更高的能效比
  不可否認的是,當代顯卡上的顯存能耗是越來越高了,一個是運行的頻率高了,另一個因素是容量大了。而GDDR6X的一大特點就是能夠提供更高的能效比。

3080顯存_06.PNG

  美光提供的數據顯示,同樣的8顆顯存,等效頻率為21Gbps的GDDR6X顯存的能效比跟14Gbps的GDDR6顯存在每比特能耗上要低15%。要知道,在此同時GDDR6X還提供了多50%的顯存帶寬。

GDDR6X產品及應用
  由於GDDR6X顯存是NVIDIA和美光聯手研發的,它暫時還沒有被JEDEC給標準化,所以也沒有第二家能夠生產GDDR6X顯存的內存生產商。

3080顯存_07.PNG

  目前美光提供兩種GDDR6X顆粒,容量密度均為8Gb(單顆1GB),兩種顆粒的區別只有頻率,後綴為19的顆粒等效頻率為19Gbps,後綴21的顆粒等效頻率為21。很明顯,在RTX 3080上出現的就是型號為MT61K256M32JE-19的顆粒,但RTX 3090的顯存顆粒現在還不明朗。

  由於GDDR6X採用了完全不同的信號調製方式,所以GPU的內存控制器需要進行重新設計才能支持它,目前NVIDIA應該也只是計劃只在GA102核心上做它的支持,而定位更低的GA104、GA106等核心應該都只支持GDDR6。在RTX 3070及之下的RTX 30系顯卡和未來可能的GTX 26系列顯卡上,我們看到的應該仍然是GDDR6顯存。

總結:GDDR6X可能不會很普及,但它代表了未來方向
  GDDR6X在GDDR家族中首次應用了PAM4信號調製方式,提升了信號傳輸的效率,能夠以更低的時鐘頻率達成同樣的等效頻率。PAM4信號調製方式也並不是什麼新的技術,它在高速以太網中早已經被廣泛應用,而且目前正處於規劃中的PCIe 6.0總線也計劃將信號調製方式從NRZ切換到PAM4上去,在頻率提升已經達到物理極限的時候,更高效率的信號調製方式就是新的用來提升帶寬的手段了。

3080顯存_08.PNG

  由於GDDR6X和GDDR5X類似,是NVIDIA和美光合作開發的,所以短時間內我們很難看到採用GDDR6X的A卡,也很難說美光會不會將GDDR6X提交給JEDEC進行標準化。就之前GDDR5X的情況來看,GDDR6X應該不會像GDDR6那麼普及,主流級別的顯卡將仍然採用GDDR6顯存,而專業級的GPU則會選擇有更大帶寬的HBM。

  或許我們不會看到標準化的GDDR6X,但未來比GDDR6更新的標準可能會吸收GDDR6X上所使用的新信號調製方式。它可能不會很普及,但它確實是顯存發展的一個未來方向。

 

 


來源
謝謝收看

arrow
arrow
    創作者介紹

    john pan 發表在 痞客邦 留言(0) 人氣()