close

   我們都知道目前市面上能買到最強的顯卡是NVIDIA TITAN V,但是它的售價以及顯卡架構都說明它是一張半專業顯卡,而非像普通的GeForce顯卡那樣用於打遊戲。更多實驗室、研究機構都會買來用於科學計算上。不過最近有一些工程師反饋說,TITAN V在某些特定情況下的科學模擬計算中無法給出可靠的答案,懷疑是顯存不支持ECC糾錯造成的。

TITAN V.jpg   

   TITAN V可以說是一張非常變態的顯卡,史無前例的80組SM單元,5120個CUDA單元,其核心面積就超過了815平方毫米,211億個晶體管。新加入的專門用於深度計算Tensor單元,注定TITAN V就不是一張普通的遊戲卡。

  因此很多科學家都用它來跑科學模擬運算,但有些科學家卻發現TITAN V處理出來的結果似乎不太可靠,比方說用四張TITAN V顯卡來處理蛋白質與酶之間合成計算,在相同的測試參數下,每一次的測試結果都應該是相同的,但實際上跑出來的結果卻不一樣,可能是顯卡不穩定的原因。

   而一位不願意透露姓名的資深業內人士表示,這很可能是NVIDIA TITAN V顯卡的顯存出現了溢出錯誤導致的,因為NVIDIA TITAN系列顯卡中全面禁用了ECC糾錯功能,在處理像科學計算超龐大體量數據時,沒有糾錯功能下,顯存很可能會來不及處理部分數據進而導致溢出,最後運算結果自然是不相同的,目前已確認一款稱為Amber的分子動力學科學應用程序受到影響。

  這個對於嚴謹的科學來說是十分致命的,因為不可靠的結果是不能被接受的,非常多科學研究結果需要超高置信度支持才能被確認有效,所以科學家需要更加重視計算機的計算結果是否真實可靠。

  目前NVIDIA對這件事情表態說,“All of our GPUs add correctly. Our Tesla line, which has ECC [error-correcting code memory], is designed for these types of large scale, high performance simulations. Anyone who does experience issues should contact support@nvidia.com.”言外之意就是,“首先遇到問題請馬上聯繫我們,另外你們這些科學家應該用更加專業更加昂貴的Tesla顯卡,因為它們都是帶有ECC糾錯功能的”。

新聞來源

謝謝收看

arrow
arrow
    文章標籤
    NVIDIA TITAN V TITAN V NVIDIA
    全站熱搜

    john pan 發表在 痞客邦 留言(0) 人氣()