IT之家 9 月 10 日消息,英偉達(dá)美國當(dāng)?shù)貢r間 9 日發(fā)布了面向大規(guī)模上下文推理處理和視頻生成 AI 應(yīng)用的 Rubin CPX GPU。該 GPU 基于"Rubin" 架構(gòu)構(gòu)建但與此前已公布的 Rubin Tensor Core GPU 又有不少區(qū)別之處。
Rubin CPX GPU 采用經(jīng)濟高效的單片式設(shè)計,注重 NVFP4 數(shù)據(jù)格式計算資源,同時搭載了 NVENC / NVDNC 視頻編解碼單元,配備 128GB 的 GDDR7 顯存。
根據(jù)英偉達(dá)官方提供的 Rubin CPX 渲染圖,該 GPU 包含 4×4×3×4=192 組的重復(fù)單元(IT之家注:參見下圖黃色方框),應(yīng)該對應(yīng)著 192 組 SM,這一數(shù)量與 GB202 相當(dāng)。
而在機架系統(tǒng)層面,從 Vera Rubin NVL144 到 Vera Rubin NVL144 CPX,系統(tǒng)增加了 144 塊 Rubin CPX GPU,NVFP4 算力提升了 4.4 EFLOPS、顯存帶寬提升了 0.3PB/s、快速存儲增長了 25TB。
從顯存帶寬角度,每顆 Rubin CPX GPU 大致對應(yīng)約 2083GB/s 顯存帶寬??紤]到 512-bit 顯存位寬的 GeForce RTX 5090 擁有 1792GB/s 的顯存帶寬、Rubin CPX GPU 的顯存容量為 128GB,Rubin CPX GPU 應(yīng)同樣具備 512-bit 的顯存位寬,顯存等效速率估算數(shù)值約為 32.55Gbps。