AI 晶片互聯是推動人工智能發展和實現高性能計算的重要因素. 以 ChatGPT 為代表的AI 應用迅速發展, 對算力的需求也在不斷增長, AI 伺服器作為這一技術進步的重要支撐, 其中相關 AI 晶片互聯技術顯得尤為重要, AI 晶片互聯技術包括 NVLink, PCIe, CXL 等.
NVLink 是由輝達開發的一種高速點對點數據傳輸技術, 允許多個 GPU 之間以及 GPU 與 CPU 之間進行高速通信. NVLink 提供的帶寬高於傳統 PCIe 接口, 有助於減少數據傳輸延遲, 提高計算效率.
NVLink 可以為每個 Blackwell GPU 提供 1.8TB/s 的雙向帶寬, 在第四代 NVSwitch 的支持下, 單域內可以最多支持 576 個 GPU 的直接高速互聯. NVSwitch 晶片是一種類似交換器 ASIC 的物理晶片, 可以利用 NVLink 接口將多個 GPU相互聯接到一起, 提升 GPU 之間的通信效率.
PCIe 是一種高速串行計算機擴展 bus 標準, 廣泛應用於伺服器和 PC 中. PCIe 支持高帶寬的數據傳輸, 並允許多個設備通過總線連接到主機. 隨著 AI 應用對數據傳輸速度要求的提高, PCIe 接口也在不斷升級, 以支持更高的數據傳輸速率.
在 AI 伺服器中, PCIe 可用於 CPU 和 GPU 互聯. PCIe Retimer 晶片是適用於 PCIe 高速數據傳輸協議的超高速時序整合晶片, 主要用於解決數據中心數據高速, 遠距離傳輸時, 信號時序不齊, 損耗大, 完整性差等問題.
CXL 是在 2019 年由 Intel 起頭, 多家公司共同推出的下一代高速互聯技術標準. CXL 旨在提供 CPU, GPU, FPGA 和其他加速器之間的高效, 高速, 低延時的接口, 支持資源共享, 內存池化和高效運算調度.
CXL 3.0 以 PCIe 6.0 為基礎, 將數據傳輸速率由 CXL 2.0 的 32GT/s 提高到 64 GT/s. CXL MXC 晶片是一款 CXL 內存擴展控制器晶片, 該晶片可為 CPU 及基於 CXL 協議的設備提供高帶寬, 低延遲的高速互聯解決方案, 從而實現 CPU 與各 CXL 設備之間的內存共享.
當前主流伺服器 CPU 可支持 CXL 1.1 協議, 2023 年 5 月三星推出首款 CXL 2.0 的 128GBDRAM, 並表示於 2024 年量產. 在 AI 伺服器對數據存儲性能和效率愈加提高的挑戰下, CXL 部署提供了短期和長期解決方案, 有望逐漸被雲服務器廠商採納.
傳輸方案有, 銅纜連接: 通常比光纖連接成本更低, 同時銅纜可以提供較低的延遲, 但由於銅的物理性能限制了其有效傳輸距離. 光纖連接: 能夠支持更高的數據傳輸速率, 光纖傳輸的信號損耗較低, 所以可以用於更長距離的數據傳輸. PCB 走線: 用於伺服器內部的電路連接, 集成度高, 適合需要高密度集成和複雜的電路布局場景.
Blackwell 研發成本 100 億美元!Jim Keller 批 Nvidia 太燒錢:10 億美元解決
回覆刪除https://technews.tw/2024/04/15/jim-keller-thinks-nvidias-blackwell-cost-so-high/
AI晶片的一塊重要拼圖
回覆刪除https://hao.cnyes.com/post/83538?utm_source=cnyes&utm_medium=home&utm_campaign=postid
流失輝達 OAM / UBB 市占!外資調降台光電目標價至 467.9 元
回覆刪除https://finance.technews.tw/2024/05/02/oamubb/
金麗科AI PC/PCIe湧商機;新品開發進度料提前
回覆刪除https://www.moneydj.com/kmdj/news/newsviewer.aspx?a=4c946f36-8aa1-45fc-8823-975c05d3f5d6
三星欲拔CXL市场头筹能如愿否?
回覆刪除https://wallstreetcn.com/articles/3712090