蘇姿豐:AMD有望在2027年之前將能效提高100倍

袁遺說科技 2024-05-25 05:52:28

本文由半導體産業縱橫(ID:ICVIEWS)編譯自tomshardware

追求更少的能耗,更高的性能。

AMD 首席執行官蘇姿豐出席了 imec 的 ITF World 2024 大會,並接受了imec 創新和行業領導力創新獎,加入了 Gordon Moore、Morris Chang 和 Bill Gates 等其他獲獎者的行列。在接受該獎項後,蘇姿豐開始了她的演講,介紹了AMD爲實現公司的30x25目標所采取的步驟,該目標旨在到2025年將計算節點的能效提高30倍。蘇姿豐宣布,AMD不僅有望實現這一目標,而且現在還看到了2026~2027年實現100倍以上改進的途徑。

由于 ChatGPT 等生成式 AI LLM 的爆炸式增長,對 AI 電源使用的擔憂已成爲人們關注的焦點,但 AMD 早在 2021 年就預見到了 AI 對于能耗的需求非常高。當時,AMD開始致力于提高數據中心計算節點能效的30x25目標,特別是將AI和HPC功耗視爲一個迫在眉睫的問題。AMD在2014年就設定了第一個能源目標,其首個25x20目標,即到2020年將消費類處理器的能效提高25倍。

這個問題現在已經擺在了最前面。隨著全球最大的公司爭奪人工智能的霸主地位,生成式人工智能正在推動數據中心的快速擴張,但公共電網並沒有爲突然激增的耗電數據中心做好准備,這使得電力成爲新的限制因素。由于電網容量、基礎設施和環境問題限制了可用于新數據中心和擴展數據中心的容量,因此數據中心的可用電量受到硬性限制。事實上,許多新的數據中心正在發電廠旁邊建造,以確保電力供應,而壓倒性的需求甚至重新點燃了對核小型模塊反應堆(SMR)的推動,以供應各個數據中心。

隨著訓練模型所需的計算量的增加,這個問題只會加劇。蘇姿豐指出,第一個圖像和語音識別AI模型的規模過去每兩年翻一番,這與過去十年計算能力的進步速度基本一致。然而,生成式 AI 模型的規模現在正以每年 20 倍的速度增長,超過了計算和內存進步的步伐。蘇姿豐 表示,雖然當今最大的模型是在數以萬計的 GPU 上訓練的,消耗高達數萬兆瓦時,但快速擴展的模型大小可能很快需要多達數十萬個 GPU 進行訓練,可能需要幾千兆瓦的功率來訓練單個模型。這顯然是站不住腳的。

AMD擁有多管齊下的提高能效的戰略,包括廣泛的方法,從其芯片架構和先進封裝策略擴展到AI特定的架構、系統和數據中心級調優以及軟件和硬件協同設計計劃。

當然,硅是基石。蘇姿豐指出,3nm全柵極(GAA)晶體管是AMD在芯片路線圖上的下一步,以提高電源效率和性能,同時繼續關注先進的封裝和互連,以實現更節能和更具成本效益的模塊化設計。先進封裝在擴展設計方面發揮著關鍵作用,以便在單個芯片封裝的限制下産生更大的馬力,AMD 采用 2.5D 和 3D 封裝的混合,以最大限度地提高每平方毫米數據中心芯片的每瓦計算量。

由于距離較長,在服務器節點和服務器機架之間傳輸數據會消耗額外的功率,因此優化數據局部性可以節省大量功耗。AMD 的 MI300X 是制造越來越大的芯片封裝所帶來效率的一個很好的例子——該芯片擁有 1530 億個晶體管,分布在 12 個小芯片上,搭配 24 個 HBM3 芯片,提供 192GB 的內存容量,所有這些都可以作爲本地內存提供給 GPU。與封裝內單元之間的功耗和性能優化的 infinity Fabric 互連相結合,極高的計算和內存密度使更多數據靠近處理內核,從而減少了傳輸數據所需的能量。

蘇姿豐表示,雖然硬件優化很重要,但AMD在硬件和軟件協同優化方面的工作也取得了令人印象深刻的成果。使用低精度的數值格式可以提高電源效率和性能,因此在特定的硬件加速下進行設計對于持續擴展非常重要。正如您在上面的幻燈片中看到的,轉向 FP4 等低精度格式會大大增加每焦耳消耗能量的 FLOP——與 FP32 相比,FP8 的能效提高了 15 倍,而 FP4 的功率效率提高了約 30 倍。

精度越低會導致准確度越低,但蘇姿豐強調,先進的量化技術有助于解決這個問題。事實上,即使是 MXFP6 也可以産生與 FP32 相似的精度,只有在 MXFP4 上才能看到一些不同型號的下降,而其型號仍然同樣准確。提高低精度格式精度的工作仍在繼續,因此我們甚至可以看到 MXFP4 在未來的更多型號中變得與 FP32 一樣准確。

總體而言,蘇姿豐表示,AMD在每個節點的能效方面已經超過了行業的進步速度,因爲該公司仍在努力實現其30倍的能效改進。蘇姿豐預計這種趨勢將繼續下去,她說:“根據我們今天所看到的,通過這種類型的創新,我們認爲我們可以做得更好。到2026年和2027年,我們有望完成超過100倍的工作。在這個領域,我們可以做的還有很多很多。”

Imec的活動吸引了來自ASML、台積電、英特爾和SK海力士等多家半導體公司的演講者,許多演講者都贊同蘇姿豐的觀點,即數據中心功耗以及與之相關的環境後果正在成爲首要問題。

蘇姿豐指出,繼續提高能效的步伐需要全行業的努力。“我們有機會通過將許多不同的能力和許多不同的專業知識結合在一起來推動這個生態系統。我認爲這是下一代創新的關鍵。”

“我們都是某些領域的專家,但當我們將流程人員、封裝人員、硬件設計師、架構師、軟件模型和系統設計師聚集在一起時,我們可以獲得真正彎曲未來創新曲線的整體設計能力,” 蘇姿豐說。

*聲明:本文系原作者創作。文章內容系其個人觀點,我方轉載僅爲分享與討論,不代表我方贊成或認同,如有異議,請聯系後台。

0 阅读:16

袁遺說科技

簡介:感謝大家的關注