利用NPU和異構計算,高通爲終端側生成式AI普及按下“加速鍵”

芯智訊 2024-03-22 08:11:43

當前,生成式AI變革正加速數字化轉型,推動經濟增長。根據麥肯錫研究,生成式AI技術可使60多個用例每年實現2.6萬億至4.4萬億美元的總體經濟效益增長,經濟規模大致相當于英國2021年的GDP。在移動領域,AI的影響已經深入到攝影攝像、電源管理、性能提升、惡意軟件偵測和安全保障等多個方面,並爲用戶帶來更加個性化、高效、安全和高度優化的體驗。

隨著生成式AI的快速發展,AI處理的重心正在向邊緣轉移,這使智能手機和其他便攜式終端設備面臨全新挑戰,例如在功耗和散熱受限的條件下難以滿足嚴苛且多樣化AI用例的計算需求,以及隨著AI應用的不斷演進,功能固定的硬件難以適應變化。爲此,異構計算架構變得尤爲重要,它能充分發揮不同處理器的優勢,提供最佳的應用性能、能效和電池續航能力,爲用戶帶來全新的生成式AI體驗。

NPU和異構計算開啓終端側生成式AI

在不斷增長的用戶需求、全新應用和終端品類以及技術進步的驅動下,計算架構正不斷演進。近年來,適合終端側執行的生成式AI模型日益複雜,參數規模不斷提升,且多模態趨勢日益增強,此外許多用例需要同時運行多個模型。生成式AI工作負載的複雜性、並發性和多樣性需要利用SoC中所有處理器的能力。

支持處理多樣性的異構計算架構能夠發揮每個處理器的優勢。例如,CPU和GPU是通用處理器,它們爲靈活性而設計,非常易于編程,“本職工作”是負責運行操作系統、遊戲和其他應用等。而這些“本職工作”同時也會隨時限制他們運行AI工作負載的可用容量。NPU專爲AI打造,AI就是它的“本職工作”。NPU降低部分易編程性以實現更高的峰值性能、能效和面積效率,從而運行機器學習所需的大量乘法、加法和其他運算。通過使用合適的處理器,異構計算能夠實現最佳應用性能、能效和電池續航,賦能全新增強的生成式AI體驗。

近期,高通在其最新發布的AI白皮書——《通過NPU和異構計算開啓終端側生成式AI》中,將NPU的設計重要性提升到了生成式AI應用的基礎地位。高通AI引擎中的關鍵處理器——Hexagon NPU是高通業界領先的異構計算架構,經過多年研發,高通Hexagon NPU持續演進以滿足日益增長的AI需求。從2007年的首款Hexagon DSP到2015年集成AI引擎的骁龍820,再到後續版本中引入的張量加速器和架構更新,高通不斷優化NPU以提升性能和能效。

除Hexagon NPU,高通AI引擎還包括了高通Adreno GPU、高通Kryo或高通Oryon CPU、高通傳感器中樞和內存子系統。這些處理器爲實現協同工作而設計,能夠在終端側快速且高效地運行AI應用。通過結合CPU、GPU和專門的AI處理單元NPU,高通AI引擎能夠爲不同類型的AI工作負載提供最適合的計算資源,充分發揮每種處理器擅長處理的特定類型任務。高通的異構計算引擎不僅提升了性能和能效,也使得終端設備能夠更加靈活地處理各種AI應用,從而提供最佳的用戶體驗。

   

高通不僅在硬件層面進行創新,也在軟件和算法優化、開發工具及服務支持等方面進行全面布局。例如,高通AI軟件棧進一步加速了生成式AI應用的開發和部署。通過全面支持主流AI框架和執行環境(runtime),如TensorFlow、PyTorch、ONNX、Keras等,開發者可在高通硬件上創建、優化和部署AI應用,一次編寫即可實現在不同産品和細分領域采用高通芯片組解決方案進行部署。這不僅加速了AI應用的創新和普及,也使得終端設備能夠利用生成式AI的強大能力,爲用戶帶來更加豐富、個性化的體驗。

面向開發者,高通還推出了全新高通AI Hub,幫助其輕松快速地將預優化AI模型集成進應用程序,從而縮短産品上市時間。該模型庫提供超過75個主流的AI和生成式AI模型,比如Whisper、ControlNet、Stable Diffusion和Baichuan-7B,可在不同執行環境中打包,能夠在不同形態終端中實現卓越的終端側AI性能、降低內存占用並提升能效。所有模型均經過優化,以充分利用高通AI引擎內所有核心(NPU、CPU和GPU)的硬件加速能力,從而使推理速度提升4倍。

高通在AI模型的優化上也不遺余力,包括量化、壓縮和神經網絡架構搜索等策略,以實現性能和能效的最大化。這些優化措施,特別是量化技術,對于提升大模型的運行效率至關重要,使高通的NPU在處理大規模神經網絡模型時能夠展現出卓越的性能和能效。高通軟硬件一體化的布局,體現了對未來AI應用發展趨勢的深刻理解和支持。通過不斷的技術創新和優化,高通在推動終端側AI發展的過程中發揮著重要作用,爲開發者和消費者帶來更加智能、高效和個性化的移動體驗。

AI和5G融合創新:讓智能計算無處不在

連接對于推動生成式AI跨雲端、邊緣側和終端側規模化擴展至關重要。在推動終端側AI與5G融合創新方面,高通也進行了廣泛的技術探索和實踐。

在智能手機領域,高通的技術創新爲用戶帶來了前所未有的體驗。通過將終端側AI和無線連接相結合,高通使智能手機能夠實現更快的數據下載速度,支持高清視頻流、雲遊戲和AR/VR應用,提升了娛樂和生産力應用的體驗。例如,高通的快速AI處理能力使得智能手機能夠實時進行高級圖像處理和增強現實應用,爲用戶帶來更加豐富和沉浸式的娛樂體驗。

爲了將行業領先的終端側AI和突破性連接能力擴展至更多智能手機,高通于近日推出了第三代骁龍8s移動平台。第三代骁龍8s通過在SoC中的不同模塊進行分布式處理,包括Hexagon NPU, Kryo CPU和Adreno GPU,能夠更爲高效地處理當下的應用需求,並且最小化功耗。在第三代骁龍8s中,高通還通過AI對一些GPU特性進行增強,爲很多消費者關心的、經常使用的第三方應用,帶來顯著的性能提升和功耗降低,帶來更爲流暢、無延遲的用戶體驗。

此外,該平台能夠支持高達100億參數級別的大語言模型,並支持更爲廣泛的AI模型,包括目前主流的Baichuan-7B、Gemini Nano、Llama 2和智譜ChatGLM等。在連接方面,第三代骁龍8s采用了由開創性AI加持的骁龍X70,支持廣泛的全球網絡,提供了最新的Release 17 5G特性,並具備超低的5G時延和卓越的電池效率。據悉,第三代骁龍8s將由Xiaomi Civi 4 Pro全球首發搭載;榮耀、iQOO、真我realme、Redmi等主要OEM廠商和品牌都將采用第三代骁龍8s。

通過在多代調制解調器及射頻系統中整合AI,高通還利用AI能力優化5G網絡的性能和效率。例如,高通最新推出的第三代AI賦能的5G調制解調器骁龍X80,將AI和出色的頻譜靈活性、能效與性能相融合。通過多項AI增強特性,高通5G解決方案能夠實時分析網絡條件,智能調整網絡參數,從而提高網絡覆蓋範圍和信號質量。AI還被用于動態管理5G網絡的能源消耗,通過預測網絡負載和用戶行爲,智能調節網絡設備的功耗,從而實現更高的能效比。此外,高通還推出了全球首個支持AI優化性能並在單個芯片中集成Wi-Fi 7、藍牙和超寬帶技術的解決方案——高通FastConnect 7900移動連接系統,利用AI樹立高性能、低時延和低功耗連接新標杆。

通過不斷的技術創新和優化,高通加速了生成式AI在終端設備上的應用普及,推動智能技術的發展和應用。高通全面的産品布局和技術領導力,不僅讓智能手機等終端設備廠商迅速響應,也預示著在更多領域的生成式AI應用將加速落地,提升用戶體驗。隨著終端側生成式AI的普及和相關用例的落地,萬物智能互聯的時代正加速而至。 

編輯:芯智訊-浪客劍

1 阅读:13

芯智訊

簡介:專注于手機、芯片、智能硬件等相關領域的行業資訊報道。