創新本地異構AI算力和個人智能體高端對話:共建AI終端繁榮生態

在前線 2024-04-22 19:10:23

聯想科技創新科技大會(2024 Lenovo Tech World)近日在上海成功舉辦。同期,Al終端産業生態創新論壇隆重舉行。論壇圍繞“新機遇 新生態”主題,不僅聚焦産品的叠代升級和技術革新,更致力于深入探討應用生態的演進趨勢以及AI終端産業未來發展藍圖,爲AI終端産業生態的穩健和持續發展注入新活力。

業內30余位AI領域專家、科技領袖和近300位嘉賓參加此次論壇。聯想、中國信息通信研究院等近30家機構和企業共同發起籌備AI終端産業生態聯盟,助力發展開放、共贏、可持續的中國AI終端産業生態。

此外,論壇舉辦了“構建開放的AI應用生態”、“創新本地異構AI算力和個人智能體”、“探索AI終端創新與互聯融合體驗”主題展開三場高端對話。在“創新本地異構AI算力和個人智能體”高端對話環節,來自英特爾、AMD、高通、百川智能、阿裏巴巴、聯想等行業領軍企業代表,針對異構AI算力、大模型和混合智能展開深入探討,共話AI終端産業趨勢與未來。

(創新本地異構AI算力和個人智能體高端對話)

構建用戶專屬的個人大模型,需要強大的混合AI算力相匹配。英特爾中國區技術部總經理高宇表示:“AI PC的應用都是複雜的複合型應用,要把正確的任務放在正確的計算引擎上,CPU+GPU+NPU三者能力不可或缺。英特爾將通過對硬件的不斷創新,打造擁有更加強大的AI算力平台。持續與軟件開發者進行深度合作,以推動AI應用在PC端側的快速普及。”

AMD大中華區市場營銷副總裁紀朝晖表示,AMD一方面快速提升CPU+GPU+NPU的算力,去年推出第一代帶有NPU的銳龍7040後,今年初已經面市第二代帶有RyzenAI的銳龍8000處理器,年內還會有另一代際升級産品發布,爲端側AI模型和應用提供強大算力支持。另一方面AMD也非常重視和大模型、ISV合作夥伴一起,把現有的算力充分使用,目前已經有超過10個開源大模型在AMD端側平台上做了量化,適配和優化工作。

高通産品部高級總監王瑞剛指出,大模型在端側應用的性能和用戶體驗在很大程度上取決于計算能力,而終端設備便攜性和持續工作能力則受到功耗的影響。爲了實現在端側運行的最佳效果,大模型需要針對特定的硬件平台進行優化,同時硬件平台也需要進行相應的調整以適應這些大模型的需求。他說,“憑借異構計算和NPU的獨特優勢,十分期待骁龍X Elite平台能夠助力聯想等行業領導企業爲下一代AI PC帶來智能化和個性化的創新體驗”。

“要訓練好一個大模型,就是讓他從小學生開始讀、到中學生、大學生再到博士。”百川智能聯合創始人、聯席總裁洪濤介紹說:“大模型是在‘造人’,隨著專業知識和模型能力的提升,大衆就可以更輕松普惠地獲取世界知識和專業服務。”

與上述從小到大、逐漸生長的模型路徑相對應,另一種是輕量級模型的路徑是從通用場景到垂直場景。阿裏巴巴大模型業務負責人徐棟指出,模型小有很多好處,其推理性能強,可調試性高,能夠與不同的行業和場景做結合,且成本低于超大參數的模型。“我們的模型參數考慮得非常全面,可以適配所有生態、所有開發者。”

在論壇上,聯想集團副總裁、聯想研究院人工智能實驗室負責人範建平介紹了聯想在混合智能領域的技術成果。他表示,AI技術的爆發式發展,已經開啓混合智能(Hybrid AI)和智能體(Agent)兩大AI新範式,聯想分別打造了混合智能解決方案和個人智能體系統架構,加速AI從雲端向終端落地。其中,聯想混合智能指的是雲端公有大模型、企業私有大模型和端側個人大模型的混合應用。

聯想集團首席研究員、人工智能實驗室大模型研發負責人師忠超補充介紹說:“我們在GGUF的基礎上發展了自己的一套輕量化的推理引擎,助力大模型“瘦身’,並與合作夥伴一起完成了大模型端側部署的驗證。希望有更多夥伴一起合作優化端側推理引擎,讓我們端側的 AI 變得越來越好。”

作爲人工智能底層核心技術飛躍發展的成果,大模型技術極大地加速了人工智能普及速度,但在實際使用中還受到網絡速度、雲端效率、成本考量和隱私安全等種種限制。與會嘉賓認爲,需要加快在算力、大模型在終端的創新,共同打造混合智能和智能體解決方案,以進一步推動AI在端側落地,加速AI普惠進程。

0 阅读:1

在前線

簡介:科技互聯網自媒體,冷靜分析,還原真相。