芯片快速叠代優化大模型應用

經濟日報 2024-05-26 06:50:52

國內人工智能大模型市場正在經曆一場價格戰。字節跳動、阿裏雲、百度、騰訊、科大訊飛等公司紛紛加入戰局,價格一降再降。有業內人士甚至開玩笑說,下一家跟進的廠商可能得倒貼錢來獎勵客戶用大模型了!

這場價格戰是遲早的事。2022年底,美國OpenAI公司的ChatGPT掀起人工智能大模型熱潮,一年半以來,國內外大模型市場風起雲湧。今年3月,國家數據局局長劉烈宏曾在一次論壇上透露,中國10億參數規模以上的大模型數量已超過100個。

從技術邏輯看,這場價格戰是GPU算力與模型優化快速進步的必然結果。

GPU芯片的快速叠代讓同樣的計算量成本更低,模型優化則讓同樣的推理任務所需計算量更少。比如,百度是國內“百模大戰”最早入局者之一,其文心一言大模型已經叠代至4.0版本,與一年前剛推出時相比,推理性能增長了105倍,推理成本降到了原來的1%。大模型的訓練成本和推理成本不斷降低。而降低價格提高使用量,才能持續打磨出更好的大模型,也才有可能在未來進一步降低模型推理的單位成本。

從商業邏輯看,大模型應用創新正進入密集探索期,降價是企業爭奪用戶和擴大市場的慣常做法。

從去年下半年開始,大模型就已經開始從“卷技術”向“卷應用”轉變。不只是國産大模型在降價,OpenAI等國外大模型公司也在不斷下調大模型價格。大模型降價的主要目的是通過降低使用成本來吸引更多開發者。這將讓中小企業和個人開發者更加輕松地開發出直面消費終端的豐富應用。如果沒有大量開發者加入,大模型僅作爲聊天機器人使用,就難以實現賦能千行百業的應用生態,也難以更深入地嵌入各行業工作流程中,促進生産力的實質提升。

推力也有主次之分。當前,大模型算力成本雖有下降,卻依舊高昂,收費使用尚且是賠本賺吆喝,打價格戰就更需要資金支持。此輪大模型降價,主要由商業邏輯推動。對不差錢的大廠和融到巨資的創業公司來說,價格戰是保持市場競爭優勢的重要手段,在放水養魚、做大蛋糕的同時,有望實現跑馬圈地、成爲未來大模型普及時代的基礎設施供應商。而對資金緊張的“煉大模型”公司來說,這輪價格戰可能導致他們尚未成熟就慘遭淘汰出局。

價格戰能否迎來樂觀預測的“大模型應用爆發元年”還有待觀察,需要考慮市場整體環境、技術創新進度和政府監管政策等多方面因素。

從市場環境看,今年1月至4月,國內大模型相關項目中標公告已發布近200個,中標數量超2023全年總數,表明大模型的應用需求正快速增長;能源、政務、電信成爲中標項目最多的3個行業,大模型高速滲透進傳統行業反映了其跨行業應用價值。看技術進度,中美之間的差距正在縮小,最新的大模型測評榜單上,中國已有多個大模型進入全球20強甚至10強;在中文分榜裏,零一萬物的Yi-Large模型更是與OpenAI公司的GPT-4o模型並列世界第一。2023年8月《生成式人工智能服務管理暫行辦法》施行,同年10月《全球人工智能治理倡議》發布,今年《政府工作報告》又提到開展“人工智能+”行動,中國一直堅持發展和安全並重的原則,鼓勵人工智能創新發展。 (本文來源:經濟日報 作者:佘惠敏)

0 阅读:70