微軟或將發布全新AI大模型,欲與GPT-4和Gemini一較高下

玄武黑科技 2024-05-08 18:25:17

科技巨頭微軟正積極研發一款名爲MAI-1的全新大型語言模型,該模型有望與谷歌Gemini、Anthropic的Claude以及OpenAI的GPT-4等頂尖模型展開競爭。

據The Information報道,這是微軟自向OpenAI投資超過100億美元獲取其AI模型使用權以來,首次自主研發如此規模的AI模型。此前,OpenAI的GPT-4不僅爲ChatGPT提供了技術支持,也爲微軟的Copilot産品賦能。

MAI-1項目的負責人是Mustafa Suleyman,他曾是谷歌AI領域的領軍人物,後來擔任AI初創公司Inflection的CEO。今年3月,微軟以6.5億美元收購了Inflection的大部分員工和知識産權。盡管MAI-1可能會借鑒前Inflection員工的技術,但據兩位熟悉該項目的微軟員工證實,它是一個全新的獨立大型語言模型(LLM)。

MAI-1擁有約5000億個參數,遠超微軟之前開源的模型,例如Phi-3。這意味著它需要更強大的計算能力和更多的訓練數據,也使其與OpenAI的GPT-4(傳聞擁有超過1萬億個參數)處于同一級別,並遠遠超過Meta和Mistral的700億參數模型。

MAI-1的研發表明,微軟正在采取雙管齊下的AI策略,一方面關注適用于移動設備的小型本地語言模型,另一方面則著眼于由雲端提供支持的大型先進模型。據悉,蘋果公司也在探索類似的策略。這也突顯了微軟希望獨立于OpenAI進行AI開發的意願,而OpenAI的技術目前爲微軟最具雄心的生成式AI功能提供支持,例如Windows內置的聊天機器人。

The Information的消息人士稱,MAI-1的確切用途尚未確定,其最理想的應用場景將取決于其性能表現。爲了訓練該模型,微軟已分配了一大批配備Nvidia GPU的服務器,並從各種來源收集訓練數據,包括由OpenAI的GPT-4生成的文本和公開的互聯網數據。

據The Information報道,微軟可能會在本月晚些時候的Build開發者大會上預覽MAI-1。

MAI-1的發布將爲AI領域帶來新的競爭,並有望推動大型語言模型技術的進一步發展。

結語

本文轉自同名宮棕號,歡迎關注獲取每日AI快訊。

1 阅读:23

玄武黑科技

簡介:洞悉前瞻産品,分享好用工具。