對話響應速度接近人類，OpenAI新模型可免費用了|動察

一方面，GPT-4o的免費開放使用爲廣泛的用戶群體提供了接觸高端AI技術的機會，另一方面，對于ChatGPT Plus的訂閱用戶而言，他們可能會感到自己支付的訂閱費用沒有得到預期的獨家優勢。

文｜動點科技作者｜黃塵排版｜高竹

本文預計閱讀時長8分鍾

在人工智能領域，OpenAI一直以其創新和突破性技術引領著行業的發展。今日淩晨，該公司再次證明了其在AI技術前沿的地位，發布了全新的GPT-4o模型以及一個功能強大的新ChatGPT模型。

這些新模型不僅能夠處理文本、音頻和圖像，而且在對話響應速度上接近人類水平，標志著人機交互邁入了一個新的時代。GPT-4o的發布，特別強調了其多模態能力，預示著更自然、更智能的交互方式即將成爲現實。

有什麽不一樣

GPT-4o是一個多模態大模型，支持文本、音頻和圖像的任意組合輸入，並能生成文本、音頻和圖像的任意組合輸出。據介紹，GPT-4o文本、推理、編碼能力達到GPT-4 Turbo水平，速度是上一代AI大模型GPT-4 Turbo的兩倍，但成本僅爲GPT-4 Turbo的一半，視頻、音頻功能均得到改善。據悉，GPT-4o的響應速度在最快232毫秒內，平均響應時間爲320毫秒，與人類的對話響應時間相似，此外，GPT-4o在非英語文本方面的性能也有顯著提高。OpenAI表示，GPT-4o的功能“將叠代推出”，但其文本和圖像功能將于今天開始在ChatGPT中推出。與一年前發布的 GPT-4 模型有所不同，GPT-4 模型是爲那些支付 OpenAI 每月 20 美元訂閱費的ChatGPT Plus 用戶發布的。在當前版本中，許多之前僅限付費用戶使用的功能，比如記憶和網頁浏覽，現在也向免費用戶開放了。更值得一提的是，作爲新模式的一部分，ChatGPT的語音模式即將推出新功能。該應用程序將能夠充當像人類一樣的語音助理，實時響應並觀察你周圍的世界。當前的語音模式更加有限，一次響應一個提示，並且只使用它能聽到的內容。OpenAI的CEO奧特曼認爲，這種快速、智能、有趣且自然的交互方式，將使得與電腦的對話變得更加自然，預示著一個令人興奮的未來。獵豹移動董事長兼CEO、獵戶星空董事長傅盛總結了新模型的優勢：“（OpenAI）通過一個桌面的App讓你能夠方便地把圖片文檔上傳然後讓大模型去幫你分析；發布了一個語音助手，由于使用了端到端大模型技術，所以這次語音助手的體驗超越了Siri，也遠超于我們以前用過的所有的各種AI助手，不僅能夠去感知情緒實時知道對話人的每一句話，並且在該插話的時候插話。”

ChatGPT Plus 用戶成了大冤種？

一方面，GPT-4o的免費開放使用爲廣泛的用戶群體提供了接觸高端AI技術的機會，另一方面，對于ChatGPT Plus的訂閱用戶而言，他們可能會感到自己支付的訂閱費用沒有得到預期的獨家優勢，因此在互聯網産生了爭議。盡管 GPT-4o 無需訂閱即可使用，但依賴更多的提示訪問權限和新功能的訪問權限的使用者，還是無法那麽快與ChatGPT Plus分道揚镳。與非訂閱者相比，ChatGPT Plus 訂閱者在必須等待或切換到功能較弱的模型之前，被允許發送 GPT-4o 的提示數量是前者的五倍。因此，如果用戶想要大量使用提示功能，訂閱是必要的。除了有限的 GPT-4o 訪問權限外，非付費用戶還獲得了整體用戶體驗的重大升級，其中包括以前僅爲付費客戶開放的多個功能。非付費用戶還可以使用 ChatGPT 的網頁浏覽工具和記憶功能，並且可以上傳照片和讓聊天機器人分析文檔。從本周開始，ChatGPT 的 Mac 桌面應用程序也將率先向 Plus 訂閱者提供。該應用程序使用戶在桌面上與 ChatGPT 交互的體驗更加無縫。例如，用戶可以截取當前正在查看的任何網頁的屏幕截圖，並讓聊天機器人生成可見信息的快速摘要。雖然預計 Mac 應用程序將更廣泛地向免費用戶提供，但該版本發布的具體時間表仍不明確。OpenAI 還計劃在今年年底前推出其桌面應用程序的 Windows 版本。所以，如果用戶只是想嘗試使用 GPT-4o 一段時間，並且不介意等待最新功能，那麽將不需要訂閱 ChatGPT Plus。

GPT-5 缺席，大模型向何處去

當地時間5月10日，OpenAI就事先表示，發布會上不會推出GPT-5，也不會發布搜索引擎産品，令一些網友頗爲失望，OpenAI的發展失速讓多數人始料未及。

奧特曼在直播活動後的一篇博客文章中反思了OpenAI的軌迹。他說，該公司的最初願景是“爲世界創造各種益處”，但他承認，願景已經發生了變化。OpenAI因沒有開源其高級人工智能模型而受到批評，奧特曼似乎想要表示，該公司的重點已經轉移到通過付費API向開發人員提供這些模型，並讓這些第三方進行創建。“相反，現在看起來我們將創建人工智能，然後其他人將使用它來創建各種我們都從中受益的令人驚歎的東西。”

對于OpenAI發布可實時進行音頻、視覺和文本推理的新一代AI模型GPT-4o一事，傅盛今日早間發短視頻對此進行評價：“所有國內人工智能從業者都在熬夜等著大洋彼岸放核彈，但是沒想到核彈沒有放，卻掏出了一堆摔炮。”傅盛表示，這樣的評論雖然是一句玩笑話，“但比較讓人失望的是這次OpenAI沒有發布GPT-5,連GPT-4.5也沒有看到，反而是發布了GPT-4o，就是把一系列的引擎給結合在一起，比如圖片、文字、聲音，這樣你就不需要來回去切換了。”

國盛證券則認爲，GPT-4o是邁向更自然的人機交互的重大進步，新功能帶來了嶄新的多模態交互能力，通過新的端到端模型實現了體驗上的新突破，有望在各類終端實現用戶體驗的最大化，利好智能終端Agent、機器人等方向。

傅盛指出，一方面，我們覺得OpenAI發布應用恰恰說明了應用在人工智能領域大有可爲，每一個創業者都應該去好好地做人工智能應用，大模型的能力當然會不斷地叠代，但最終能夠把大模型用好的還是應用。另一方面，如果不計成本的累參數，提高所謂的大模型能力，這條路肯定是容易遇到困難的，目前看起來GPT-5可能還要難産一段時間。金沙江創投主管合夥人朱嘯虎此前就在采訪中坦言：“今年就可以看出大模型本身是不是好的商業模式，多少OpenAI的用戶會因爲價格差異遷移到Google的Gemini——OpenAI 20美金一個月，Gemini 10美金一個月。我們美國團隊已經有一半人切換到Gemini，一部分是因爲價格，另外一部分是因爲Google的生態。”

結語

隨著技術的不斷發展，我們期待OpenAI能夠繼續推動人機交互的邊界，並爲用戶帶來更加豐富和便捷的智能體驗。同時也不得不進一步思考，在大模型發展即將見頂後，下一步該怎麽走，諸如如何平衡技術創新與商業可行性，如何確保廣泛的用戶接受度，以及如何在激烈的市場競爭中保持領先，這也是OpenAI及整個AI行業都需要深思的問題。

本文爲動點科技記者原創文章，未經授權不得轉載，如需轉載或開白請在後台回複“轉載”。

- - - - - - - - END - - - - - - - -

互動話題

您認爲GPT-4o的出現會帶來重大影響嗎？

快來評論區留下你的觀點吧！*想要獲取行業資訊、和志同道合的科技愛好者們分享心得，那就趕快掃碼添加“動點君”加入群聊吧！群裏更有不定期福利發放！

精彩好文值得推薦！

一鍵轉發，戳個在看！

娛樂新聞吧

對話響應速度接近人類，OpenAI新模型可免費用了|動察

動點科克