對話響應速度接近人類,OpenAI新模型可免費用了|動察

動點科克 2024-05-15 04:56:45

一方面,GPT-4o的免費開放使用爲廣泛的用戶群體提供了接觸高端AI技術的機會,另一方面,對于ChatGPT Plus的訂閱用戶而言,他們可能會感到自己支付的訂閱費用沒有得到預期的獨家優勢。

文 |動點科技作者|黃塵排版|高竹

本文預計閱讀時長8分鍾

在人工智能領域,OpenAI一直以其創新和突破性技術引領著行業的發展。今日淩晨,該公司再次證明了其在AI技術前沿的地位,發布了全新的GPT-4o模型以及一個功能強大的新ChatGPT模型。

這些新模型不僅能夠處理文本、音頻和圖像,而且在對話響應速度上接近人類水平,標志著人機交互邁入了一個新的時代。GPT-4o的發布,特別強調了其多模態能力,預示著更自然、更智能的交互方式即將成爲現實。

有什麽不一樣

GPT-4o是一個多模態大模型,支持文本、音頻和圖像的任意組合輸入,並能生成文本、音頻和圖像的任意組合輸出。據介紹,GPT-4o文本、推理、編碼能力達到GPT-4 Turbo水平,速度是上一代AI大模型GPT-4 Turbo的兩倍,但成本僅爲GPT-4 Turbo的一半,視頻、音頻功能均得到改善。據悉,GPT-4o的響應速度在最快232毫秒內,平均響應時間爲320毫秒,與人類的對話響應時間相似,此外,GPT-4o在非英語文本方面的性能也有顯著提高。OpenAI表示,GPT-4o的功能“將叠代推出”,但其文本和圖像功能將于今天開始在ChatGPT中推出。與一年前發布的 GPT-4 模型有所不同,GPT-4 模型是爲那些支付 OpenAI 每月 20 美元訂閱費的ChatGPT Plus 用戶發布的。在當前版本中,許多之前僅限付費用戶使用的功能,比如記憶和網頁浏覽,現在也向免費用戶開放了。更值得一提的是,作爲新模式的一部分,ChatGPT的語音模式即將推出新功能。該應用程序將能夠充當像人類一樣的語音助理,實時響應並觀察你周圍的世界。當前的語音模式更加有限,一次響應一個提示,並且只使用它能聽到的內容。OpenAI的CEO奧特曼認爲,這種快速、智能、有趣且自然的交互方式,將使得與電腦的對話變得更加自然,預示著一個令人興奮的未來。獵豹移動董事長兼CEO、獵戶星空董事長傅盛總結了新模型的優勢:“(OpenAI)通過一個桌面的App讓你能夠方便地把圖片文檔上傳然後讓大模型去幫你分析;發布了一個語音助手,由于使用了端到端大模型技術,所以這次語音助手的體驗超越了Siri,也遠超于我們以前用過的所有的各種AI助手,不僅能夠去感知情緒實時知道對話人的每一句話,並且在該插話的時候插話。”

ChatGPT Plus 用戶成了大冤種?

一方面,GPT-4o的免費開放使用爲廣泛的用戶群體提供了接觸高端AI技術的機會,另一方面,對于ChatGPT Plus的訂閱用戶而言,他們可能會感到自己支付的訂閱費用沒有得到預期的獨家優勢,因此在互聯網産生了爭議。盡管 GPT-4o 無需訂閱即可使用,但依賴更多的提示訪問權限和新功能的訪問權限的使用者,還是無法那麽快與ChatGPT Plus分道揚镳。與非訂閱者相比,ChatGPT Plus 訂閱者在必須等待或切換到功能較弱的模型之前,被允許發送 GPT-4o 的提示數量是前者的五倍。因此,如果用戶想要大量使用提示功能,訂閱是必要的。除了有限的 GPT-4o 訪問權限外,非付費用戶還獲得了整體用戶體驗的重大升級,其中包括以前僅爲付費客戶開放的多個功能。非付費用戶還可以使用 ChatGPT 的網頁浏覽工具和記憶功能,並且可以上傳照片和讓聊天機器人分析文檔。從本周開始,ChatGPT 的 Mac 桌面應用程序也將率先向 Plus 訂閱者提供。該應用程序使用戶在桌面上與 ChatGPT 交互的體驗更加無縫。例如,用戶可以截取當前正在查看的任何網頁的屏幕截圖,並讓聊天機器人生成可見信息的快速摘要。雖然預計 Mac 應用程序將更廣泛地向免費用戶提供,但該版本發布的具體時間表仍不明確。OpenAI 還計劃在今年年底前推出其桌面應用程序的 Windows 版本。所以,如果用戶只是想嘗試使用 GPT-4o 一段時間,並且不介意等待最新功能,那麽將不需要訂閱 ChatGPT Plus。

GPT-5 缺席,大模型向何處去

當地時間5月10日,OpenAI就事先表示,發布會上不會推出GPT-5,也不會發布搜索引擎産品,令一些網友頗爲失望,OpenAI的發展失速讓多數人始料未及。

奧特曼在直播活動後的一篇博客文章中反思了OpenAI的軌迹。他說,該公司的最初願景是“爲世界創造各種益處”,但他承認,願景已經發生了變化。OpenAI因沒有開源其高級人工智能模型而受到批評,奧特曼似乎想要表示,該公司的重點已經轉移到通過付費API向開發人員提供這些模型,並讓這些第三方進行創建。“相反,現在看起來我們將創建人工智能,然後其他人將使用它來創建各種我們都從中受益的令人驚歎的東西。”

對于OpenAI發布可實時進行音頻、視覺和文本推理的新一代AI模型GPT-4o一事,傅盛今日早間發短視頻對此進行評價:“所有國內人工智能從業者都在熬夜等著大洋彼岸放核彈,但是沒想到核彈沒有放,卻掏出了一堆摔炮。”傅盛表示,這樣的評論雖然是一句玩笑話,“但比較讓人失望的是這次OpenAI沒有發布GPT-5,連GPT-4.5也沒有看到,反而是發布了GPT-4o,就是把一系列的引擎給結合在一起,比如圖片、文字、聲音,這樣你就不需要來回去切換了。”

國盛證券則認爲,GPT-4o是邁向更自然的人機交互的重大進步,新功能帶來了嶄新的多模態交互能力,通過新的端到端模型實現了體驗上的新突破,有望在各類終端實現用戶體驗的最大化,利好智能終端Agent、機器人等方向。

傅盛指出,一方面,我們覺得OpenAI發布應用恰恰說明了應用在人工智能領域大有可爲,每一個創業者都應該去好好地做人工智能應用,大模型的能力當然會不斷地叠代,但最終能夠把大模型用好的還是應用。另一方面,如果不計成本的累參數,提高所謂的大模型能力,這條路肯定是容易遇到困難的,目前看起來GPT-5可能還要難産一段時間。金沙江創投主管合夥人朱嘯虎此前就在采訪中坦言:“今年就可以看出大模型本身是不是好的商業模式,多少OpenAI的用戶會因爲價格差異遷移到Google的Gemini——OpenAI 20美金一個月,Gemini 10美金一個月。我們美國團隊已經有一半人切換到Gemini,一部分是因爲價格,另外一部分是因爲Google的生態。”

結語

隨著技術的不斷發展,我們期待OpenAI能夠繼續推動人機交互的邊界,並爲用戶帶來更加豐富和便捷的智能體驗。同時也不得不進一步思考,在大模型發展即將見頂後,下一步該怎麽走,諸如如何平衡技術創新與商業可行性,如何確保廣泛的用戶接受度,以及如何在激烈的市場競爭中保持領先,這也是OpenAI及整個AI行業都需要深思的問題。

本文爲動點科技記者原創文章,未經授權不得轉載,如需轉載或開白請在後台回複“轉載”。

- - - - - - - - END - - - - - - - -

互動話題

您認爲GPT-4o的出現會帶來重大影響嗎?

快來評論區留下你的觀點吧!*想要獲取行業資訊、和志同道合的科技愛好者們分享心得,那就趕快掃碼添加“動點君”加入群聊吧!群裏更有不定期福利發放!

精彩好文值得推薦!

一鍵轉發,戳個在看!

0 阅读:0

動點科克

簡介:感謝大家的關注