OpenAI大招要來了!AI語音助手狙擊谷歌蘋果,官宣下周二上新,GPT-5年前見

智東西 2024-05-11 12:49:51

作者|香草

編輯|李水青

智東西5月11日消息,今天淩晨,OpenAI宣布將于美國時間13日上午10點(北京時間14日淩晨1點)在官網直播,演示ChatGPT、GPT-4的更新內容。

據外媒The Information今日報道,OpenAI正在構建具備音頻和視覺理解能力的AI語音助手,其中一些功能已經開始向客戶展示,可能在下周的發布活動中預覽。

知情人士消息透露,OpenAI可能會在今年內完成GPT-5的開發並公開發布。此外,OpenAI還計劃推出一種新的定價模式,客戶通過預付費預定Token,最高可以享受50%的折扣。

此前有多家外媒和博主曝料,稱OpenAI將在近日發布AI搜索引擎。其CEO阿爾特曼對此回應道:“不是GPT-5,也不是搜索引擎,但我們一直在努力開發一些我們認爲會得到喜歡的新東西。”

▲阿爾特曼回應新品演示(圖源:X)

值得注意的是,其競爭對手谷歌的I/O開發者大會時間定在美國時間14日上午10點(北京時間15日淩晨1點),預計可能發布Gemini大模型的重要更新。OpenAI此次發布時間沒有定在之前外媒曝料的5月9日,而是“恰好”卡在I/O大會的前一天,火藥味可謂濃厚。

要知道,這已經不是OpenAI第一次“卡點”狙擊谷歌新品。今年2月,谷歌放出Gemini 1.5 Pro大招,結果沒過幾個小時,OpenAI就掏出文生視頻“王炸”模型Sora,狠狠搶了Gemini 1.5 Pro的風頭。

直播發布地址:http://openai.com

一、AI語音助手仍存在“幻覺”問題,或將集成至ChatGPT免費版

據The Information報道,阿爾特曼的終極目標是開發出類似電影《她》(Her)中,可高度響應的虛擬助手,提升蘋果Siri等現有語音助手的可用程度。

▲電影《她》劇照

OpenAI認爲,具有視覺和音頻功能的AI語音助手具有像智能手機一樣的變革性潛力,理論上其可以做到一系列現在的AI助手無法做到的事,例如充當論文、數學問題指導老師,或是翻譯交通標識、幫助解決汽車故障等。

但類似的技術目前所需硬件門檻太高,無法在個人設備上運行,用戶可以在短期內使用基于雲的版本來獲取這些功能,例如自動化客戶服務Agent。

OpenAI目前已經推出具備音頻轉錄、文本轉語音等功能的軟件,不過這些功能是基于獨立的對話AI模型實現,而新的語音助手則將這些功能整合在一起。據知情人士透露,該AI語音助手的音頻功能能夠幫助客服人員更好地理解對方的語氣。

目前尚不清楚OpenAI何時向付費客戶提供這些新功能,但據試用過該語音助手的人士透露,OpenAI最終的計劃是將這些功能都納入ChatGPT免費版本,目標是比目前其最先進模型GPT-4 Turbo的運行成本更低。該人士還談道,AI語音助手在有些類型的問題上回答優于GPT-4 Turbo,但仍然存在幻覺問題。

對此,OpenAI發言人沒有回應置評請求。

二、與谷歌競爭iPhone合作位,GPT-5或于年底前發布

OpenAI推出AI語音助手主要目標是與谷歌競爭。

谷歌的AI模型Gemini能實時響應語音命令,並識別圖像、視頻等。不過這些功能目前仍需要研究人員附以圖像和文字說明,且並不能理解許多傳統的語音指令,也不能像Siri和谷歌助手等傳統語音助手那樣與用戶對話。

▲谷歌展示Gemini多模態功能(圖源:谷歌)

另一方面,提高模型的視覺、音頻能力也有助于OpenAI與蘋果達成合作。

最近幾個月,蘋果與OpenAI就下一代iPhone操作系統如何整合OpenAI的模型進行了討論。然而,與此同時,蘋果也與谷歌進行著類似的談判。

這場競爭的最新消息是,據彭博社今早報道,蘋果已接近與OpenAI達成協議,將在下一代iPhone操作系統iOS 18中使用ChatGPT;與谷歌尚未達成協議,但談判仍在進行中。

除了可能在下周推出的AI語音助手外,OpenAI還一直致力于構建一款AI搜索引擎,旨在與谷歌競爭。此外,其也在開發一種被稱作“計算機使用Agent”的自動化軟件,用來輔助軟件開發和其他計算機任務。

阿爾特曼還在與iPhone開發者喬尼·艾維(Jony Ive)合作開發一款獨立的AI硬件。然而,最先進的AI模型體積龐大,需要在雲端運行,並需要互聯網連接才能工作。要使具有視覺和聽覺功能的複雜AI模型變得足夠小巧,以便在設備上運行,可能需要幾個月甚至幾年的時間。

不過,大家最關心的可能還是GPT-5。據The Information報道,一位接近OpenAI領導人的人士稱,其可能在今年年底完成GPT-5並公開發布。

OpenAI的新産品和AI模型開發工作進展得如火如荼,與此同時,其此前宣布的一些項目卻變得不再那麽受關注。盡管OpenAI曾向開發者承諾,會在今年第一季度推出GPT Store開發者激勵計劃,但目前仍沒有實現。

三、計劃推出預付費定價模式,最高提供50%折扣

在定價方面,據知情人士透露,OpenAI計劃推出一種新的定價模式,如果客戶通過預付費預定Token,最高可以享受50%的折扣。

這樣的優惠形式在雲計算領域比較常見,微軟Azure、谷歌雲、亞馬遜雲服務(AWS)等都提供提前預定服務器容量折扣的方式來降低成本。

目前,按需定價提供API(應用程序接口)是OpenAI大模型的主要付費形式,通過每生成100萬Tokens,向開發者收取幾美分至一百多美分不等的費用,其中大客戶可以享受批量折扣。

此前OpenAI已經提供了一種降低開發者成本的方式,其在4月推出Batch API,如果開發者批量上傳模型查詢,並接受等待最長24小時的時間,就可以獲取更低的價格。

Together AI和Anyscale等AI服務器經銷商曾表示,在他們的軟件上運行開源模型要比使用OpenAI的模型便宜6倍。通過更靈活的定價,OpenAI與其他模型開發商的競爭將更具優勢。據透露,其今年的營收可能達到數十億美元。

結語:OpenAI谷歌相爭,蘋果微軟得利?

OpenAI與谷歌之間的競爭愈發激烈,二者之間的“商戰”火藥味也愈發濃厚。OpenAI又一次將新品發布時間定在了谷歌重大發布時間附近,似乎執著于搶奪谷歌風頭這件事。

這一邊,蘋果同時與OpenAI、谷歌商談模型集成至iPhone事宜,再次加劇了兩家公司之間的競爭。雖然OpenAI被曝已與蘋果達成合作,但谷歌那邊的談判也仍在繼續。

而另一邊,微軟作爲OpenAI最大的財務支持者,可以優先使用其先進技術來改進自己的語音助手。而微軟也並非“孤注一擲”,除了積極自研模型外,還投資了OpenAI有力競對Mistral AI,後者成爲第二家在微軟Azure雲平台上提供商業AI模型的公司。

下周的OpenAI新品發布和谷歌I/O大會,或許會將這場“商戰”推向新高度。究竟誰的“大招”會更厲害,我們拭目以待。

0 阅读:4

智東西

簡介:智能産業第一媒體!聚焦智能變革,服務産業升級。