電影情節變現實,GPT-4o亮相,讓馬斯克感到“不適”

壹恣穿雲箭 2024-05-14 22:14:22

北京時間5月14日淩晨,OpenAI公司繼今年2月份推出首個AI視頻模型Sora後,又用短短26分鍾的發布會,扔出了新王炸——他們推出了全新旗艦AI模型GPT-4o(GPT-4 omni),omni指的是“全能模型”。

OpenAI公司稱,GPT-4o邁出了未來AI與人類進行“自然人機交互”最爲重要的一步,它可以接受用戶輸入的任意文本、音頻、圖像的隨意組合信息,並能以文圖音的任意組合模式進行反饋回應。

GPT-4o在正式發布前,是一個在LMSys競賽中的測試版本,當時名爲“im-also-a-good-gpt2-chatbot”,在測試中就表現優異,遠超GPT-4 Turbo、GPT-4、Gemini等模型的強大性能,從模型能力、安全和局限性等方面刷新了業界水平。

正式版本的GPT-4o對音頻輸入(即語音交互)的平均響應時間爲 320 毫秒,最短只需要232 毫秒,這與人類之間使用語言溝通的響應時間相近,據介紹,與現有模型相比,它在視覺和音頻理解方面勝出許多。

OpenAI首席技術官穆拉蒂(Mira Murati)在活動中,演示了裝載在一部iPhone上的GPT-4o語音助手,要求它講個睡前故事,要求它以歌聲結束這個故事,並附加了機器和人類語音切換,英語和意大利語互譯等——這看起來平平無奇,小愛,小度之類的國內“智能音箱”的智力水平也能達到,不過就是廣告多一些而以。

在GPT-4o在被要求通過手機攝像頭解讀演示者面部表情,並判斷當前的情緒時,它的表現讓人驚豔。

“你此刻看起來是快樂而開朗的,笑容燦爛,甚至可能有點興奮……”AI很快用活潑的女聲給出了回應,“不管發生了什麽,看起來你的心情很好,願意分享一下這些美好的感覺的來源嗎?”

業界人士稱,GPT-4o的發布,或將顛覆實時翻譯、音視頻剪輯、看護照顧等衆多行業,並向人類提供以假亂真的AI交互場景——如果類似的AI模型植入到類人仿生機器人中——那以前的科幻電影,便會成爲現實場景。

此前,英偉達CEO黃仁勳就曾表示,ChatGPT的出現是 AI 的“iPhone時刻”,表示很看好並期待這家公司在未來給人類社會帶來的改變。

但另一位大佬馬斯克在看過發布會後表示,GPT-4o的演示讓他感到“不適、尴尬”,這遭到了GPT粉絲的不滿,有用戶留言回怼——“放出Grok的可用版本的類似産品再說話吧……”

Grok是馬斯克的AI初創公司X.ai推出的AI模型,它是用了包括馬斯克收購的社交媒體平台X(原名Twitter)上的語料訓練出來的——但它在基准測試中,比不過GPT4,也比不過Palm-2及Claude3,隨後,馬斯克將它開源,用戶可以免費商用,但至今仍沒有基于Grok的知名大型應用産品出現。

GPT-4o可以用人類的聲音與用戶交談,通過攝像頭的面部捕捉,實時理解用戶的面部表情,並即時的進行交互——包括但不限于翻譯、答疑,聊天,甚至是與用戶進行“調情”……

這讓很多人想到了一部2013年的科幻電影《她》。

片中講述了一個心碎而孤獨的作家西奧多,愛上了存在于電腦中的女聲AI操作系統薩曼莎——GPT-4o現在展示出來的能力,正是當初片中的薩曼莎的能力!

有人在社交媒體上留言,“世界永遠的改變了……”,得到了OpenAI的CEO奧爾特曼(Sam Altman)的回應,他明確指出了這部電影的名字。

隨後不久,他還單獨發文暗示GPT-4o確實有點像電影中的“她”——“感覺就像電影裏的AI,這對我來說仍然有點驚訝,但它是真實的……”

在很早以前的一次公衆活動中,奧爾特曼就明確表示過,他最喜歡的電影就是《她》,因爲“薩曼莎”能做對的事情……

有興趣的朋友可以去找這部電影來看看,不放鏈接了,如果趕時間,也可以在字母站上看到很多這部電影的解說。

最後,OpenAI稱,人們可以免費使用GPT-4o。

好吧,國産AI,請給點力!

0 阅读:0

壹恣穿雲箭

簡介:牆內外新鮮火箭發射趣聞和時事