山姆-奧特曼怒噴谷歌,GPT-4o搶了Gemini風頭

鋅財經 2024-05-20 22:10:51

文/孫鵬越

編輯/大風

這些天的硅谷,亂成了一鍋粥。

OpenAI CEO山姆-奧特曼直接在社交平台公開嘲諷谷歌的審美過于差勁,他表示:我努力不去過多思考我們的競爭對手,但我無法不去思考OpenAI和谷歌之間的美學差異。

下面附著的兩張發布會現場圖,左邊是OpenAI,右邊是谷歌。言下之意,就是OpenAI幹淨明了,極具科技感;而谷歌則離人群非常遠,十分過時。

OpenAI CEO山姆-奧特曼

山姆-奧特曼如此氣急敗壞,還是因爲在上周,OpenAI和谷歌同時發布AI新品,雙方打的你來我往:你說GPT-4o全球最先進,我說Gemini家族能覆蓋全生態全路徑。

兩家硅谷巨頭的直接對抗,把科技競賽的強度拉滿,就連CEO本人都坐不住了。

谷歌AI全家桶上線

山姆-奧特曼嘲諷谷歌並不是無的放矢,這場谷歌I/O大會在觀看性上,確實差強人意。

首先是時間太長,谷歌I/O大會足足有接近兩個小時,主持人連續提起了121次AI字眼,甚至有觀衆在社交平台抱怨自己都快睡著了。

然後就是産品太多,比起OpenAI僅有GPT-4o一款新品,谷歌這次則推出了十余種Gemini大模型的升級及新品,可以說是“AI全家桶”。

發布AI搜索:Google Search;

升級了Gemini大模型:Gemini 1.5 Flash(100 萬上下文)、Gemini Pro(200 萬上下文);

新發布了手機版Gemini App:以手機應用程序形式,支持和AI視頻對話;

發布視覺語言模型Project Astra:擁有Imagen3(圖像)、Music AI Sandbox(音樂)、Veo(視頻生成)三種能力。

雖然谷歌AI全家桶看上去格外炫酷,但實際上對比OpenAI的GPT-4o依然差上很多,更多是硬件性升級,單純給大模型升級一下參數。

谷歌Gemini家族

最令人印象深刻的兩項功能,是AI搜索Google Search和AI助理Project Astra。

首先是Google Search,搜索作爲谷歌起家的根本,這些年遭受到了微軟的重創。微軟的Bing已經借助ChatGPT,給傳統搜索引擎帶來了“億點點”AI降維打擊。

甚至就連OpenAI也在盛傳將推出AI搜索類産品,來搶占Google搜索市場。

壓力之下,谷歌推出Google Search來穩定自家護城河,下定決心重塑搜索體驗。

據演示視頻來看,Google Search最核心的功能,就是搜索摘要功能AI Overview。

所謂的“搜索摘要功能”,就是谷歌之前提出來的“搜索生成式體驗(SGE)”。

用戶在搜索框內鍵入文本,直接在最上方跳出AI幫忙整理的信息摘要。其中包含用自然語言對搜索結果的總結和概括,以及推薦的鏈接。

AI Overview還內置了“多步推理功能Multi-Step Reasoning”、“計劃功能Planning in Search”、“視頻提問Ask With Video”。

另外一個發布會亮點,就是谷歌推出的AI助理Project Astra。

Project Astra就是一個完全對標GPT-4o的産品,産品形態和使用邏輯基本和ChatGPT無二。用戶可以和它實時對話、視頻聊天。

並且,和GPT-4o一樣,Project Astra也提供文生圖、文生視頻兩項功能。只不過不叫DALL·E和Sora,而是叫做Imagen 3和Veo。

唯一有點不一樣的,就是Project Astra提供了音樂生成模型Music AI Sandbox。

用戶可以上傳一小段音樂demo,Music AI Sandbox能在此基礎上拓展延長。用戶還可以輸入提示詞,進一步調整音樂風格,進行樂曲的二度創作。

總之,用一句話來概括谷歌AI全家桶,就是:東西很多,精品很少。

我們能在一系列AI新産品裏,不斷看到ChatGPT的影子,但單純是在GPT-4o做好的框架裏縫縫補補,升級一下算力,換個新框架。

能給用戶帶來震撼感的産品呢?

依然沒有看到。

越來越像人類的GPT-4o

比起谷歌的多到淩亂,OpenAI則是簡潔明了。

僅僅只有半個多小時,全程由公司CTO和兩位工程師face to face,以對話形式展示産品,非常具有電影感。

甚至CEO山姆-奧特曼都沒有現身發布會,完全用産品力來震撼用戶。

現場的演示嘉賓拿著手機攝像頭,讓GPT-4o識別自己的表情,來判斷自己的情緒。

GPT-4o很快識別完成,說:你看起來很開心,帶著燦爛的笑容,甚至有一絲興奮,你能分享你快樂的來源嗎?

演示嘉賓在紙上寫了“i love you”給GPT-4o,GPT-4o用帶有一絲絲嬌羞、熱情四溢的語氣快速回應著人類的“愛意”。

GPT-4o演示現場

GPT-4o能感受到你的呼吸節奏、能“看出”你文字當中包含的情緒、甚至可以打斷它的話,重新爲話題增加新的語境,它也能作出完美回應……

這樣的人工智能,讓你想到了什麽?

是的,一個完美戀人。

就像是2013年上映的好萊塢電影《Her》,斯嘉麗配音的人工智能和人類談起了戀愛。

這一幕,逐漸成爲現實。誰會不喜歡一個熱情洋溢、事事有回應、提供豐富情緒價值的伴侶呢?

哪怕它是AI。

GPT-4o給後來者谷歌一個下馬威,也給出未來AI大模型的一個滿分答案:不管是生成式AI大模型也好,聊天機器人也好,不用再去關心什麽硬件什麽參數,AI的最終方向就是越來越像人類。

OpenAI並沒有過多描述自己的算力、自己的硬件升級,只是由首席技術官穆裏·穆拉蒂 (Muri Murati) 表示,GPT-4o將提供與GPT-4同等水平的智能,但在文本、圖像以及語音處理方面均取得了進一步提升,“GPT-4o可以綜合利用語音、文本和視覺信息進行推理。”

現階段的GPT-4o已經擺脫了對文本、圖片或語音的束縛,它的識別能力進化到了“聽覺”和“視覺”。

用“聽”來捕捉情緒變化,比如能判斷對方急促的呼吸方式不對;用“看”來識別你寫在紙上的方程式數學問題,一步步教你解題步驟。

甚至它還可以通過手機攝像頭,回答你“這個人穿什麽牌子的襯衫?”

比起谷歌眼花缭亂、不知從哪下手的AI全家桶,GPT-4o已經領先到大氣層了。

免費,但又不完全免費

GPT-4o除了在能力上,給了谷歌一個下馬威外,OpenAI還放了大招:

穆裏-穆拉蒂表示,GPT-4o將免費提供給所有用戶使用,不但當下免費,甚至以後OpenAI做産品就是要免費優先,爲的就是讓更多的人能使用。

就連OpenAI CEO山姆奧特曼表示,新的GPT-4o是OpenAI有史以來最好的模型,它可供所有ChatGPT用戶使用,無論是免費版本還是付費GPT-4版。

不得不說,當服務免費時,用戶就是産品。

如果GPT-4o真的能徹底取消付費制度,那麽OpenAI獲得的數據量會超出想象。

可惜的是,OpenAI還是缺少“用免費改變世界”的魄力,背後還是有不少的貓膩。

穆裏·穆拉蒂 (Muri Murati)

首先,OpenA在官網公告上明確說明,免費用戶在使用GPT-4o時,OpenAI做出了權限上的分級。

免費用戶可以使用GPT-4o的分析數據、創建報表、處理照片、上傳文件、使用記憶功能等,基本上GPT-4o涵蓋了GPT4所有的付費功能。

但是免費用戶會有消息數量的限制,PIUS用戶的消息將是免費用戶的5倍,Team和Enterprise用戶限制將會更高。

每天能用多久?每天能發幾條?GPT-4o並沒有詳細說明。

或許,我們可以參考OpenAI上一代GPT-4,限制每個用戶每天的使用時間在3小時以內,並限制每天生成的信息數量不超過25條。

雖然說這一限制在一定程度上,提高了信息的質量和用戶的注意力。但還是要感歎一句,互聯網的免費,永遠不是真免費。

哪怕到了AI時代,這個法則也同樣適用。

0 阅读:0

鋅財經

簡介:新商業的記錄者,新經濟的推動者