OpenAI，不再是「布道者」

當OpenAI首席技術官米拉·穆拉提發布桌面版本的ChatGPT和新的旗艦模型—GPT-4o，OpenAI的發展，進入到了一個真正意義上的奇點時刻。

OpenAI的短短26分鍾的發布會，卻依然引發了不少波瀾。

無論是ChatGPT-4o的完全免費，抑或是推出PC桌面版的ChatGPT，無一不爲我們顯示出OpenAI的領先。

然而，如果僅僅只是一味地尬吹OpenAI的領先，必然是沒有太多裨益的。

原因在于，OpenAI的確在很多方面具備著相對領先的優勢，這樣一種領先，並不僅僅只是體現在它與谷歌的差距上，同樣還體現在它與中國AI玩家們的差距上。

透過OpenAI的發布會，我們需要更多地看到的是，時下的AI行業，正在發生著的深刻變化，並由此來找到適合當下發展趨勢的新機會。

如果一定要找到OpenAI的這場短短發布會帶給我們的啓示的話，我更加願意將其看成是AI正走在互聯網道路上的一種直接體現。

以此爲開端，AI將會真正從一個局限于實驗室裏的存在，成爲一個被越來越多的大衆所認識、所使用、所接受的存在。

如果我們將ChatGPT-4o之前的OpenAI，看成是一個布道者的話，那麽，ChatGPT-4o之後的OpenAI，則更像是一個實踐者。

一句話，OpenAI正在open AI。

未來，我們將會看到越來越多的場景和行業當中，開始出現AI的影子，我們將會看到越來越多的玩家們，開始加入到普及與落地AI的過程當中。

認識到這一點，我們或許才能更好地把握OpenAI這樣一個短短26分鍾的發布會，帶給我們的更深層次的意義。

一

OpenAI這樣一個發布會扔出的「王炸」，其實就是推出了ChatGPT-4o這樣一個完全免費的應用。

從表面上來看，OpenAI之所以會進行完全免費，其中一個很重要的原因在于，它的用戶的增長業已進入到瓶頸期，爲了拓展更多的用戶，OpenAI便開始通過免費的方式來獲得新的用戶。

自去年ChatGPT推出後，在2023年5月達到流量峰值，網絡訪問量達到18億次，但之後流量出現下滑情況。2024年3月，ChatGPT的訪問量依然穩定在了18億次，不再有明顯增長。

當OpenAI通過ChatGPT-4o完全免費進一步降低使用門檻，首先起到立竿見影效果的，便是用戶量的增長。

對于業已陷入到用戶增長瓶頸期的OpenAI來講，無疑是一個非常不錯的嘗試。

如果我們將ChatGPT-4o的完全免費，看成是OpenAI爲了提升用戶量所做的一次嘗試的話，那麽，ChatGPT-4o此次將更多的場景應用到端側模式以及代碼生成能力的場景應用，則是將OpenAI的用戶量的增長拓展到了更爲廣闊的領域之中。

這其實是和互聯網行業的發展，有著異曲同工之處的。

我們都知道，早在互聯網尚未風靡的時候，人們對于互聯網的使用，並不是像現在這樣普及，甚至在很多情況下，人們對于互聯網的使用，如同現在人們對于AI的使用一樣，必須要付費。

很顯然，通過付費的方式，很難讓互聯網釋放出更大的發展潛能，很難成就一個叫做「互聯網」的時代的。

于是，爲了讓互聯網釋放出更大的發展潛能，爲了讓互聯網真正成就一個時代，必然需要做的，便是將以往收費的互聯網服務進行免費，並且真正用這樣一種方式來實現互聯網的最大限度的普及。在此基礎上，我們再去尋找「互聯網+」的商業模式。

可以說，免費，真正讓互聯網成爲了一種「基礎設施」，而免費同樣促進了「互聯網+」模式的不斷成熟和完善。

對標到AI的身上，其實同樣如此。

毋庸置疑的是，OpenAI通過ChatGPT讓我們看到了AI的強大，讓我們看到了對于效率提升的積極影響。

然而，在很多時候，人們對于AI的感知依然是在收費的情況下完成的，依然是受到收費的掣肘的。

在這樣一種情況下，AI很難成爲一種基礎設施，更加難以釋放出新的更大的發展潛能的。

因此，如果一定要找到AI走在互聯網上道路上的具體表現的話，完全免費，並以此來促成AI最大限度的普及，並以此來孕育出更多新的商業模式，無疑是最直接的表現。

當OpenAI撕開了免費的口子，我們或許還將會在未來看到更多玩家加入其中，從而真正將人們帶入到人人皆可使用AI，萬物皆可AI的全新發展階段。

二

除了ChatGPT-4o的完全免費之外，OpenAI在發布會上更多地爲我們展示的是，GPT-4o的模型能力、基准測試、模型安全性和局限性。

模型能力上，在GPT-4o之前，ChatGPT語音模式對話的平均延遲爲2.8秒(GPT-3.5)和5.4秒(GPT-4)。

如今借助GPT-4o，OpenAI跨文本、視覺和音頻端到端地訓練了一個新模型，這意味著所有輸入和輸出都由同一神經網絡處理。

傳統基准測試層面上，GPT-4o在文本、推理和編碼智能方面實現了GPT-4 Turbo級別的性能，同時在多語言、音頻和視覺功能上均處于高位。

在5次MMLU（常識問題）上，GPT-4o創下了87.2%的新高分，遠超谷歌Gemini Pro 1.5、Ultra 1.0，以及自己的GPT-4T和GPT-4等。

模型安全性和局限性上，GPT-4o通過過濾訓練數據和通過訓練後細化模型行爲等技術，在跨模式設計中內置了安全性。以及創建了新的安全系統，爲語音輸出提供防護。

根據對網絡安全、CBRN、說服力和模型自主性的評估表明，GPT-4o在這些類別中的任何類別中的得分都不高于中等風險，而且團隊繼續降低發現的新風險。

如果要找到ChatGPT-4o這些特征爲我們傳遞出來的信息的話，說到底，就是爲了讓更多的用戶可以更加快速、更加安全、更加高效地使用ChatGPT-4o。

簡單來講，OpenAI在ChatGPT-4o上的這些進化，正是爲了其産品更好地進行商業化。

透過這一點，我們同樣可以看出，AI的發展，正走在互聯網的道路上。

我們都知道，在互聯網時代，我們經曆了DOS系統，Windows系統以及後來的iOS系統、安卓系統等操作系統。

如果對這些操作系統進行總結和定義的話，說到底，它們進行不斷地升級的一個終極目的，就是爲了讓互聯網可以更好地商業化，可以讓互聯網更好地與商業場景結合在一起。

當互聯網有了這樣的進化，我們才看到了衍生于互聯網的門戶網站、「互聯網+」應用以及移動互聯網時代所誕生出來的各式各樣的應用。

可以說，互聯網的不斷的叠代和升級所帶來的一個最爲直接的結果，便是互聯網的商業化的普及。

對于AI來講，其實，同樣是在遵循這樣一種發展脈絡。

說到底，AI最終還會要落腳在商業化上，才能夠真正將自身的發展潛能釋放到最大。

否則，所謂的AI，依然僅僅只是一個講給資本市場聽的美好的故事，當資本的熱情不再，特別是當AI的發展真正需要自我造血的時候，它的發展，依然還是會面臨這樣那樣的問題。

無論是百度的李彥宏，還是360的周鴻祎，乃至是金沙江創投的朱嘯虎，其實都在不同的場合表達過對于AI的這樣一種看法。

說到底，他們所表達的觀點，其實都是一個中心思想。

這樣一個中心思想，其實就是讓AI更多地聚焦場景和應用，更多聚焦在商業化上，而不僅僅只是一個停留在實驗室裏，並不僅僅只是局限于有限場景之中的小衆存在。

透過ChatGPT-4o的發布，我們可以看出，OpenAI在探索和實踐商業化的方式和方法，以此爲開端，我們將會看到更多有關AI沿著互聯網的道路發展的新迹象的出現。

三

回顧互聯網的發展，不難看出，互聯網之所以會獲得如此大的發展，之所以會成爲人們的一種生活方式，其中一個很重要的原因在于，互聯網得到了最大限度的普及。

時至今日，互聯網，業已成爲了幾乎所有人的生活方式。

以直播、短視頻爲主導的全新時代的來臨，更是將互聯網的普及率，帶入到了一個全新的高度。

對于AI來講，欲要獲得新的發展，欲要成爲一種全新的生活方式，必然需要重新演繹以往互聯網所走過的道路，必然讓以往互聯網所做的普及的動作，重新在自己的身上得到演繹。

如果我們要尋找OpenAI這樣一場發布會提供給我們的新啓示的話，它不斷地讓AI進行普及，不斷地將AI成爲一個被B端和C端都能夠接受的存在，或許才是值得關注的另外一個方面。

當OpenAI以ChatGPT的聊天機器人出現在人們的面前，它僅僅只是在聊天這樣一個場景下存在，它僅僅只是解決的是較爲簡單的邏輯推理的能力。

時至今日，ChatGPT早已不再是簡單意義上的聊天機器人，它不僅可以聊天對話、文生圖片，還能文生視頻，甚至還可以像人的反應速度一樣與人們進行交互。

OpenAI表示，GPT-4o（“o”代表“omni”）是邁向更自然的人機交互的一步——它接受文本、音頻和圖像的任意組合作爲輸入，並生成文本、音頻和圖像的任意組合輸出。

GPT-4o可以在短至232毫秒的時間內響應音頻輸入，平均爲320毫秒，與人類的響應時間相似。

它在英語文本和代碼上的性能與GPT-4 Turbo的性能相匹配，在非英語文本上的性能顯著提高，同時API的速度也更快，成本降低了50%。與現有模型相比，GPT-4o在視覺和音頻理解方面尤其出色。

說到底，OpenAI其實就是通過不斷地提升ChatGPT的交互能力來提升人與AI溝通和交流的門檻，不斷地讓OpenAI的産品更好地進行普及。

如果將OpenAI在交互上的提升與互聯網以往的發展脈絡進行總結和定義的話，它們共同的終極目的，其實就是爲了讓AI可以更好地普及，並且真正讓AI成爲一種全新的生活方式。

因此，如果我們要找到OpenAI的發布會給我們的新啓示的話，不斷地讓AI普及，不斷地沿著互聯網的方向前進，無疑是另外一個最值得我們關注的方面。

正如OpenAI CEO奧特曼在發布會後的博客裏所說的那樣：

「我爲我們能在ChatGPT中免費提供世界上最先進的模型感到非常自豪，這一切都沒有廣告或其他幹擾。最初，OpenAI的設想是開發AI技術，並利用它爲全球帶來益處。然而，現實是我們開發了AI技術，而其他人則利用這些技術創造了令全世界受益的傑出成果。作爲一家企業，我們有很多服務是需要收費的，但不妨礙我們支持向全球數十億用戶提供免費的頂尖AI服務。」

「新推出的語音（及視頻）模式是我使用過的最佳計算界面。它給人一種電影中AI的感覺，讓人不禁驚歎這竟是真的。達到與人類相似的響應速度和表達能力，標志著一個重大的轉變。最初的ChatGPT已經展示了語言界面的潛力；而這一新技術則在體驗上有了質的飛躍。它反應迅速、智能、有趣、自然且實用。以前，我與計算機對話從未感覺如此自然；但現在，我終于有了這種感覺。隨著我們逐步增加個性化選項、獲取個人信息的權限、代表用戶執行操作的能力等功能，我真的可以預見到一個激動人心的未來：我們能夠利用計算機完成以往無法想象的更多事務。」

結語

如果一定要尋找OpenAI這樣一場短短26分鍾的發布會傳遞出來的信息的話，OpenAI正走在互聯網的道路上，無疑是再清晰不過的了。

可以說，通過這樣一場發布會，OpenAI完成了從AI布道者向實踐者的完美轉身。

對于AI來講，其實是需要這樣一場免費化、普適化和商業化的。

至此，OpenAI開始open AI。

原因在于，只有經曆了這樣一場普及和商業化，AI的發展，才不僅僅只是一個停留在實驗室裏的存在，才不僅僅只是一個小衆化的存在，而是成爲了一個類似互聯網的，可以與萬千場景，千行百業都實現了深度融合的存在。

以此爲開端，ChatGPT才能真正成爲英偉達CEO黃仁勳口中的「iPhone時刻」，而GPT-4o，無疑是OpenAI的奇點時刻。

—完—

作者：孟永輝，資深撰稿人，專欄作家，行業觀察家，知名KOL，數字經濟學者。

娛樂新聞吧

孟老獅