被封殺後,字節跳動大模型,重走遊戲業務老路?

銀箭財經 2023-12-30 03:09:38

字節跳動的大模型,被戴上了“抄襲”的帽子。

12月16日曾有市場消息稱,因“使用OpenAI技術打造自己的大語言模型”,字節跳動違反OpenAI服務條款,遭到“封殺”。事件發酵後,OpenAI發言人尼克·菲尼克斯在當天作出回應,確認字節跳動違反服務條款屬實,其賬號已被暫停。

隨後在17日,字節跳動對外聲稱未來幾天將再次全面檢查,並正在與OpenAI聯系溝通,“以澄清外部報道可能引發的誤解”。

這不由得令人聯想起前不久的11月,李開複旗下零一萬物大模型,被質疑“完全使用”Meta研發的LIama開源模型架構。兩個在業界都具有不俗影響力的大模型産品,接連被爆出與“抄襲”相關的指控,不免令人對國産大模型産品的研發環境,報以不小的擔憂。

參考國産大模型由上半年井噴式增長,到如今,核心技術層面頻繁遭到質疑的現狀,我們得出以下推測:

1.字節跳動遭封號後,仍處于研發階段的大模型業務或將遭受重創,大概率將影響未來的産品運營,未嘗沒有可能會像遊戲業務一樣,最終遭到字節跳動的剝離。

2.國産大模型在快速發展的背後,或許存在著對核心技術的不重視,以及對上線速度的過分追求。尤其是對開源項目的依賴,也在不斷增加抄襲暴雷的風險。

一、字節跳動大模型口碑崩壞,或將重蹈遊戲業務覆轍?

我們必須正視,封號風波發生後,字節跳動大模型業務已經隱現口碑崩壞的危險。

危險來自一個詞——衆口铄金。

在大模型研發階段,違反服務條款“借用”OpenAI技術,這一事件曝光後,相信包括許多AI從業人員在內,第一反應都會是猜測字節跳動走了“抄襲”的捷徑。

盡管被封號的背後,仍可能存在著“誤會”,事情真相也尚需查證和補充。但字節跳動在17日宣布將全面自檢後,連續多天沒有後續消息跟進,無疑給了負面信息加速發酵的機會。

輿情洶湧,字節跳動的澄清每晚一天,“抄襲”標簽就會與字節跳動大模型關聯得越發牢固。

考慮到字節跳動在前不久,剛剛因爲經營戰略的考量,大幅收縮朝夕光年的遊戲業務並進行大規模裁員。如果大模型業務無法在短時間內,澄清遭OpenAI“封殺”與“研發抄襲”之間的聯系,未必不會和遊戲業務一樣,落下個虎頭蛇尾的境地。

或許會有人質疑,在人工智能産業發展大趨勢下,字節跳動近一年來縮減了多條業務線,幾乎集中了全部資源投入AI相關業務,怎麽可能遭受一點挫折就前功盡棄?

但不妨想一想,在幾年前,遊戲産業同樣被字節跳動寄予厚望。甚至在當時,遊戲業務板塊的分量,似乎並不比如今的人工智能弱上太多。

回顧2021年,字節跳動曾宣布進行組織架構調整,成立了抖音、大力教育、飛書、火山引擎、遊戲、TikTok六大業務板塊。同年,字節跳動更是斥資40億美元,折合人民幣約286億元,收購了擁有東南亞現象級遊戲産品的沐瞳科技。

據不完全統計,爲了加快對遊戲産業的布局,從2019年至2022年,字節跳動投資遊戲産業超過22起,總投資金額超過了300億元。

然而等待字節跳動的,是連續兩年的“版號寒冬”。巨額成本投入難以換回相應的收益回報,字節跳動選錯了入局遊戲産業的時機,最終不得不在2023年,先是傳聞稱字節跳動將不低于50億美元的價格出售沐瞳科技,又最終對朝夕光年進行了大幅收縮。

如今字節跳動大模型産品尚未研發成功,可國內外大模型賽道已然陷入高度內卷,算力不足以及盈利難題更是逼迫ChatGPT一度暫停會員服務。很難說字節跳動是否會像布局遊戲業務一樣,再次錯過了最佳時機。

即便這次趕上了,持續走高的研發成本之下,在研發階段就已經開始口碑受損的字節跳動的大模型産品,又能在盈利困難的局面下堅持多久?

要知道,字節跳動所面臨的局面,要遠比李開複旗下零一萬物的“套殼抄襲”風波,更具風險。

零一萬物在11月中旬被國外開發者曝光,在只修改了兩個張量名稱的情況下,“完全使用”的LIama模型架構,是開源的。即便零一萬物套殼質疑屬實,最多也只是違背了開源標准,以及Llama的用戶協議。

簡單來講,此舉雖然侵犯了Llama開源模型的研發者Mate的權益,但只要沒有“實錘”,零一萬物“借鑒行業公開成果”的做法,並不會影響實際運營和使用。

但是字節跳動大模型研發過程中,違規使用的OpenAI,則是閉源的。哪怕站在行業角度,借助OpenAI的技術來訓練自家大模型,這樣的做法在如今並不罕見,但終究只是見不得光的潛規則。

字節跳動不僅是違反了規則,更是極大損害了自研技術的形象。如果不能盡快澄清事實,抹除不良影響,只怕即便後期成功推出大模型産品,也很難抹掉“抄襲”的標簽,有損業績表現。

事實上,字節跳動目前正需要新的增長曲線,來應對二季度財報發布後的市場變化。

根據前不久發布的二季度財報,目前字節跳動主要的增長推動力,在于面向海外市場的TikTok。第二季度中,自家跳動實現營收290億美元,同比增長40%,海外市場帶來的收入約占公司總收入的20%。

但目前TikTok在美國、印度、印度尼西亞等多個重要市場,都遭到了當地政府的封殺或限制。其中,遭到針對性打擊的方向,主要集中于電商、支付、數據服務等業務領域。

再加上Mate在近些年來,先後推出了借鑒TikTok主要功能和玩法邏輯的Instagram Reels、YouTube Shorts等短視頻産品,字節跳動TikTok業務的增長正在喪失穩定性。

一旦TikTok增量空間開始縮減,字節跳動花費巨大的大模型業務,短期內又無法實現盈利和業績推動,未必不會像遊戲業務一樣,遭到“及時止損”。

二、速度至上的國産大模型,開源項目成抄襲“原罪”?

其實嚴格來講,字節跳動被質疑“抄襲”,確實有些冤枉了。

根據封號事件發生後字節跳動的公開回應,對OpenAI旗下GPT模型API服務的使用,發生于2023年年初的初期探索階段。使用該服務的模型也是測試版,沒有上線和對外使用的計劃。

而且在2023年4月份,字節跳動引入GPT API的調用規則檢查,並對字節大模型訓練數據集進行嚴格規範後,使用OpenAI技術的做法就已經停止。

甚至在8月28日,OpenAI更新商業條款,提及“不得用使用(大模型)輸出來開發任何與OpenAI的産品和服務有競爭的人工智能模型”後,字節跳動爲了避免研發人員出現違規操作,專門在9月份進行了分批次內部抽檢。

如果這些說法全都屬實,很難想象爲什麽OpenAI會在時隔多月後忽然發難。

究竟是財報發布後,競爭對手的刻意針對,還是字節跳動有所疏漏,我們不得而知。但無論如何,字節大模型的口碑面臨崩壞風險,已成爲不爭的事實。

然而在國産大模型市場中,這或許只是冰山一角。

早在2022年,就曾有消息曝光過,北京智源人工智能研究院涉嫌抄襲AI大模型綜述研究。雖然事後被確認抄襲的兩名作者,第一時間撤稿後,已向原作者致歉並收獲諒解,但智源研究院仍然決定重組“大模型研究中心”,涉事的相關責任人也全都主動離職。

進入2023年後,國産大模型井噴式增長,更是引來了更多的“抄襲”質疑。

曾有業內人士透露稱,現階段許多初創公司爲了追趕大模型風口,大都采用將ChatGPT集成至後台,只是對前端界面進行UI設計,就開始大肆宣傳自己在開展AIGC創業,並上架各個平台搶奪用戶關注。

然而,這類AIGC項目實則缺乏技術壁壘與商業邏輯,僅屬“追熱度的短期行爲”,核心競爭力亦無從談起。

相對成熟的做法,則是通過對開源項目的二次開發,完成基礎模型框架的搭建,再利用ChatGPT等成熟産品生成AI數據,對自家大模型進行訓練。

速度至上,俨然早已成爲許多企業和機構對待大模型研發的主導思想。通過天眼查能夠看到,ChatGPT問世一年不到,與大模型相關的企業信息已經增長至248條。

然而,在這一過程中,對開源項目的過度依賴,正在爲行業的基礎不牢帶來負面影響。

大模型研發過程中,自然語言處理、計算機視覺等較爲複雜繁瑣的環節,開源項目能夠提供豐富的算法和技術資源,有助于縮短研發周期,降低研發成本。然而,過度依賴這些開源項目,就容易導致基礎不牢的問題。

一方面,過度依賴開源項目,會使企業在核心技術領域缺乏自主研發和創新能力。

開源項目雖然有著免費、高效、易于使用等諸多優點,但它們背後的知識産權和商業競爭風險不容忽視。如果一個企業完全依賴開源項目,那麽在市場競爭中就很容易受到制衡,甚至可能因爲開源項目的更新叠代、版權問題而陷入司法糾紛。

另一方面,過度依賴開源項目會影響行業的可持續發展。

所謂的開源項目,往往是由開發者社區自發式維護。就像曾經安卓系統開發初期,雖然開發者的熱情帶來了極快的更新速度,但由于技術實力等問題的限制,開源項目的質量參差不齊。

如果大模型行業過分依賴這些項目,可能會因爲項目本身的缺陷或漏洞,導致系統不穩定、性能下降等問題。這對于大模型發展生態而言,無疑是埋下了極大的隱患。

最後,希望字節跳動早日澄清與OpenAI的誤會,也祝願國産大模型企業能夠穩紮穩打,更多湧現擁有核心研發技術力的産品吧。

免責聲明:本文基于公司法定披露內容和已公開的資料信息,展開評論,但作者不保證該信息資料的完整性、及時性。

另:股市有風險,入市需謹慎。文章不構成投資建議,投資與否須自行甄別。

0 阅读:305

銀箭財經

簡介:洞察商業邏輯,明悉商業本質。