被封殺後，字節跳動大模型，重走遊戲業務老路？

字節跳動的大模型，被戴上了“抄襲”的帽子。

12月16日曾有市場消息稱，因“使用OpenAI技術打造自己的大語言模型”，字節跳動違反OpenAI服務條款，遭到“封殺”。事件發酵後，OpenAI發言人尼克·菲尼克斯在當天作出回應，確認字節跳動違反服務條款屬實，其賬號已被暫停。

隨後在17日，字節跳動對外聲稱未來幾天將再次全面檢查，並正在與OpenAI聯系溝通，“以澄清外部報道可能引發的誤解”。

這不由得令人聯想起前不久的11月，李開複旗下零一萬物大模型，被質疑“完全使用”Meta研發的LIama開源模型架構。兩個在業界都具有不俗影響力的大模型産品，接連被爆出與“抄襲”相關的指控，不免令人對國産大模型産品的研發環境，報以不小的擔憂。

參考國産大模型由上半年井噴式增長，到如今，核心技術層面頻繁遭到質疑的現狀，我們得出以下推測：

1.字節跳動遭封號後，仍處于研發階段的大模型業務或將遭受重創，大概率將影響未來的産品運營，未嘗沒有可能會像遊戲業務一樣，最終遭到字節跳動的剝離。

2.國産大模型在快速發展的背後，或許存在著對核心技術的不重視，以及對上線速度的過分追求。尤其是對開源項目的依賴，也在不斷增加抄襲暴雷的風險。

一、字節跳動大模型口碑崩壞，或將重蹈遊戲業務覆轍？

我們必須正視，封號風波發生後，字節跳動大模型業務已經隱現口碑崩壞的危險。

危險來自一個詞——衆口铄金。

在大模型研發階段，違反服務條款“借用”OpenAI技術，這一事件曝光後，相信包括許多AI從業人員在內，第一反應都會是猜測字節跳動走了“抄襲”的捷徑。

盡管被封號的背後，仍可能存在著“誤會”，事情真相也尚需查證和補充。但字節跳動在17日宣布將全面自檢後，連續多天沒有後續消息跟進，無疑給了負面信息加速發酵的機會。

輿情洶湧，字節跳動的澄清每晚一天，“抄襲”標簽就會與字節跳動大模型關聯得越發牢固。

考慮到字節跳動在前不久，剛剛因爲經營戰略的考量，大幅收縮朝夕光年的遊戲業務並進行大規模裁員。如果大模型業務無法在短時間內，澄清遭OpenAI“封殺”與“研發抄襲”之間的聯系，未必不會和遊戲業務一樣，落下個虎頭蛇尾的境地。

或許會有人質疑，在人工智能産業發展大趨勢下，字節跳動近一年來縮減了多條業務線，幾乎集中了全部資源投入AI相關業務，怎麽可能遭受一點挫折就前功盡棄？

但不妨想一想，在幾年前，遊戲産業同樣被字節跳動寄予厚望。甚至在當時，遊戲業務板塊的分量，似乎並不比如今的人工智能弱上太多。

回顧2021年，字節跳動曾宣布進行組織架構調整，成立了抖音、大力教育、飛書、火山引擎、遊戲、TikTok六大業務板塊。同年，字節跳動更是斥資40億美元，折合人民幣約286億元，收購了擁有東南亞現象級遊戲産品的沐瞳科技。

據不完全統計，爲了加快對遊戲産業的布局，從2019年至2022年，字節跳動投資遊戲産業超過22起，總投資金額超過了300億元。

然而等待字節跳動的，是連續兩年的“版號寒冬”。巨額成本投入難以換回相應的收益回報，字節跳動選錯了入局遊戲産業的時機，最終不得不在2023年，先是傳聞稱字節跳動將不低于50億美元的價格出售沐瞳科技，又最終對朝夕光年進行了大幅收縮。

如今字節跳動大模型産品尚未研發成功，可國內外大模型賽道已然陷入高度內卷，算力不足以及盈利難題更是逼迫ChatGPT一度暫停會員服務。很難說字節跳動是否會像布局遊戲業務一樣，再次錯過了最佳時機。

即便這次趕上了，持續走高的研發成本之下，在研發階段就已經開始口碑受損的字節跳動的大模型産品，又能在盈利困難的局面下堅持多久？

要知道，字節跳動所面臨的局面，要遠比李開複旗下零一萬物的“套殼抄襲”風波，更具風險。

零一萬物在11月中旬被國外開發者曝光，在只修改了兩個張量名稱的情況下，“完全使用”的LIama模型架構，是開源的。即便零一萬物套殼質疑屬實，最多也只是違背了開源標准，以及Llama的用戶協議。

簡單來講，此舉雖然侵犯了Llama開源模型的研發者Mate的權益，但只要沒有“實錘”，零一萬物“借鑒行業公開成果”的做法，並不會影響實際運營和使用。

但是字節跳動大模型研發過程中，違規使用的OpenAI，則是閉源的。哪怕站在行業角度，借助OpenAI的技術來訓練自家大模型，這樣的做法在如今並不罕見，但終究只是見不得光的潛規則。

字節跳動不僅是違反了規則，更是極大損害了自研技術的形象。如果不能盡快澄清事實，抹除不良影響，只怕即便後期成功推出大模型産品，也很難抹掉“抄襲”的標簽，有損業績表現。

事實上，字節跳動目前正需要新的增長曲線，來應對二季度財報發布後的市場變化。

根據前不久發布的二季度財報，目前字節跳動主要的增長推動力，在于面向海外市場的TikTok。第二季度中，自家跳動實現營收290億美元，同比增長40%，海外市場帶來的收入約占公司總收入的20%。

但目前TikTok在美國、印度、印度尼西亞等多個重要市場，都遭到了當地政府的封殺或限制。其中，遭到針對性打擊的方向，主要集中于電商、支付、數據服務等業務領域。

再加上Mate在近些年來，先後推出了借鑒TikTok主要功能和玩法邏輯的Instagram Reels、YouTube Shorts等短視頻産品，字節跳動TikTok業務的增長正在喪失穩定性。

一旦TikTok增量空間開始縮減，字節跳動花費巨大的大模型業務，短期內又無法實現盈利和業績推動，未必不會像遊戲業務一樣，遭到“及時止損”。

二、速度至上的國産大模型，開源項目成抄襲“原罪”？

其實嚴格來講，字節跳動被質疑“抄襲”，確實有些冤枉了。

根據封號事件發生後字節跳動的公開回應，對OpenAI旗下GPT模型API服務的使用，發生于2023年年初的初期探索階段。使用該服務的模型也是測試版，沒有上線和對外使用的計劃。

而且在2023年4月份，字節跳動引入GPT API的調用規則檢查，並對字節大模型訓練數據集進行嚴格規範後，使用OpenAI技術的做法就已經停止。

甚至在8月28日，OpenAI更新商業條款，提及“不得用使用（大模型）輸出來開發任何與OpenAI的産品和服務有競爭的人工智能模型”後，字節跳動爲了避免研發人員出現違規操作，專門在9月份進行了分批次內部抽檢。

如果這些說法全都屬實，很難想象爲什麽OpenAI會在時隔多月後忽然發難。

究竟是財報發布後，競爭對手的刻意針對，還是字節跳動有所疏漏，我們不得而知。但無論如何，字節大模型的口碑面臨崩壞風險，已成爲不爭的事實。

然而在國産大模型市場中，這或許只是冰山一角。

早在2022年，就曾有消息曝光過，北京智源人工智能研究院涉嫌抄襲AI大模型綜述研究。雖然事後被確認抄襲的兩名作者，第一時間撤稿後，已向原作者致歉並收獲諒解，但智源研究院仍然決定重組“大模型研究中心”，涉事的相關責任人也全都主動離職。

進入2023年後，國産大模型井噴式增長，更是引來了更多的“抄襲”質疑。

曾有業內人士透露稱，現階段許多初創公司爲了追趕大模型風口，大都采用將ChatGPT集成至後台，只是對前端界面進行UI設計，就開始大肆宣傳自己在開展AIGC創業，並上架各個平台搶奪用戶關注。

然而，這類AIGC項目實則缺乏技術壁壘與商業邏輯，僅屬“追熱度的短期行爲”，核心競爭力亦無從談起。

相對成熟的做法，則是通過對開源項目的二次開發，完成基礎模型框架的搭建，再利用ChatGPT等成熟産品生成AI數據，對自家大模型進行訓練。

速度至上，俨然早已成爲許多企業和機構對待大模型研發的主導思想。通過天眼查能夠看到，ChatGPT問世一年不到，與大模型相關的企業信息已經增長至248條。

然而，在這一過程中，對開源項目的過度依賴，正在爲行業的基礎不牢帶來負面影響。

大模型研發過程中，自然語言處理、計算機視覺等較爲複雜繁瑣的環節，開源項目能夠提供豐富的算法和技術資源，有助于縮短研發周期，降低研發成本。然而，過度依賴這些開源項目，就容易導致基礎不牢的問題。

一方面，過度依賴開源項目，會使企業在核心技術領域缺乏自主研發和創新能力。

開源項目雖然有著免費、高效、易于使用等諸多優點，但它們背後的知識産權和商業競爭風險不容忽視。如果一個企業完全依賴開源項目，那麽在市場競爭中就很容易受到制衡，甚至可能因爲開源項目的更新叠代、版權問題而陷入司法糾紛。

另一方面，過度依賴開源項目會影響行業的可持續發展。

所謂的開源項目，往往是由開發者社區自發式維護。就像曾經安卓系統開發初期，雖然開發者的熱情帶來了極快的更新速度，但由于技術實力等問題的限制，開源項目的質量參差不齊。

如果大模型行業過分依賴這些項目，可能會因爲項目本身的缺陷或漏洞，導致系統不穩定、性能下降等問題。這對于大模型發展生態而言，無疑是埋下了極大的隱患。

最後，希望字節跳動早日澄清與OpenAI的誤會，也祝願國産大模型企業能夠穩紮穩打，更多湧現擁有核心研發技術力的産品吧。

免責聲明：本文基于公司法定披露內容和已公開的資料信息，展開評論，但作者不保證該信息資料的完整性、及時性。

另：股市有風險，入市需謹慎。文章不構成投資建議，投資與否須自行甄別。

娛樂新聞吧

被封殺後，字節跳動大模型，重走遊戲業務老路？

銀箭財經