文生圖模型又卷起來了!StableDiffusion涼涼,Midjourney流量被反超

烏鴉智能說 2024-04-01 13:40:22

今年以來,文生圖模型領域就沒消停過。

3月23日,Stability AI CEO Emad Mostaque宣布離職,這個昔日文生圖巨頭CEO的高調退場給了AI界一次小小的震撼。這並不奇怪。混亂,幾乎是Stability AI在過去一年多時間裏的縮影:管理層離職、技術團隊跑路、入不敷出、法律官司……

一年以前,Stability AI還曾是一家文生圖領域的超級明星:當Stable Diffusion推出並宣布徹底開源後,這款AI圖像生成模型在上線三個月內用戶總量達到1000萬。同一時期,DALL-E只有150萬用戶,Midjourney在200萬到300萬之間。

變化不僅發生在Stability AI,也發生在Midjourney上。今年1月,Lenardo.ai以18.71M的月訪問量首次超越持續霸榜的Midjourney,到了2月,兩者差距還在進一步拉大。這意味著,作爲文生圖領域老大的Midjourney正在面臨激烈的競爭。

Stability AI、Midjourney的變化似乎也說明一家事情:與ChatGPT穩定領跑通用型聊天産品不同,垂直AI應用的“王位易主”顯然更加容易。

/ 01 / 開源與賺錢無法兼得,Stability AI跌落神壇

AI獨角獸Stability AI的墜落並非一夕之變。早在2023年,該公司就有一批管理層和核心技術成員離開團隊。

2023年6月,Stability AI首席信息官Daniel Jeffries、工程副總裁Scott Draves和首席運營官Ren Ito都選擇了離職。7月中旬,參與了Stability AI大語言模型開發工作的Louis Castricato宣布離職加入EleutherAI。

就在Emad Mostaque離任的前一周,Midjourney就因數據盜竊把Stability AI的員工都拉入了黑名單。《福布斯》報道,亞馬遜網絡服務(AWS)因StabilityAI遲遲不支付賬單,可能會中斷服務。也有消息稱,Stability AI已經難以支付員工的工資了。

爲什麽Stability AI會陷入這樣的困境?不賺錢,是一個很現實的原因。

Stability AI年收入

現在Stability AI的收入主要分爲兩大板塊,一個是to B的AI模型定制化服務和AI技術咨詢,一個是to C的Stable Diffusion産品的會員制付費訂閱。

從數據看,Stability AI的收入一直呈增長趨勢,由2021年的210萬美元到2022年420萬美元,2023年甚至達到了4420萬。

但這樣的收入並不足以支撐Stability AI龐大的研發投入。據彭博社報道,截止2023年10月,StabilityAI每月支出在800萬美元,也就是說,Stability AI2023年全年的支出在9600萬美元左右,將近全年收入4420萬的兩倍。

即使對比同行,Stability AI的商業化業績也不夠理想。憑借會員訂閱制的文生圖模型Midjourney在2023年年度收入預估在3億美元,大約是StablityAI的6倍。這與兩者的用戶規模形成了鮮明的對比。截至2023年11月,Midjourney已經擁有超過1640萬活躍用戶,而Stable Diffusion 在所有渠道的日活躍用戶大約在1000萬。

Stability AI商業化困難的原因主要有三點:

一是開源路線導致商業化路徑不清晰。Stable Diffusion主打開源,用戶可以自己基于開源代碼搭建服務,未必非要依賴Stability AI,這也使公司鎖定客戶、自主定價變得艱難。相比之下,Midjourney這樣的閉源AI圖像生成産品有著簡單清晰的商業化思路,用戶花錢生成圖片。

二是使用門檻更高。使用Stable Diffusion,需要編程知識和4GB獨立顯卡,技術門檻更高,對小白很不友好。作爲對比,Midjourney上手就很簡單了,只需要注冊Discord賬號,簡單操作就可以得到精美高質量的圖片,這可能也是大部分用戶不惜花60美元支付費用的原因。

三是商業化節點滯後。比起Midjourney從一開始就主打會員付費制,Stable Diffusion的商業化的道路姗姗來遲。在Mostaque的構想裏,開源模型的商業模式就是面向企業提供解決方案,即類似紅帽和MongoDB,在開源版本免費的同時,通過定制化商業版本盈利。但顯然,Mostaque低估了這一商業化路線的難度。

在自身商業化遲遲打不開局面的情況下,越來越多的巨頭開始湧入文生圖模型。比如,Meta推出了mu Edit和Video,谷歌旗下Imagen也自帶了安卓系統3億的潛在客戶。亞馬遜的圖像生成模型——Titan Image Generator已經可供 Bedrock 上的AWS客戶使用。

內憂外患之下,Stability AI的CEO和員工集體跑路就都不難理解了。

/ 02 / 行業老大換人了!Midjourney流量被Leonardo.ai趕超

那邊是曾經的扛把子倒了,這邊現在行業老大Midjourney的流量也被Leonardo.ai反超了。

今年1月,一款主打 AI圖片合成的Leonardo.ai網站流量以18.71M的月訪問量首次超越了霸榜第一的Midjourney,並在之後一直呈趕超趨勢。

從平均訪問停留時間來看,Leonardo ai也以12min的平均用時超越了Midhourney的10min,Leonardo ai在三個月內的用戶粘性更強。

就2024年2月網站流量的各指標對比看,Leonardo ai的月訪問量和獨立訪客的平均訪問次數均已超過Midjourney。

有趣的是,Leonardo AI的底層模型就是用Stable Diffusion微調的。不過與Stable Diffusion需要Python基礎和獨立顯卡不同,Leonardo. ai在網頁端就可以免費使用。

與Midjourney相比,Leonardo. ai的優勢主要體現在性價比。

現在Midjourney基礎版需要10美元一月,每月僅生成 200 張圖像。而Leonardo. ai的免費版每月可以生成4,500 張圖像(每天150張)。此外,Leonardo. ai還提供每月10美元的年度計劃,用戶每月最多可以生成 8500 張圖像。這樣的定價顯然對對小白和學生黨更加友好,所以有很多博主將其稱爲“Midjourney平替”。

從産品能力上說,Leonardo. ai與Midjourney各有側重,但前者支持用戶自定義模型,讓其繪畫風格上有了更多的延展性。

具體來說,Leonardo ai偏向寫實,Midjourney生成圖像更加夢幻、抽象,只能輸入文字版prompt,偏向藝術。

從對輸入指令的還原度講,Leonardo. ai能夠根據內容生成還原度較高的圖片,更加逼真寫實,就像是日常拍出的照片。但是,Midjourney更加藝術、偏向油畫質地。

對于更喜歡寫實風格的受衆,Leonardo. ai是一個更好的選擇,也就是說,Leonardo ai的應用場景更加廣泛,可以應用于商務、藝術、遊戲、寫實。而Midjourney更偏向于藝術路線,生成圖像更加夢幻、色彩更豐富、質地更細膩。

比如,下圖中的兩位老太太,Midjourney生成圖像偏向抽象類油畫類藝術創作,Leonardo生成的圖像在自然光線下更加真實。

除了藝術、商務、寫實等更加廣泛的應用場景,Leonardo. ai還支持用戶自定義自己的數據和訓練模型,同時有繪畫、素描、插圖等不同的成圖風格供用戶選擇。在生成圖像的過程中,用戶可使用參數和選項調整圖像,塑造風格、情緒等,也能根據需要調整分辨率、格式和質量。此外,用戶還可以將自定義的模型分享給其他用戶。

而Midjourney目前僅支持用戶輸入指令,無法調整參數、分辨率、格式等。這就極大限制了 Midjourney出圖的穩定性。對很多用戶來說,Midjourney出圖的質量盡管很高,但是隨機性太強,有時候符合自己的需求,有時候不符合,就像抽盲盒一樣。

性價比又高,又能能自定義模型,“Midjourney平替”取代Midjourney自然也合情合理。

/ 03 / 行業座次變化背後,是用戶需求的精細化

自生成式AI故事興起以來,競爭一直是這個行業繞不開的話題。

但少有人注意到,不同于Chat GPT等通用AI助手已經形成的穩固格局,自2022年3月Midjourney發布開啓AI作圖以來,短短兩年時間內,文生圖模型垂直賽道就已經發生了巨變:

2022年8月,Stable Diffusion以三個月用戶量增長1000萬稱霸市場;到後來,Midjourney通過産品叠代,在相當長時間內流量高居行業第一;到現在,Stable Diffusion隕落、Midjourney流量被Leonardo. ai反超。

換句話說,在非通用細分AI賽道裏,AI産品的競爭更加激烈、趨于白熱化。與通用型AI個人助理不同,文生圖模型賽道用戶更強調地並非體驗性、趣味性和新鮮感。從長遠看,用戶使用模型的工具導向更強,更加強調操作簡易性和出圖質量。簡而言之,模型生成的圖像是否符合輸入指令,質量高不高,上手快不快。

一年前,Midjourney因更低的技術門檻、更細膩的圖像質量打敗開源模型Stable Diffusion,贏得了更加廣闊的用戶市場。而現在,橫空出世的Leonardo則憑借“模型定制化”與更細微的參數調整與Midjourney打成平手。而且,Leonardo. ai獨立訪客的平均訪問次數和平均訪問停留時間都超越了Midjourney,這意味著Leonardo. ai的用戶留存能力更高,用戶粘性更強。‍

在文生圖領域産品競爭、叠代的背後,我們看到的是,愈發精細化、差異化的用戶需求。從模型生成到成圖質量到精細化的定制需求,人們不再滿足于對AIGC熱潮和技術光環的追捧,更加強調性能和使用體驗。這也符合在2024年AI賽道更加細分、從模型建設湧入C端應用開發的總體趨勢。

在未來,誰能勝出,誰會淘汰,都不再是棋盤上的既定數。與時俱進,從用戶角度不斷優化性能打造精細化、差異化的産品體驗才是AI公司最後的護城河。

0 阅读:0

烏鴉智能說

簡介:人工智能新時代的商業智庫和價值燈塔