90後二次元北大校友做出AI漫畫創作工具,融資千萬

創業邦 2024-04-22 18:20:13

作者丨博雯

編輯丨海腰

題圖丨Midjourney

AI繪畫已經火了兩年,但仍有一群人並不滿意。

對于他們,僅僅是一張極盡精致的圖片還不夠,他們希望爲畫中的人物賦予更完善的性格、好惡、身世、人際關系、世界觀,讓Ta有血有肉,仿佛真實存在。

“這就是爲什麽我們的産品叫做‘AI驅動的角色幻想創作平台’,而非AI繪畫這種描述。”胡修涵說。

90後的胡修涵在2022年12月,AI繪畫正引發大規模討論,ChatGPT剛剛發布的時候創立了“看見概念”團隊,近期剛剛完成天使輪和Pre-A輪融資,總額超千萬元,投資方包括源碼資本和奇績創壇等。

他們的産品“捏Ta”則在今年4月剛剛上線,分爲微信小程序和APP兩種體驗渠道。

今天淩晨,他們還推出了自研的開源二次元大模型,捏Ta藝術大模型(Neta Art XL)。

圖示:Neta Art XL模型生成效果展示

作爲真·老二次元,胡修涵對同人創作生態了如指掌,他提出,不管是基于已有IP的二次創作,還是自己原創故事和角色,本身都是愛好者們內心創作欲的一種體現。

只是産出二創的人畢竟還是少數,大多數人的創作能力(尤其是在圖像上)是不足的。

這時,就需要一種工具來填充這種創作能力上的不足。

近千個可選標簽,創作故事而非單張圖片

相比創作單張圖像,捏Ta的“創作角色故事”的能力直觀體現在兩個方面。

第一,平台征集了大量已經成熟的IP形象,遊戲如原神、明日方舟、重返未來1999,動畫如咒術回戰、排球少年、Fate系列等等,共計近500個已有形象。

基于這些形象,用戶可以輕松進行改變服飾、表情、動作,更換場景等方面的二次創作。

可供選擇的圖像風格共有近百個,如具體的藝術家風格、厚塗、賽璐璐、像素小人等等。

而涉及到具體細節,如人物形象的表情動作和服飾、畫面的光照和鏡頭、場景特點等等,共有近千個可選擇的標簽。

除了最經典的文字prompt之外,捏Ta也提供了“圖片捏”,即可以上傳手機相冊裏已有的圖片,或此前生成的圖片進行二次創作。

同時,“CP圖”則需要分別描述兩個角色,再套用平台提供的CP模版(如證件照、下腰抱、親親等),就能直接看自家CP結婚。

在圖片完成後,平台也有添加字幕、台詞、圖像拼接的功能,可以直接制作漫畫,講述故事。

一般情況下,生成圖像的時間約爲10-30秒。

第二個特點則是捏Ta的核心功能,“奇旅”。

平台提供了一種類似橙光遊戲的玩法,當前有校園、異世界、娛樂圈等幾個故事模版,用戶可以帶著已有IP角色或自己的原創角色進入這種故事裏,面臨不同需要做出選擇的場景。

遇到這些場景時,用戶就需要根據自己的選擇,輸入prompt,創作出相應的場景。

這個功能對于普通人來說或許有些費解,但在養OC(Original Character,原創角色)的同人創作者來看卻剛剛好。

養OC其實就是完善原創角色設定,並且是除了外表服飾性格喜好之外,更具體,更深入地構建這個角色的童年、人際交往圈、性格缺陷、魅力來源、生長世界觀等等。最終或是拓展成一個完整的小說或漫畫故事,亦或用于在網絡社群裏與其他養OC人進行社交。

要完善原創角色設定,創作者們常用的一個做法,就是將角色放入一個場景,想象Ta在面臨某個具體的劇情時,會做什麽樣的選擇。

在此之前,OC養到後期要麽自己動手,創作圖像或小說,要麽就需要在圈內花錢找人約文、約稿、約角色曲。

但現在,基于捏Ta平台就可以做到。正如“奇旅”玩法開展之時頁面上的那句“探索角色的更多面”。

目前社區的産出有六到七成爲有字幕和多幅圖像的類漫畫作品。胡修涵也透露,他們的平台現在有近50萬用戶,其中女生占七成,也大都比較年輕。

“她們的一個共同標簽就是很多都寫過小說,或者說搞過同人創作。她們內心其實有一個很強烈的心理,就是把自己內心的想法做一個更圖像化的表達,讓更多人看到,這樣才能建立起內心的正反饋。”他說。

不過,當前捏Ta平台並沒有明顯的付費點,在生成圖像時所消耗的“電量”類似遊戲中的“體力值”,可以隨著時間慢慢恢複,也可以通過社區點贊分享等行爲獲取。

在“電量值”上是否會做類似遊戲的“月卡買體力”玩法,胡修涵不置可否。不過他分享了當前平台已有的兩種方式。

第一,得益于國內繁榮的周邊物流供應鏈,捏Ta也提供一個把用戶的原創角色定制成亞克力吊牌或吧唧(二次元宅圈的周邊徽章)等周邊道具的渠道。

第二,從長遠來看,用戶捏的角色也有可能成爲自身就具有內容價值的産品,可以向第三方出租或售賣。

“就像是openai的GPT商店,開發者可以把自己定制的GPT挂出來給其他用戶使用,從中收取傭金。但現在GPTs沒有跑通,可能意味著只有prompt的價值不高,或者至少建立不起某種經濟循環。所以核心的點在于售賣的資産本身。”胡修涵說。

15人團隊創立兩年,全網曝光2.5億

剛過30歲的胡修涵,在2014年畢業于北京大學,獲得了智能科學和經濟學雙學位,並在此後的美國哥倫比亞大學取得了碩士學位。

他最早進入了Meta的視頻戰略組,擔任一個30人左右團隊的技術主管,主要負責Facebook、WhatsApp、Instagram三個平台的視頻相關全套技術方案。

也就是在做短視頻、短劇類內容、新聞、遊戲直播時,負責內容管理、視頻中插廣告的系統對接、版權數據分析等工作。

在那時,他遇到了現在“看見概念”團隊的合夥人兼CPO宋禹君,清華大學本科,碩士則畢業于卡內基梅隆大學的人機交互專業。

胡修涵表示,由于最初做的都是內容方面的工作,在Meta時能以7%占比的頭部內容獲取平台90%的觀看量,因此他們對于不同市場、不同內容類型的需求變化較爲敏感。

2018年,胡修涵回國進入阿裏巴巴,帶領團隊先後參與了2019雙十一大規模數據可視化的高性能渲染工作。

2020年,他又進入了一家上海的B輪獨角獸特贊,擔任技術VP,從零搭建了這家公司的內容資産管理産品線。

當特贊的新産品線收入從十幾萬上漲到上億級,時間來到了2022年12月份。

在這時,Stable Diffusion已經發布有4個月,它的開源是AI繪畫爆火的直接原因,也正是基于SD其開發的無數圖像生成模型將這一話題不斷發酵,一齊將AI繪畫推向了輿論熱潮的高峰。

而顛覆AI圈的ChatGPT也在11月30日剛剛推出。

這些都讓胡修涵覺得,C端的內容生態創作端或許會因此而發生大的變革。

于是當月,胡修涵出走創業,正式創立了“看見概念”公司,他瞄准了二次元社區。

2023年一年,團隊主要基于SD框架進行技術研發,但原模型風格不夠二次元審美,風格上也比較難符合多樣化的鏡頭。而部分風格優良的模型則人物肢體穩定性欠佳。

因此,在生成人物的表情、動作、鏡頭、風格表達多樣性,風格易調用性,以及多人畫面的穩定性等方面,團隊進行了大量的研發。

2024年4月,團隊正式上線了“捏Ta”微信小程序。

這個名字來源于日語“梗”(Neta)的讀音,在ACG圈中常被用作玩梗、致敬使用。在同人二創圈裏,又和“養OC”“養娃”“捏角色”等概念相似。

捏Ta的社交媒體曝光量已達到約2.5億次,位列視頻號動漫遊戲日榜前十,日均用戶使用時長可達40分鍾。

令胡修涵印象最深的,是一名用戶在200天內,用AI工具生成了500多個原創角色。

剛剛推出的Neta Art XL模型,則覆蓋了超過1.3萬個角色,近千個不同風格的藝術家,在部分二次元專屬名詞的識別和生成上,也進行了優化。

目前,整個“看見概念”團隊共有15人,其中大部分都是産品研發。

團隊的核心技術成員來自Meta、字節跳動、B站、小馬智行(Pony.ai)等企業,也曾深度參與二次元開源模型AIDXL以及視頻生成模型開源項目AnimateDiff的開發。

面向群體:“當年在辦公室摸魚寫網文”的人

事實上,AI繪畫應用産品在國內早已有過一波井噴期。

2021年年初,OpenAI推出了裏程碑式的DALL·E模型和CLIP框架,前者被稱爲2021年第一個令人興奮的AI技術突破,後者則是一種能將文本與圖像聯系起來的特殊的”圖像識別“。

自此之後,AI繪畫就開始飛速發展。直到2022年8月,Stable Diffusion開源,短時間內産生了一大批低門檻的AI繪畫工具。

捏Ta爲什麽出現在現在?它與已有的AI繪畫式工具又有哪些不同?

胡修涵認爲,當圖像生成領域開始出現技術革新,産品慢慢湧現時,一開始或許會比較傾向于引入成熟的工作流程中,去快速解決已有的問題,並快速獲取一個正面反饋。

而一開始跟進新技術的人,大多也是對技術敏感,對AI本身感興趣的人。這個群體會傾向于更專業的工具,也會自然希望把工具盡快集成自己的生産流程。

就像是遊戲影視行業的部分公司,他們引入AI繪畫搭建了新的工作流程,達成了更高效或者更便宜的效果,這時候新技術就被內部消化掉了,也就沒有什麽産品流出來。

AI繪畫生成的遊戲道具圖

但捏Ta並非是一個創作力工具被應用于工作能效,它本身就是基于具體的創作目的設計的,是一個泛娛樂化産品。

與那些喜歡嘗鮮的AI愛好者不同,胡修涵提到,他們的用戶群體是泛C端,也就是“當年做卡點音樂視頻,在辦公室摸魚寫網文的一群人”。

這個群體是爲了好玩,爲了自我表達而創作,而不是爲了解決某個工作問題,爲了越做越快越做越好。

在胡修涵看來,他們帶來的通常是一種長期的內容創作,或許短期內看似無法産生直接變現,但長期則會形成一種有價值的消費社區生態。

“所以專業的用戶其實是不屑于用我們這類工具的,因爲我們有意識地把複雜度全藏起來了。但我覺得一個大衆性的好的産品,他針對的肯定不是先鋒用戶。就像我們的用戶,他們不是被AI打動的,而是因爲對二次元的興趣才來玩我們的産品的。”胡修涵說。

因此,在多次采訪中,胡修涵都強調,他們希望捏Ta能成爲一個創作平台,有足夠多的內容創作者在産出,也能形成社區進行交流。

當然,現在幾乎所有的內容創作平台都面臨著一個長期的困境:內容産出不夠怎麽辦?在胡修涵看來,最好的方法就是讓越來越多的人都能參與創作

而到更遠的時候,基于更加成熟的生成技術,以及更大更優質的用戶,社區中誕生的原創優質角色和圍繞其展開的故事越來越多,其中最頭部的可能就會成爲新一代的大熱偶像IP。

AI繪畫:拼湊、融合、還是未來?

不過,對于同人二創圈,AI的參與一直是一件相當微妙的事。

對于很多創作者來說,圖像是自我表達的一種方式,而由冰冷機器生成的圖像難免欠缺靈魂,甚至有“AI繪畫是拼湊屍塊”的言論。

作爲技術開發者,胡修涵先解釋了AI繪畫的大致流程:多層神經網絡模型會學習圖像和與圖像對應的一系列文本描述,然後將圖片中的內容翻譯成一個“高維文本向量”,也就是“理解圖像”。

當這種翻譯足夠合理,理解足夠深刻時,模型就能反過來,將一系列的文本描述變回相應的畫面。

所以,AI繪畫並非是很多人想象的像素重組或元素拼接,而是在概念上做了一個融合創新。

“我會覺得AI繪畫很像是去追哈利波特世界裏的金色飛賊。在使用內容創作模型時,你實際上就是要用盡可能多的文字限制,把你最想要的那個鏡頭畫面逼到一個角落。”胡修涵說。

而對于這種論調帶來的對整個AI繪畫的消極甚至反對態度,胡修涵也十分冷靜。

作爲老二次元,胡修涵非常肯定,整個泛二次元群體中有大量“沉默的大多數”,他們對于AI繪畫的抵觸心理不強,對于畫師和繪圈也沒有那麽高的忠誠度——沒有足夠的繪畫技巧、沒有時間精力,或者沒有金錢去約稿,所以無法開始自我創作和表達,這才是這群人的核心需求。

並且,在胡修涵看來,跳出這個群體,AI繪畫也是一種無法阻擋的趨勢。

他提到,今年兩會上,央視就用AI生成了一系列海報,這就代表了一種非常具有傾向性的鼓勵和引導。

此外,他們的平台在沒有投流推廣下實現了2.5億次以上的流量曝光,這也說明總有人喜歡這些內容。而隨著技術的不斷叠代,人們的思想也不不斷改變,未來參與進來的人或許會有更多。

至于AI繪畫帶來的版權問題,胡修涵認爲,某個內容創作需要人的勞動成本,這是一個前AI時代的經濟理論邏輯。

隨著AI的發展,單個內容的生産和傳播成本發生了極大的改變,這時候就需要重新考慮相關問題。

比如,對于AI繪畫的定義,未來可能會發展到需要畫師的“開光”。

“畫師可以認證那些AI生成的東西,說這幾張圖掌握了我的精髓,那可能這些圖的收益就要分他一部分;沒有經過認證或授權的AI圖像的價值就極低……總之,未來應該會有一套新的版權價值體系。”胡修涵說。

0 阅读:0

創業邦

簡介:關注創新經濟及其推動者。