國産AI來炸場了,媲美Sora的阿裏EMO全量免費上線

電商報 2024-04-27 22:24:54

一張照片就能唱歌,阿裏EMO免費上線

萬萬沒想到,國産AI技術的更新叠代真的是太快了。

在ChatGPT的余晖尚未消散之際,OpenAI攜Sora橫空出世。憑借精准捕捉指令、細膩構建場景、逼真演繹動態的卓越能力,Sora被部分業內人士稱其 “人工智能領域的一次突破”。逼真的畫面令人很難區分它們是由實拍而得,還是由AI生成。

讓人驚訝的是,不少人還在被Sora的視頻生成能力征服,而國産大模型已經悄悄帶來新的變化。

早在今年2月份,阿裏巴巴發布了一款全新的生成式AI模型EMO,並且公布了技術論文。

EMO生成視頻案例

具體來說,EMO不僅能夠生成唱歌和說話的視頻,還能在保持角色身份穩定性的同時,根據輸入音頻的長度生成不同時長的視頻。

而EMO的視頻效果,真的讓人一愣一愣的。

比如我們上傳一張伏地魔的照片,EMO便能制作出他正在唱歌的真實視頻,而且形象逼真。仔細觀察EMO産出的視頻,可以發現人物的口型與背景音樂的同步性極佳,表情變化也十分豐富,使得角色仿佛賦予了生命,整體效果令人印象深刻。

這樣的效果自然引發了很多海外用戶、科技巨頭的驚歎,大家震驚于EMO的技術實力直逼Sora,EMO也隨之成爲繼Sora之後最受關注的AI模型之一。

很多網友紛紛感歎:“我們正在走進一個新的現實!”

EMO掀起用戶討論熱潮

隨著EMO模型在技術圈的火爆,爲了讓所有人都能體驗到EMO的強大功能,阿裏通義實驗室,決定將其全面開放給所有人:4月25日,EMO上線通義APP,阿裏通義實驗室將其免費集成至通義APP的“全民舞台”頻道,所有用戶均可免費使用。

在我們實際體驗之後發現,這個國産AI工具比論文中的使用步驟還簡單。從一張安靜的圖片,到一個活生生、會唱歌、會講段子的“人“,只需要十幾分鍾的時間。

毫無疑問,EMO的誕生以及媲美Sora的技術能力,標志著中國AI大模型持續走在行業前列,正在與國際巨頭並駕齊驅。

國産AI進化速度快的嚇人

實際上,在Sora模型推出之後,曾有人擔憂國産AI無法跟上步伐。有很多人認爲:國産AI與Sora之間的差距越來越大。

我們必須承認,國産AI與美國大模型之間的差距的確存在,而明確差距的下一步,就是加速追趕。

目前來看,國産AI在語言模型、視頻生成模型、視覺理解模型等很多領域都在加速追趕,像EMO就在音頻生成視頻的領域做到了業界首創。

幾個月之前,國産AI也做過類似的視頻生成工作。當時,整體生成的視頻時間比較短,基本在10秒以內,並且視頻中經常出現錯誤,不連貫,視頻生成的速度也很慢。

可是萬萬沒想到,幾個月之後,當前的國産大模型就已經實現分鍾級別的audio2video生成,並且視頻的形象逼真,人物的表情變化也十分豐富。

同樣以阿裏EMO模型爲例:

從今年2月份放開技術論文到現在,僅僅過去不到2個月的時間,EMO就實現了低門檻使用、全量免費上線等創新體驗。

我們實際體驗發現,生成一段伏地魔唱歌的視頻,只需要等待10分鍾左右,即可完成。

令人驚豔的技術叠代速度,才是國産AI的真正實力所在。有外媒評論,talking head技術雖然才出現兩三年,但EMO一下子讓以前的技術方案變成了“老古董”。

具體來說,EMO是一種富有表現力的音頻驅動的肖像視頻生成框架,可以根據輸入視頻的長度生成任何持續時間的視頻。區別于Sora的文生視頻技術,這種音頻驅動的肖像視頻框架,無需建模就可驅動肖像開口說話,不僅降低了視頻生成成本,還大幅提升了視頻生成質量。

毫不誇張地說,我國視頻生成技術正在步入嶄新的2.0時代,加速縮小與國際先進水平的差距。

見證曆史,見證國産AI的奇迹

不難看出,國産AI大模型與行業先進技術並駕齊驅。以EMO模型和通義APP爲代表的國産AI,在AI行業的激烈爭奪中,持續突破技術壁壘。

而目前國內互聯網巨頭的大部分大模型都達到或者超過了GPT3.5的能力,全世界也只有中國有這個能力。

諸多行業相關數據也在證實,中國已經成爲AI成果和AI專利方面的全球領導者。

來自斯坦福大學人工智能研究院AI Index報告顯示,在AI專利方面,中國處于領先位置。2022年,中國以61.1%的比例領跑全球AI專利來源地,遠超美國(20.9%)。對比2010年,當時美國在AI專利方面的占比高達54.1%。

國家工業信息安全發展研究中心和工信部電子知識産權中心聯合發布的《新一代人工智能專利技術分析報告》同樣顯示,我國成爲全球AI技術創新重要競爭者。

與此同時,國産AI的爆發,也在持續點燃普通用戶的參與熱情。

數據顯示,視頻生成模型EMO剛剛上線僅一天的時間,就吸引了400多萬用戶前來使用體驗,其應用全量開放的瞬間,通義APP甚至一度被擠爆,需要排隊數小時。

圖源:通義千問APP

除了EMO模型的驚豔之外,越來越多的AI創新應用,也在一步步走到我們身邊。

前段時間,一款名爲“全民舞王”的現象級應用在社交平台上引發熱議,用戶們紛紛利用該應用讓兵馬俑跳出科目三的舞步,創意玩法層出不窮,熱度持續飙升。除此之外,通義APP也陸續推出了超長文檔解析、AI編碼助手、AI會議助手等一系列免費且實用的功能,讓人工智能真正融入日常生活,提升效率,豐富娛樂體驗。

從某種意義上來說,國産AI帶來的新一輪工業革命已經開始了。

而作爲普通人的我們,正共同見證國産AI行業的蓬勃發展,每一個人都在親曆這一曆史性的技術變革,共享國産AI創造的奇迹。

作者 | 老電團隊

2 阅读:702
评论列表
  • 2024-04-28 13:01

    底層不是調用別人的接口吧

  • 2024-04-28 08:14

    這種除了給詐騙人員破解人臉識別以外,還有什麽別的用處呢?🧐

  • 2024-04-28 11:34

    國內AI發展迅速,全靠國外開源

  • 2024-04-28 19:01

    這個只是動動嘴而已,sora走在另外一條更高端的路線上,自媒體的文盲啥都不懂

  • 2024-04-28 22:27

    Talking head,東哥直播不就是這技術,國內小公司都有這種産品,跟sora沒得比

  • 2024-04-28 08:36

    這種除了給詐騙人員破解人臉識別以外,還有什麽別的用處呢?🧐

  • 2024-04-28 09:00

    底層不是調用別人的接口吧

  • 2024-04-28 09:22

    元器件,會全部焊接在PCB上最後組裝到

  • 2024-04-28 03:37

    國內AI發展迅速,全靠國外開源

電商報

簡介:電商行業信息服務平台