終于有正經AI硬件了,一台能寫詩的「拍立得」

極客公園 2024-05-04 13:05:21

2016 年,由人工智能撰寫《電腦寫小說的那一天》小說成功通過了日本「星新一文學獎」的初選;Sony 開發的 DeepBach AI 在深度學習巴赫後,創作出的仿巴赫音樂,在 1600 位聽衆裏,騙過了超過一半的人,讓他們以爲這就是巴赫本人的創作。

如今,人工智能已經能生成真假難辨的視頻,極具藝術感的圖像。

人工智能正在挑戰著文學、音樂、繪畫、影視等等這些原本屬于藝術創作的領域。當藝術難以成爲人類對抗 AI 的護城河後,許多人認爲,詩歌或許是智能時代,人類最後被攻克的堡壘。

詩歌被認爲是人類文學最初的起源,在尚未有文字的人類社會,詩歌就以口語的形式流傳在文明裏。它在形式上考驗節奏和韻律,在表達上考驗想象和凝練,它需要表達者把經驗、觀察、意識結合,畢竟詩歌的創作依托于于人類特有的通感,因此我們可以讓 ChatGPT 寫一首關于月亮的詩,它只會泛泛而談,而無法和人類在當時當刻,設身處地看到獨一無二的月亮。

但是,如果 ChatGPT 有了能「看到」月亮的能力,給它思考賦予觀察呢?

基于這個想法,Kelin Carolyn Zhang 和 Ryan Mather 兩位設計師和開發者鼓搗出了一台設備:讓攝影機去「所見」,讓人工智能去「所感」,用技術的手段去實現文學裏最難以量化的表達。

這就是詩歌相機(Poetry Camera)。

相機與詩

詩歌相機內核搭載了樹莓派,一個只有信用卡大小的微型電腦,得以成像和調取 GPT-4 的 API,這就打通了設備的「眼睛」和「大腦」。

舉起詩歌相機,隨便拍下一張照片,計算機視覺算法會開始分析視覺數據,人工智能模型開始解釋圖像,識別圖像裏關鍵元素、顔色、環境、影調情緒等信息,生成詩,並且以類似超市收銀條的方式打印出來,就好像拍立得「洗」出照片一樣。

拍照出詩不出片,這可比拍立得更讓人有期待和驚奇感。不看宣傳看效果,它能生成怎樣的詩歌呢?

圖源:TechCrunch

有用戶拍下了早上自己在家裏喝咖啡時玩手機的樣子,詩歌相機的創作是:

鏡頭後面,一人調整視線,

在正方範圍裏的像素空間。

……

日光透過褪色的薄紗,

他手上,溫熱的咖啡流轉。

對話傳出,跨過虛擬的邊界,

他的倒影鏡像,在屏幕上出現。

書架上,書本傾斜,無聲的喋喋不休,

茂盛的植物,是唯一的生命。

戴著眼鏡,家成了他平靜的面糊,

在這堵牆裏,他的世界四散開來。

在 2024 年 4 月的一個清晨,

一種新的常態,悄悄地磨損。

@poetry.camera

不難看出,哪怕經過簡單翻譯,它生成的文字依然有詩歌特有的「意象感」。詩歌相機的原文更顯用詞文法上「刻意地精妙」,比如每一段都在押韻腳,比如第一段的 lens,gaze,space,place,race,第二段的 sheers,steers,frontier,appears。在用詞上也會采用詩歌用詞,比如把 morning 寫成 morn,就像中文裏把「早上」寫成「晨」一樣。

圖片來源:TechCrunch

另一演示則是對著紐約公共圖書館的天花板拍張照,它會解讀並創作出:

「天花板的影子之舞,

如同金鑲木,

用春日天空欺騙了眼睛

石碑和木梁下

伫足」

兩位開發者表示,由于詩歌相機的開源屬性,用戶其實可以根據個人喜好更改源代碼,重新編程和選擇不同的詩歌形式,不局限于現代自由詩,也可以是日本俳句或七言絕句,後續可能會給用戶不同大模型去選擇,比如從 GPT-4 換到更擅長理解文字和語義的 Claude,或者更擅長寫故事的 Dragonfly。

兩位開發者表示「只想享受科技的樂趣」|圖源:Poetry Camera

而且詩歌相機不會以任何數字方式保存,用戶既看不到相機拍到了什麽,也不能直接複制粘貼文本,如果想留存一份,只能拿起手機拍下來這一張詩條。因爲兩位開發者認爲,除了技術問題(需要服務器和雲平台)、隱私問題之外,詩歌的瞬時性給它增添了額外的意義,打印出來的「詩條」是瞬時捕捉,隨機生成,獨一無二的實體存在。

在屏幕主宰我們日常生活的當下,詩歌相機這種設計把視覺以詩意用物理的方式呈現,讓它在數字之外,增添了一絲模擬化的浪漫氣息。

你我都能做

「拍下所看到的景觀,讓相機生成詩歌」這一想法不僅富有創意,似乎看著還挺難實現的?但實際上,你我都可以做出一台詩歌相機。

詩歌相機到現在也還停留在一個「藝術項目」的階段,兩位開發者也暫未有大規模商業化的計劃。他們只是産生詩歌相機的想法,鼓搗出了一台能實現想法的硬件,他們所用到的軟硬件都是開源的,因此兩位開發者選擇在網站上把詳細的制作過程公開,鼓勵更多的用戶 DIY 自己的詩歌相機。

詩歌相機的內核是微型卡片計算機樹莓派,再附以一些常見配件,再加上樹莓派的相機模塊、一台迷你熱敏打印機、六個電池、一個按鈕就夠了。

官方把詳細的 DIY 教程發到了 GitHub|圖源:Poetry Camera GitHub

而詩歌的生成則要對接到 ChatGPT-4 的 API 密鑰,在按下快門時,會觸發腳本,把采集到的圖片發送到 GPT-4 上創建一首詩,最後在熱敏收據打印機上打印出來。

兩位開發者已經寫好了全流程腳本,只要按照他們給的詳細步驟逐步設置,不需要會編程和 3D 打印,紙殼裏也能造出一台詩歌相機。

兩位開發者的調試用機|圖源:flomerboy

如果說喬布斯所信奉的「技術和人文的十字路口」讓他造出了極具美感的數碼産品,那詩歌相機則是用一種互動形式上的創新,給予我們另一種技術和現實交互的可能,突破界限,創造新的表達形式,甚至進一步反向激發人類的觀察和想象。

這也是兩位開發者秉持的理念:技術應該融入生活,讓我們能更好地欣賞日常,而不是擠壓人類的生存空間。

聯合創始人 Kelin Carolyn Zhan 坦言道詩歌相機的意義所在「對我來說,這仍然是藝術,它是關于表達的。詩歌相機是一台塑造我們想要看到的世界的工具,這也是一個人們可以把玩新技術的世界:人工智能並不全是厄運和悲觀,也不僅僅是用更深、更快、更糟糕的方式模仿人類,而是用新技術創造全新的工具,再讓工具再次帶出人類內心的孩子。對于這個項目來說,這不是爲了賺錢——而是爲了讓那些天真的奇迹再次成爲可能。」

但在創意之外,我們又不得不産生疑惑:GPT-4 生成的詩已經模有樣,那在詩的創作上,超越人類是否只是時間問題?

人工智能寫的詩,能和人比嗎?

當我們站在賞鑒的角度再看詩歌相機的成詩,可以感受到人工智能和詩人作詩上的差異所在,人工智能寫的詩有更明顯地「描述」和「順序」,用詞上更連貫,比如「日光透過褪色的薄紗」「天花板的影子之舞,」,更像是用文雅的詞描述一個場景,其中缺少了詩歌難以描述的抽象感和意象美。

就像詩刊社在《GPT 時代,詩歌的意義和價值所在?》裏提到的,「GPT 的出現是對文本順序的改變,它省略了世界與作者的概念,中間加入的是標准化、數字算法,卻沒法模仿詩歌的意象。」

詩人夏宇所寫的現代詩|圖源:夏宇

詩人歐陽江河也曾在采訪裏說到「寫作背後的廣闊性是人的生命、人的世界觀。這些包括了生命的感動、生命的升華、生命的傷痛、生命的恐懼、生命的黑暗、生命的愛、生命的愚蠢、生命的局限性。但人工智能不可能有生命,人工智能太聰明了,它沒有疼痛,沒有生命的脆弱感和恐懼,而詩歌正是這些的産物。如果沒有這樣的來源,只剩下漂亮的句子是沒有意義的。」

詩不像圍棋或公式,詩沒有確定的答案,當我們質疑人工智能寫詩的能力,我們更多是在質疑它詩的由來。

就像在 1982 年的科幻電影《銀翼殺手》裏,人造人羅伊·巴蒂在死前留下了全片最富有詩歌氣息的台詞,這意味著人類,至少《銀翼殺手》的創作團隊相信,在共同經曆了對生命的感受之後,人工智能體也能創作出優美且富有人性的詩歌。

羅伊·巴蒂死前獨白|圖源:銀翼殺手

回到詩歌相機上,在我們了解這個設備後,並沒有感受到一種「被人工智能挑戰」的緊迫感,反而是新奇更甚,畢竟當我們觸手可及的設備能進行一種藝術的表達時,它也隨之解鎖了我們看待周遭的一種獨特的方式。

就像詩人夏宇在 2023 年與 ChatGPT 合作完成了一冊詩集《驗證您是人類》,她和 ChatGPT 探討詩、評論、語言、機器、笑話……最終她在采訪裏說道「人類至上的人類又在搞機器人,處處代入人的語法人的意圖動機人的情感……與 ChatGPT 的溝通,透過它習得的人類語言,它也學得很快,我還是希望它保留它的機械性不要輕易進入人性。」

與其去較真人工智能和人類在寫詩上還有多少差距,甚至産生精神危機感。我們更應該關注,用算法和數據餵飽的人工智能是怎樣觀察被我們忽視的周遭,它又能否激發出人類的詩性。

頭圖來源:Poetry Camera

0 阅读:17