OpenAI總裁發布了一張由GPT-4o創建的圖像非常令人印象深刻

探索點小小科技 2024-05-23 00:16:52
OpenAI 總裁發布了一張由 GPT-4o 創建的圖像——非常令人印象深刻

本周,OpenAI 公布了下一代 GPT-4o AI 模型。其名稱中的“o”代表 Omni,暗示它本身支持多種輸入格式——以前,多模態意味著將所有非文本格式轉換爲文本。OpenAI 總裁兼聯合創始人格雷格·布羅克曼 (Greg Brockman) 首次發布了由 GPT-4o 創建的圖像。

相同的 GPT-4o 生成的圖像。圖片來源: twitter.com/gdb

支持文本、圖像和聲音作爲輸入,這意味著模型也能夠生成它們。上圖不是照片,而是GPT-4o的創作。它描繪了一個男人穿著一件印有OpenAI標志的T恤,在白板上寫字。在頂部有一個部分擦除的銘文“模式之間的轉移”。接下來是文本:“假設我們使用單個自回歸變壓器直接對 P(文本、像素、聲音)進行建模。有什麽優點和缺點?

如果你仔細觀察,你可以看到一些迹象表明圖像是由人工智能創建的。木板以不自然的角度懸挂,下面還有一塊難以理解的方式,男人的手形狀奇怪,光線也不均勻。與此同時,人工智能生成連貫文本的長片段的能力似乎令人難以置信——即使是 DALL-E 3 也很難應對這一點。GPT-4o 圖像生成器尚未向公衆開放:到目前爲止,具有連接的下一代模型的 ChatGPT 用戶只能使用 DALL-E 3 生成圖像。但OpenAI總裁格雷格·布羅克曼(Greg Brockman)保證,該公司正在做出重大努力,以開放對下一代模型的完全訪問。

0 阅读:0

探索點小小科技

簡介:感謝大家的關注