OpenAI總裁發布了一張由GPT-4o創建的圖像非常令人印象深刻

OpenAI 總裁發布了一張由 GPT-4o 創建的圖像——非常令人印象深刻

本周，OpenAI 公布了下一代 GPT-4o AI 模型。其名稱中的“o”代表 Omni，暗示它本身支持多種輸入格式——以前，多模態意味著將所有非文本格式轉換爲文本。OpenAI 總裁兼聯合創始人格雷格·布羅克曼（Greg Brockman）首次發布了由 GPT-4o 創建的圖像。

相同的 GPT-4o 生成的圖像。圖片來源： twitter.com/gdb

支持文本、圖像和聲音作爲輸入，這意味著模型也能夠生成它們。上圖不是照片，而是GPT-4o的創作。它描繪了一個男人穿著一件印有OpenAI標志的T恤，在白板上寫字。在頂部有一個部分擦除的銘文“模式之間的轉移”。接下來是文本：“假設我們使用單個自回歸變壓器直接對 P（文本、像素、聲音）進行建模。有什麽優點和缺點？

如果你仔細觀察，你可以看到一些迹象表明圖像是由人工智能創建的。木板以不自然的角度懸挂，下面還有一塊難以理解的方式，男人的手形狀奇怪，光線也不均勻。與此同時，人工智能生成連貫文本的長片段的能力似乎令人難以置信——即使是 DALL-E 3 也很難應對這一點。GPT-4o 圖像生成器尚未向公衆開放：到目前爲止，具有連接的下一代模型的 ChatGPT 用戶只能使用 DALL-E 3 生成圖像。但OpenAI總裁格雷格·布羅克曼（Greg Brockman）保證，該公司正在做出重大努力，以開放對下一代模型的完全訪問。

娛樂新聞吧

OpenAI總裁發布了一張由GPT-4o創建的圖像非常令人印象深刻

探索點小小科技