谷歌搜索引擎問世25年最大更新之一，“AIOverviews”體驗正式上線｜懂點AI

掌握AIGC脈動，把握科技脈搏。動點科技每天收集彙總全球AIGC進展與熱點，每天5分鍾帶您了解AIGC，希望與您共同玩轉 AIGC，解碼行業發展新風向，開啓智慧新時代！

文｜動點科技排版｜高竹本文預計閱讀時長5分鍾

文生圖技能再進化，谷歌推出 Imagen 3：更准確、更具創造性谷歌公司在今天召開的 I / O 2024 開發者大會上，宣布推出了 Imagen 3，進一步增強了文本生成圖片的技術能力。與前代産品 Imagen 2 相比，Imagen 3 能更准確地理解文字提示，並將其轉化爲圖像，而且其生成的圖像更具“創造性和細節”，且模型産生的幹擾元素和錯誤也更少。爲了打消人們對 Deepfake 可能性的擔憂，谷歌表示，Imagen 3 將使用 DeepMind 開發的 SynthID 方法，在媒體上應用隱形加密水印。用戶可以在谷歌的 ImageFX 工具中可以注冊 Imagen 3 的私人預覽版，谷歌表示，該模型將很快提供給使用谷歌企業生成式人工智能開發平台 Vertex AI 的開發人員和企業客戶。

谷歌搜索引擎問世 25 年最大更新之一，“AI Overviews”體驗正式上線谷歌公司在今天召開的 2024 年 I / O 開發者大會上，正式推出了“AI Overviews”搜索體驗，將于本周開始向美國地區開放，後續會推廣到更多國家和地區。該功能此前稱之爲Search Generative Experiences，主要是讓用戶通過提問、聊天的方式進行 AI 搜索。在美國地區，谷歌主要通過和 Reddit 社區合作，解答用戶的提問。谷歌表示，它將爲美國用戶的在線查詢提供人工智能生成的答案，這是其搜索引擎 25 年來最大的更新之一。

劍指 Sora，谷歌推出 Veo 文生視頻模型：時長超 1 分鍾、最高 1080P，支持電影手法OpenAI 三個月前推出文本轉視頻 Sora，引發了網友、媒體以及圈內人士的廣泛討論。谷歌在今天召開的 2024 I / O 開發者大會上，也推出了對標産品-- Veo，可以生成長度超過 1 分鍾，分辨率最高 1080P 的“高質量”視頻，並具有多種視覺和電影風格。根據谷歌官方新聞稿，Veo 具備對自然語言有先進的理解能力，能夠理解“延時攝影”、“航拍風景”等電影術語。用戶可以使用文本、圖像或視頻提示來指導他們所需的輸出，谷歌表示，這樣産生的視頻“更加連貫一致”，在整個鏡頭中人物、動物和物體的動作也更加逼真。

對轟 GPT-4o，谷歌推出 Astra 項目：手機鏡頭內低延遲聊天交互谷歌公司在今天召開的 2024 年 I / O 開發者大會上，推出了全新的 Project Astra 項目，基于 Gemini，可以本地運行在 Pixel 手機上，可以說是對標 OpenAI GPT-4o 的最新模型。谷歌表示 Project Astra 是最新的多模態 AI 項目，用戶打開攝像頭，該多模態項目可以直接解釋用戶畫面中物品。

字節跳動正式發布“豆包大模型”家族，含通用模型、角色扮演模型、聲音複刻模型、語音識別模型、文生圖模型等今天上午，字節跳動在 2024 春季火山引擎 Force 原動力大會上正式宣布自家豆包大模型正式開啓對外服務。據介紹，豆包大模型包含豆包通用模型 Pro、豆包通用模型 liti、豆包・角色扮演模型、豆包・語音合成模型、豆包・聲音複刻模型、豆包・語音識別模型、豆包・文生圖模型、豆包・Function Call 模型。除發布字節跳動自研大模型外，字節跳動還宣布火山引擎大模型服務平台——火山方舟也將迎來重大升級。

谷歌預告安卓新功能：AI 檢測詐騙電話谷歌公司在今天召開的 I / O 2024 開發者大會上，宣布爲安卓系統引入 AI 詐騙電話檢測功能，在通話中提醒可能存在的詐騙行爲，並鼓勵用戶結束此類通話。谷歌表示該功能基于本地運行的 Gemini Nano 模型，在通話中匹配查找欺詐性語言和其他通常與詐騙有關的對話模式，如果遇到疑似詐騙的電話，就會發出警報提醒用戶。安全方面，谷歌表示，這些新的保護措施完全是在設備上實施的，因此 Gemini Nano 監控的對話將保持私密性。

谷歌 Workspace 辦公套件整合 Gemini：可總結郵件內容、梳理會議要點等谷歌公司在今天召開的 I / O 2024 開發者大會上，宣布 Google Workspace 將進一步整合 Gemini，在側面板中將推出基于 Gemini 1.5 Pro 的諸多技能。谷歌表示 Workspace 整合 Gemini 的作用，是爲用戶節省從多個應用程序中挖掘文件、電子郵件和其他數據的時間和精力。谷歌 Workspace 的 Gmail、Docs、Sheet、Slides 和 Drive 將率先推出 Gemini 側面板，可以不在離開應用的情況下，組織、理解應用中的數據，可以總結郵件內容、摘要會議記錄等等。

谷歌 Gmail 深度整合 Gemini：彙總郵件內容、生成更好回複谷歌在今天召開的 I / O 2024 開發者大會上，宣布將于下月邀請 Workspace 和 Google One AI Premium 用戶，體驗新版 Gmail，可以讓 Gemini 總結電子郵件內容。谷歌表示用戶可以在移動應用和網頁版 Gmail 中使用 Gemini，針對當前電子郵件內容提問，或者讓 Gemini 根據電子郵件的上下文撰寫回複。谷歌目前已經在 Gmail 中引入了 Smart Reply 功能，不過新版中升級帶來了“Contextual Smart Reply”，可以基于上下文帶來更細致、更優秀的回複。谷歌表示還將會爲 Gmail 應用帶來全新的 Gemini 按鈕，用戶點擊之後會看到“總結這封郵件”或“建議回複”等建議，用戶還可以輸入提示來詢問有關電子郵件的問題。

谷歌 Gemini 解鎖旅行規劃技能，幾秒內幫你妥當安排行程

谷歌公司在今天召開的 I / O 2024 開發者大會上，宣布爲 Gemini 引入旅行規劃功能，結合個人信息和公共出行信息，幫用戶規劃預訂航班、酒店等等。谷歌表示 Gemini 可以基于用戶的提示，挖掘航班時間和酒店預訂等具體細節，在幾秒鍾內制定出合適的度假行程。Gemini 會根據用戶電子郵件中包含的航班和酒店詳細信息制定行程。該模式還將利用谷歌地圖查找附近的餐館和文化景點，並根據特定提示（如飲食限制或應避免的事項）過濾出各種選擇。谷歌表示，新的旅行計劃功能將在未來幾個月內登陸 Gemini Advanced。

iOS 版 ChatGPT 更新支持 App 首選語言設置中文iOS 版本 ChatGPT 今日淩晨發布 1.2024.129 版本更新，新增支持 App 首選語言設置中文，此前爲其他語言。首次啓動 iOS 版 ChatGPT 會出現中文展示頁，App 內支持應用語言設置，點擊後將跳轉至系統設置中 ChatGPT 應用設置，再次點擊首選語言，即可設置軟件語言。

百度發布全球首個 L4 級自動駕駛大模型 Apollo ADFM，稱比人類駕駛更安全

百度 Apollo 今天在武漢百度蘿蔔快跑汽車機器人智行谷舉辦 Apollo Day 2024，發布了全球首個支持 L4 級自動駕駛的大模型 Apollo ADFM（Autonomous Driving Foundation Model）。百度稱，Apollo ADFM 基于大模型技術重構自動駕駛，可以兼顧技術的安全性和泛化性，做到安全性高于人類駕駛員 10 倍以上，實現城市級全域複雜場景覆蓋。依靠自動駕駛大模型的應用實踐️，百度蘿蔔快跑已經攻克了武漢的複雜道路場景，實現了武漢城市全域、全時空場景覆蓋。同時在 L2 + 智能駕駛領域，目前國內唯一的純視覺城市領航輔助駕駛産品 ANP3 也將全面應用自動駕駛大模型 Apollo ADFM，升級爲 ASD（Apollo Self-Driving），即將在極越全系車型量産首發，率先實現“智駕全國都能開、有百度地圖的地方都能開”。

本文爲動點科技整理，未經授權不得轉載，如需轉載或開白請在後台回複“轉載”。

- - - - - - - - END - - - - - - - -

*想要獲取行業資訊、和志同道合的科技愛好者們分享心得，那就趕快掃碼添加“動點君”加入群聊吧！群裏更有不定期福利發放！

精彩好文值得推薦！

一鍵轉發，戳個在看！

娛樂新聞吧

谷歌搜索引擎問世25年最大更新之一，“AIOverviews”體驗正式上線｜懂點AI

動點科克