谷歌搜索引擎問世25年最大更新之一,“AIOverviews”體驗正式上線|懂點AI

動點科克 2024-05-16 21:34:57

掌握AIGC脈動,把握科技脈搏。動點科技每天收集彙總全球AIGC進展與熱點,每天5分鍾帶您了解AIGC,希望與您共同玩轉 AIGC,解碼行業發展新風向,開啓智慧新時代!

文 |動點科技排版|高竹本文預計閱讀時長5分鍾

01

文生圖技能再進化,谷歌推出 Imagen 3:更准確、更具創造性谷歌公司在今天召開的 I / O 2024 開發者大會上,宣布推出了 Imagen 3,進一步增強了文本生成圖片的技術能力。與前代産品 Imagen 2 相比,Imagen 3 能更准確地理解文字提示,並將其轉化爲圖像,而且其生成的圖像更具“創造性和細節”,且模型産生的幹擾元素和錯誤也更少。爲了打消人們對 Deepfake 可能性的擔憂,谷歌表示,Imagen 3 將使用 DeepMind 開發的 SynthID 方法,在媒體上應用隱形加密水印。用戶可以在谷歌的 ImageFX 工具中可以注冊 Imagen 3 的私人預覽版,谷歌表示,該模型將很快提供給使用谷歌企業生成式人工智能開發平台 Vertex AI 的開發人員和企業客戶。

02

谷歌搜索引擎問世 25 年最大更新之一,“AI Overviews”體驗正式上線谷歌公司在今天召開的 2024 年 I / O 開發者大會上,正式推出了“AI Overviews”搜索體驗,將于本周開始向美國地區開放,後續會推廣到更多國家和地區。該功能此前稱之爲Search Generative Experiences,主要是讓用戶通過提問、聊天的方式進行 AI 搜索。在美國地區,谷歌主要通過和 Reddit 社區合作,解答用戶的提問。谷歌表示,它將爲美國用戶的在線查詢提供人工智能生成的答案,這是其搜索引擎 25 年來最大的更新之一。

03

劍指 Sora,谷歌推出 Veo 文生視頻模型:時長超 1 分鍾、最高 1080P,支持電影手法OpenAI 三個月前推出文本轉視頻 Sora,引發了網友、媒體以及圈內人士的廣泛討論。谷歌在今天召開的 2024 I / O 開發者大會上,也推出了對標産品-- Veo,可以生成長度超過 1 分鍾,分辨率最高 1080P 的“高質量”視頻,並具有多種視覺和電影風格。根據谷歌官方新聞稿,Veo 具備對自然語言有先進的理解能力,能夠理解“延時攝影”、“航拍風景”等電影術語。用戶可以使用文本、圖像或視頻提示來指導他們所需的輸出,谷歌表示,這樣産生的視頻“更加連貫一致”,在整個鏡頭中人物、動物和物體的動作也更加逼真。

04

對轟 GPT-4o,谷歌推出 Astra 項目:手機鏡頭內低延遲聊天交互谷歌公司在今天召開的 2024 年 I / O 開發者大會上,推出了全新的 Project Astra 項目,基于 Gemini,可以本地運行在 Pixel 手機上,可以說是對標 OpenAI GPT-4o 的最新模型。谷歌表示 Project Astra 是最新的多模態 AI 項目,用戶打開攝像頭,該多模態項目可以直接解釋用戶畫面中物品。

05

字節跳動正式發布“豆包大模型”家族,含通用模型、角色扮演模型、聲音複刻模型、語音識別模型、文生圖模型等今天上午,字節跳動在 2024 春季火山引擎 Force 原動力大會上正式宣布自家豆包大模型正式開啓對外服務。據介紹,豆包大模型包含豆包通用模型 Pro、豆包通用模型 liti、豆包・角色扮演模型、豆包・語音合成模型、豆包・聲音複刻模型、豆包・語音識別模型、豆包・文生圖模型、豆包・Function Call 模型。除發布字節跳動自研大模型外,字節跳動還宣布火山引擎大模型服務平台——火山方舟也將迎來重大升級。

06

谷歌預告安卓新功能:AI 檢測詐騙電話谷歌公司在今天召開的 I / O 2024 開發者大會上,宣布爲安卓系統引入 AI 詐騙電話檢測功能,在通話中提醒可能存在的詐騙行爲,並鼓勵用戶結束此類通話。谷歌表示該功能基于本地運行的 Gemini Nano 模型,在通話中匹配查找欺詐性語言和其他通常與詐騙有關的對話模式,如果遇到疑似詐騙的電話,就會發出警報提醒用戶。安全方面,谷歌表示,這些新的保護措施完全是在設備上實施的,因此 Gemini Nano 監控的對話將保持私密性。

07

谷歌 Workspace 辦公套件整合 Gemini:可總結郵件內容、梳理會議要點等谷歌公司在今天召開的 I / O 2024 開發者大會上,宣布 Google Workspace 將進一步整合 Gemini,在側面板中將推出基于 Gemini 1.5 Pro 的諸多技能。谷歌表示 Workspace 整合 Gemini 的作用,是爲用戶節省從多個應用程序中挖掘文件、電子郵件和其他數據的時間和精力。谷歌 Workspace 的 Gmail、Docs、Sheet、Slides 和 Drive 將率先推出 Gemini 側面板,可以不在離開應用的情況下,組織、理解應用中的數據,可以總結郵件內容、摘要會議記錄等等。

08

谷歌 Gmail 深度整合 Gemini:彙總郵件內容、生成更好回複谷歌在今天召開的 I / O 2024 開發者大會上,宣布將于下月邀請 Workspace 和 Google One AI Premium 用戶,體驗新版 Gmail,可以讓 Gemini 總結電子郵件內容。谷歌表示用戶可以在移動應用和網頁版 Gmail 中使用 Gemini,針對當前電子郵件內容提問,或者讓 Gemini 根據電子郵件的上下文撰寫回複。谷歌目前已經在 Gmail 中引入了 Smart Reply 功能,不過新版中升級帶來了“Contextual Smart Reply”,可以基于上下文帶來更細致、更優秀的回複。谷歌表示還將會爲 Gmail 應用帶來全新的 Gemini 按鈕,用戶點擊之後會看到“總結這封郵件”或“建議回複”等建議,用戶還可以輸入提示來詢問有關電子郵件的問題。

09

谷歌 Gemini 解鎖旅行規劃技能,幾秒內幫你妥當安排行程

谷歌公司在今天召開的 I / O 2024 開發者大會上,宣布爲 Gemini 引入旅行規劃功能,結合個人信息和公共出行信息,幫用戶規劃預訂航班、酒店等等。谷歌表示 Gemini 可以基于用戶的提示,挖掘航班時間和酒店預訂等具體細節,在幾秒鍾內制定出合適的度假行程。Gemini 會根據用戶電子郵件中包含的航班和酒店詳細信息制定行程。該模式還將利用谷歌地圖查找附近的餐館和文化景點,並根據特定提示(如飲食限制或應避免的事項)過濾出各種選擇。谷歌表示,新的旅行計劃功能將在未來幾個月內登陸 Gemini Advanced。

10

iOS 版 ChatGPT 更新支持 App 首選語言設置中文iOS 版本 ChatGPT 今日淩晨發布 1.2024.129 版本更新,新增支持 App 首選語言設置中文,此前爲其他語言。首次啓動 iOS 版 ChatGPT 會出現中文展示頁,App 內支持應用語言設置,點擊後將跳轉至系統設置中 ChatGPT 應用設置,再次點擊首選語言,即可設置軟件語言。

11

百度發布全球首個 L4 級自動駕駛大模型 Apollo ADFM,稱比人類駕駛更安全

百度 Apollo 今天在武漢百度蘿蔔快跑汽車機器人智行谷舉辦 Apollo Day 2024,發布了全球首個支持 L4 級自動駕駛的大模型 Apollo ADFM(Autonomous Driving Foundation Model)。百度稱,Apollo ADFM 基于大模型技術重構自動駕駛,可以兼顧技術的安全性和泛化性,做到安全性高于人類駕駛員 10 倍以上,實現城市級全域複雜場景覆蓋。依靠自動駕駛大模型的應用實踐️,百度蘿蔔快跑已經攻克了武漢的複雜道路場景,實現了武漢城市全域、全時空場景覆蓋。同時在 L2 + 智能駕駛領域,目前國內唯一的純視覺城市領航輔助駕駛産品 ANP3 也將全面應用自動駕駛大模型 Apollo ADFM,升級爲 ASD(Apollo Self-Driving),即將在極越全系車型量産首發,率先實現“智駕全國都能開、有百度地圖的地方都能開”。

本文爲動點科技整理,未經授權不得轉載,如需轉載或開白請在後台回複“轉載”。

- - - - - - - - END - - - - - - - -

*想要獲取行業資訊、和志同道合的科技愛好者們分享心得,那就趕快掃碼添加“動點君”加入群聊吧!群裏更有不定期福利發放!

精彩好文值得推薦!

一鍵轉發,戳個在看!

0 阅读:0

動點科克

簡介:感謝大家的關注