今年的谷歌I/O大會超「硬」,還展示了下一代AI模型
未來的電腦將不再是臺式機(jī)、筆記本或手機(jī),而是你身邊的一切。所有設(shè)備服務(wù)和人工智能協(xié)同工作,你可以隨時(shí)隨地獲得幫助,當(dāng)不需要該技術(shù)時(shí),它就會消失在后臺。設(shè)備再不是系統(tǒng)的中心——你才是。
2022 年的谷歌 I/O 大會,觀眾席終于又坐滿了人,雖然其中大多數(shù)是谷歌自己的員工。
「去年我們分享了計(jì)算機(jī)科學(xué)的最新發(fā)展,而我們的目標(biāo)一直是讓全世界的信息變得讓全人類都能訪問,」谷歌 CEO 桑達(dá)爾 · 皮查伊(Sundar Pichai)開場說道。
今天的大會上,谷歌展示的也大多是人們都可以用到的,即將實(shí)裝且免費(fèi)的應(yīng)用。
如今機(jī)器學(xué)習(xí)工具已經(jīng)讓這一愿景很大程度上成為現(xiàn)實(shí)。谷歌翻譯中實(shí)用化的機(jī)器學(xué)習(xí)模型已經(jīng)可以不需要雙語對應(yīng)的語料庫即可自行學(xué)習(xí)新語言。
翻譯系統(tǒng)是人工智能最經(jīng)典的任務(wù)之一,谷歌的機(jī)器翻譯在多年發(fā)展過程中一直保持領(lǐng)先,還催生出了像 transformer 預(yù)訓(xùn)練模型這樣的重要 AI 技術(shù)。在 I/O 大會上,谷歌宣布自家的翻譯系統(tǒng)新增了 24 種新的語言,其中包括一些小眾的美洲原住民語言,覆蓋共計(jì) 3 億人。
在計(jì)算機(jī)視覺領(lǐng)域,谷歌地圖則通過 3D 重建技術(shù)實(shí)現(xiàn)了完全自由的沉浸式視圖,天空的樣子是實(shí)時(shí)天氣,甚至還可以讓你「走進(jìn)」一家餐館:
就像是在手機(jī)上玩一個(gè)模擬真實(shí)環(huán)境的游戲。
在視頻網(wǎng)站 YouTube 中,現(xiàn)在經(jīng)過 DeepMind 訓(xùn)練的 AI 已自動(dòng)為 8000 萬個(gè)視頻分出章節(jié),讓觀看者可以自動(dòng)跳轉(zhuǎn)到最感興趣的部分,還帶有 16 種自動(dòng)翻譯字幕。
最先進(jìn)的預(yù)訓(xùn)練大模型現(xiàn)在進(jìn)入了日常工作中?!府?dāng)你有一個(gè) 25 頁的文檔還沒看,卻馬上要和別人開始討論了,這時(shí)候該怎么辦?」皮查伊說道。
谷歌文檔現(xiàn)在有了自動(dòng)總結(jié)功能,可以把幾十頁文件總結(jié)成幾句話,這是自然語言處理(NLP)領(lǐng)域的重大飛躍,效果超過過去最好的機(jī)器學(xué)習(xí)的能力。除了文檔,谷歌的 AI 還能為聊天內(nèi)容提供摘要,自動(dòng)轉(zhuǎn)錄和總結(jié)功能也引入了 Google Meet,以后也不需要寫會議記錄了。
谷歌副總裁 Prabhakar Raghavan 向我們介紹了谷歌最核心業(yè)務(wù)搜索的改進(jìn):未來的搜索應(yīng)該是隨時(shí)隨地,使用任何輸入方式實(shí)現(xiàn)的。
谷歌搜索不再滿足于輸入關(guān)鍵詞,而是通過更自然和有邏輯性的語言,以及語音和視頻來完成。
上個(gè)月,谷歌推出了 Multisearch,它可以讓你通過拍照和提問的方式在谷歌應(yīng)用中進(jìn)行搜索。這是一個(gè)強(qiáng)大的想法,能夠讓你搜索無法描述的東西,比如拿手機(jī)一拍,「我要買這個(gè),在哪里可以買到這個(gè)?」。
或者「如何才能讓我種的花看起來和這個(gè)一樣?
Prabhakar Raghavan 表示,未來 Multisearch 還將提升本地搜索功能,并在今年晚些時(shí)候覆蓋更多國家,推出多語言版本。
這并不只是簡單的拍照加描述文字搜索,APP 會通過算法拼接視頻中的場景,然后通過知識圖譜分析得出圖像中的內(nèi)容,谷歌可以給出準(zhǔn)確的物體識別,并提供有用的建議。如果你拿手機(jī)攝像頭掃一個(gè)貨架,它能顯示每種巧克力的用戶評分。
這種被稱為 Scene Exploration 的能力或許是 AR 領(lǐng)域里迄今為止最好的 demo,就好像為現(xiàn)實(shí)世界裝上了一個(gè) Ctrl+F 快捷鍵。
在提升算法公平性方面,谷歌與哈佛大學(xué) Monk 教授合作開發(fā)了膚色量表(Monk Skin Tone Scale),能更準(zhǔn)確地在搜索結(jié)果中反映人們的膚色。
在谷歌的帶屏幕智能音箱 Nest Hub 上,現(xiàn)在不用每次都說 hey Google 了。新的注視功能,就像人們互相交流時(shí)眼神接觸一樣,你看著音箱說話就可以免喚醒詞。
Quick Phrases 功能則更加直接:只要說關(guān)燈、拉窗簾等祈使句就能指揮谷歌助手完成任務(wù)。
為了讓人和語音助手之間的交流更順暢,更多的機(jī)器學(xué)習(xí)模型現(xiàn)在在本地運(yùn)行,大幅度降低了響應(yīng)延遲。
一切都在朝著人性化的方向發(fā)展。
下一代 AI 模型
在應(yīng)用之下,谷歌一直在探索人工智能的最前沿。谷歌的對話 AI 模型 LaMDA 今年升級到了第二代,新模型顯著提升了對話質(zhì)量,在 AI test kitchen 中,你可以通過不斷選擇話題,讓模型自動(dòng)生成一個(gè)故事。
它也可以用來為你提供建議,現(xiàn)場展示了一個(gè)「如何開墾一個(gè)小花園」的話題,AI 可以不斷提出建議,你也可以選擇自己想要了解的方向無限深入下去。
「它展示了語言模型未來的潛力,在你搬到了一個(gè)新城市之后,它可以幫你解決很多問題,」皮查伊表示。
去年,Jeff Dean 所帶領(lǐng)的團(tuán)隊(duì)提出了「下一代通用 AI 架構(gòu)」Pathways,旨在用一個(gè)架構(gòu)同時(shí)處理多項(xiàng)任務(wù),并且使其擁有快速學(xué)習(xí)新任務(wù)、更好地理解世界的能力。
在今年 4 月提交的論文《PaLM: Scaling Language Modeling with Pathways》中,谷歌研究人員用 Pathways 系統(tǒng)訓(xùn)練了一個(gè) 5400 億參數(shù)的大型語言模型——PaLM(Pathways Language Model)。
這是一個(gè)只有****的密集 Transformer 模型。可以完成的任務(wù)包括自動(dòng)生成代碼、解決數(shù)學(xué)問題、修復(fù) bug,解釋笑話的梗等等。
皮查伊表示,該語言模型的優(yōu)點(diǎn)在于可以區(qū)分因果關(guān)系,理解上下文中的概念組合。通過這種方法,模型在數(shù)學(xué)問題上的準(zhǔn)確率提升到了 58%,接近 60% 的 9 到 12 歲兒童解決問題的水平。
PaLM 現(xiàn)在可以用孟加拉語提問和正確地回答問題,而該模型并沒有經(jīng)過對應(yīng)語料庫的訓(xùn)練,也沒有經(jīng)過新語言的問答訓(xùn)練,甚至根本沒有被專門設(shè)計(jì)用于翻譯。
Jeff Dean 口中的理想通用 AI 模型,難道已經(jīng)成為了現(xiàn)實(shí)?
全新安卓 13 系統(tǒng):定制化你的使用體驗(yàn)
每年的 I/O 大會都是安卓新版系統(tǒng)展示的舞臺,今年的重點(diǎn)在于覆蓋所有終端,谷歌也把所有硬件都造了出來。
多年來,安卓已經(jīng)成為世界上最流行的操作系統(tǒng)。僅去年,消費(fèi)者就激活十億部新的安卓手機(jī)。隨著機(jī)器學(xué)習(xí)的進(jìn)步,手機(jī)可以幫助我們完成超乎以往想象的工作。雖然手機(jī)仍是最受歡迎的計(jì)算形式,但人們越來越多地將各種連接技術(shù)添加到生活當(dāng)中,比如汽車、電視、和手表等。人們希望這些設(shè)備之間兼容、省事且不麻煩。
在谷歌 I/O 大會上,安卓 13 系統(tǒng)終于問世,它具有以下三個(gè)新特性:
讓你成就更多,把手機(jī)置于中心;
從手機(jī)延伸到各種形式的計(jì)算設(shè)備,比如手表、平板電腦等;
讓各種設(shè)備更好地一起工作。
先來看手機(jī)設(shè)備。安卓 13 通過更多方式適應(yīng)用戶的風(fēng)格,所有的應(yīng)用圖標(biāo)都可以融入自己的顏色主題。安卓 13 還有一個(gè)新的媒體空間,用戶可以根據(jù)正在聽的音樂定制外觀。此外,用戶還可以為每個(gè)應(yīng)用設(shè)置不同的語言,個(gè)性化使用體驗(yàn)。
安卓 13 還加入了很多安全與隱私功能。當(dāng)你給他人發(fā)信息時(shí),也需要確保他人的隱私和安全。為此,安卓 13 將****升級到了一種名為「RCS」的新標(biāo)準(zhǔn),使得端到端加密等重要隱私保護(hù)成為可能。這是移動(dòng)生態(tài)系統(tǒng)向前邁出的一大步。目前,谷歌的消息應(yīng)用已經(jīng)擁有了 5 億 RCS 月活用戶。谷歌希望每個(gè)移動(dòng)設(shè)備都可以升級這種 RCS 標(biāo)準(zhǔn)。
手機(jī)和錢包是人們?nèi)粘I钪斜貛У?,那么問題來了:手機(jī)能取代錢包嗎?谷歌推出了新一代 Google Wallet,這款安卓數(shù)字錢包讓你快速安全地獲取日常所需。Google Wallet 將安全地存儲你的****信息,只要是在接受 Google Play 的地方,就可以輕點(diǎn)支付。
Google Wallet 的功能遠(yuǎn)不止支付,你還可以用它出示學(xué)生證、航班登記,發(fā)動(dòng)汽車,把它當(dāng)作迪士尼樂園門****。同時(shí),谷歌還將在今年晚些時(shí)候?qū)?shù)字身份證帶入 Wallet。先從駕照開始,你可以分享自己的身份信息,而不必將手機(jī)交給其他人,只要通過 NFC 點(diǎn)擊或者掃描二維碼即可。
未來幾周,Google Wallet 將在全球范圍內(nèi)面向安卓和 WearOS 設(shè)備推出。
此外,今年晚些時(shí)候,安卓 13 還將緊急 SOS 帶入 WearOS 設(shè)備,這樣你就可以立即聯(lián)系信任的家人和朋友或者直接用手表撥打救援電話。安卓 13 的地震預(yù)警系統(tǒng)也將擴(kuò)展到世界上的高危地區(qū),實(shí)現(xiàn)提前預(yù)警。
除了手機(jī)之外,谷歌還致力于在平板電腦、手表等個(gè)人設(shè)備上提供安卓的美妙體驗(yàn)。WearOS 設(shè)備比去年增加了兩倍,大屏設(shè)備擁有 2.7 億活躍用戶。值得注意的是,安卓目前是唯一可以將類似平板電腦的體驗(yàn)放入口袋的系統(tǒng),可折疊設(shè)備提供了大屏設(shè)備所有的優(yōu)點(diǎn),并具備手機(jī)的便攜性。
下一步要做的是使多設(shè)備實(shí)現(xiàn)兼容協(xié)同工作。為此,谷歌開發(fā)了 Fast Pair 技術(shù),使用戶不用管理任何設(shè)置,讓手機(jī)、平板和電視輕松配對,實(shí)現(xiàn)與耳麥和智能設(shè)備的即時(shí)互聯(lián)。
不過,如果想要將如此方便的互聯(lián)功能普及到家里的所有設(shè)備,就要用到「matter」了。這是一項(xiàng)將在今年秋季發(fā)布的開放行業(yè)標(biāo)準(zhǔn),它連接了谷歌硬件以及數(shù)百種受支持的產(chǎn)品,比如燈泡、門鎖和智能插頭。這些支持 matter 的設(shè)備只需要幾秒鐘就能進(jìn)入你的家居、網(wǎng)絡(luò)和 Google Home,通過 Fast Pair 對接你喜歡的應(yīng)用。
谷歌新手機(jī):Pixel 6a 和 Pixel 7/7 Pro
2021 年 10 月,谷歌推出了全新的 Pixel 6 和 6 Pro 手機(jī),其中首次采用了自研的 Tensor 芯片。Tensor 芯片的命名方式讓人想起了谷歌提出的深度學(xué)習(xí)框架 TensorFlow,以及谷歌服務(wù)器芯片 TPU,它的設(shè)計(jì)宗旨是把谷歌最領(lǐng)先的 AI 技術(shù)直接帶入手機(jī)端。
在 I/O 大會上,谷歌發(fā)布了全新的平價(jià)款手機(jī) Pixel 6a,僅售 449 美元。谷歌表示,「這是有史以來該價(jià)位最好的智能手機(jī)?!筆ixel 6a 提供有三種顏色,包括炭黑、粉白和灰綠。7 月 21 日開啟預(yù)購,7 月 28 日到店購買。
Pixel 6a 的外觀風(fēng)格與 Pixel 6 系列一脈相承,具有獨(dú)特的雙色外觀,纖細(xì)的邊框,6.1 英寸 AMOLED 1080p 顯示屏,提供了 IP67 規(guī)格的防塵防水,60Hz 的刷新率。相機(jī)方面,Pixel 6a 容納了雙后置相機(jī)系統(tǒng),包括 1200 萬像素的主鏡頭和超廣角鏡頭。前置自拍攝像頭則為 800 萬像素。
更重要的是,Pixel 6a 搭載了與 Pixel 6/6 Pro 相同的 Tensor 處理器和 Titan M2 安全芯片,支持 5G 連接。Pixel 6a 以較低的價(jià)格提供更好的性能和更豐富 AI 賦能的體驗(yàn),使用戶享受與 Pixel 6/6 Pro 同樣出色的安卓體驗(yàn)以及獨(dú)有的攝影、語音和安全等功能。
除了 Pixel 6a 之外,谷歌還透露了今年秋天要發(fā)布的 Pixel 7 和 7 Pro 系列產(chǎn)品,搭載谷歌下一代自研 Tensor 芯片,在語音、攝影、視頻和安全方面帶來更多 AI 驅(qū)動(dòng)的突破和極其個(gè)性化的體驗(yàn)。當(dāng)然,Pixel 7/7 Pro 將預(yù)裝安卓 13 系統(tǒng),享受最新移動(dòng)操作系統(tǒng)所帶來的諸多好處。
其中,Pixel 7 Pro 將鋁制材料擴(kuò)展到整個(gè)攝像頭上,這是 Pixel 設(shè)計(jì)語言的進(jìn)一步進(jìn)化。它的三重?cái)z像頭系統(tǒng)為攝影、性能和設(shè)計(jì)樹立了全新的標(biāo)準(zhǔn)。
好的手機(jī)當(dāng)然少不了好的耳機(jī),I/O 大會上發(fā)布了全新的無線耳機(jī) Pixel Buds Pro。
Buds Pro 不僅嵌入了谷歌設(shè)計(jì)的最佳移動(dòng)音頻硬件,還是第一款具備主動(dòng)降噪功能的耳機(jī)。谷歌表示,它是當(dāng)今耳機(jī)中噪音消除效果最好的產(chǎn)品之一,這得益于它圍繞新的定制音頻處理器設(shè)計(jì)。
每個(gè)人的耳朵都是獨(dú)一無二的,所以耳尖并不總是形成一個(gè)完美的密封,有可能導(dǎo)致聲音從外面漏進(jìn)來。為了解決這一問題,谷歌的主動(dòng)降噪使用了新的靜音密封技術(shù)來補(bǔ)償音頻泄露,有助于最大程度地消除噪音,得到身臨其境的優(yōu)質(zhì)聲音,不會分心。
不過有時(shí),你確實(shí)想要聽聽周圍發(fā)生了什么,這時(shí)透明模式將發(fā)揮作用。它可以讓外界的聲音進(jìn)入,讓你體驗(yàn)周圍世界,就好像根本沒有佩戴耳機(jī)一樣。
定制的音頻芯片是為了提高功率效率,為此 Pixel Buds Pro 的續(xù)航時(shí)間可達(dá) 11 小時(shí),降噪模式下為 7 小時(shí)。這款耳機(jī)還提供了有用的免提體驗(yàn),可以向助理詢問各種事情,比如獲得 40 多種語言的實(shí)時(shí)翻譯。同時(shí)支持多點(diǎn)連接,在兼容的手機(jī)、平板電腦、筆記本電腦和電視之間切換使用。今年晚些時(shí)候還將更新以支持空間音頻,在兼容 Pixel 手機(jī)上觀看電影或電視時(shí)會體驗(yàn)到身臨其境的感覺。
新的 Pixel Buds Pro 提供有四種顏色,售價(jià)為 199 美元,7 月 21 日預(yù)購,7 月 28 日上市。
下面是一直在傳聞中的 Google Pixel Watch,它在今年秋天將隨著 Pixel 7 手機(jī)一同發(fā)售。
作為第一款完全由谷歌設(shè)計(jì)的智能手表,它有著最出色的 WearOS 體驗(yàn),帶有語言助手、NFC 等功能,可以獨(dú)立實(shí)現(xiàn)導(dǎo)航等功能,最重要的是不像很多同級產(chǎn)品一樣有過大的表盤。
手機(jī)、手表、無線藍(lán)牙耳機(jī)都齊全了,最后還差一塊大屏,谷歌宣布,2023 年還要推出 Pixel Tablet 平板電腦。
在這些設(shè)備發(fā)布后,谷歌將會和現(xiàn)在的各家手機(jī)大廠一樣建立起較為完整的生態(tài)。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。