Meta計(jì)劃推出全球通用語(yǔ)音翻譯軟件,并開(kāi)源相關(guān)技術(shù)代碼及文檔
Meta 的 CEO 馬克·扎克伯格(Mark Zuckerberg)稱,“能夠用任何語(yǔ)言與任何人交流是人類永遠(yuǎn)的夢(mèng)想,人工智能將在我們的有生之年實(shí)現(xiàn)這一點(diǎn)。”
現(xiàn)在,市面上出現(xiàn)的翻譯軟件已滿足了英語(yǔ)、中文和西班牙語(yǔ)等國(guó)際常用語(yǔ)言的需求,但還有許多小眾語(yǔ)言被排除在外。有數(shù)十億人無(wú)法通過(guò)母語(yǔ)與外部世界溝通,也不能自由訪問(wèn)互聯(lián)網(wǎng)上的許多信息。
原因在于,雖然機(jī)器翻譯(Machine Translation,MT)系統(tǒng)正不斷進(jìn)步,但它們始終依賴于包含大量文本數(shù)據(jù)的訓(xùn)練語(yǔ)庫(kù)。對(duì)于鮮少被使用到的小眾語(yǔ)言來(lái)說(shuō),機(jī)器翻譯系統(tǒng)很難獲得訓(xùn)練所需且易于訪問(wèn)的書(shū)面文本語(yǔ)庫(kù),甚至得不到標(biāo)準(zhǔn)化的書(shū)寫(xiě)規(guī)則。
Meta 表示,“我們希望通過(guò)在兩個(gè)特定項(xiàng)目中部署新的機(jī)器學(xué)習(xí)技術(shù)來(lái)改善這種情況?!边@兩個(gè)特定項(xiàng)目,一個(gè)是"不讓語(yǔ)言掉隊(duì)"(No Language Left Behind),Meta 將致力于建立依靠少量訓(xùn)練示例就可完成語(yǔ)言翻譯工作的人工智能模型;另一個(gè)是通用語(yǔ)音翻譯器(Universal Speech Translator)項(xiàng)目,該公司希望開(kāi)發(fā)出無(wú)需經(jīng)過(guò)書(shū)面文本就能實(shí)時(shí)翻譯語(yǔ)音的系統(tǒng)。
目前,Meta 尚未表露進(jìn)行這兩個(gè)項(xiàng)目的具體時(shí)間。不過(guò),他們指出了通用語(yǔ)言翻譯的理想化情況。
他們表示,"消除語(yǔ)言障礙將是深遠(yuǎn)的,會(huì)使數(shù)十億人能夠以他們的母語(yǔ)或首選語(yǔ)言在線訪問(wèn)信息。機(jī)器翻譯系統(tǒng)的進(jìn)步不僅會(huì)幫助那些不會(huì)說(shuō)當(dāng)今互聯(lián)網(wǎng)上占主導(dǎo)地位語(yǔ)言的人,還將從根本上改變世界上人們聯(lián)系和分享想法的方式?!?br />
Meta 認(rèn)為,通用翻譯技術(shù)將惠及該公司遍布全球的產(chǎn)品,不僅會(huì)使產(chǎn)品覆蓋得更廣,還將推動(dòng)這些產(chǎn)品成為數(shù)百萬(wàn)人不可或缺的通信工具。
此外,該公司指出,“通用翻譯軟件將成為未來(lái)可穿戴設(shè)備中的殺手級(jí)應(yīng)用(killer App),并將突破 VR、AR 技術(shù)的界限?!?br />
例如,不同母語(yǔ)的人們可以運(yùn)用智能手機(jī)、手表及眼鏡等設(shè)備進(jìn)行實(shí)時(shí)交互,全球所有人都可以用他們的母語(yǔ)訪問(wèn)互聯(lián)網(wǎng)上的多媒體內(nèi)容,人們可以與在任何地方的任何人一起參與讀書(shū)俱樂(lè)部或者合作開(kāi)展工作項(xiàng)目。
這樣看來(lái),推出通用語(yǔ)音翻譯軟件既富有人道主義精神,又能夠?yàn)?Meta 等公司帶來(lái)良好的商業(yè)效益。
Meta 稱,“要為世界各地的每個(gè)人提供真正通用的語(yǔ)音翻譯工具,還需要做更多的工作。但我們認(rèn)為,現(xiàn)在的努力是向前邁出的重要一步?!?br />
未來(lái),Meta 還將對(duì)外公開(kāi)其技術(shù)細(xì)節(jié)并開(kāi)源所使用的源代碼和文檔,這意味著其他有能力的技術(shù)人員可以在他們的工作基礎(chǔ)上開(kāi)展進(jìn)一步研究。
需要注意的是,雖然機(jī)器翻譯的速度和準(zhǔn)確性隨機(jī)器學(xué)習(xí)的進(jìn)步得到一定提升,但機(jī)器翻譯的底層技術(shù)仍存在一定問(wèn)題。
有人指出,當(dāng)前的機(jī)器翻譯忽略了人類在說(shuō)話時(shí)微小但關(guān)鍵的地方,并輸出了有性別偏見(jiàn)的表述,還會(huì)出現(xiàn)一些只有計(jì)算機(jī)才能做出的意想不到的錯(cuò)誤。
此外,有一些使用小眾語(yǔ)言的人表示,如果語(yǔ)言翻譯能力掌握在科技巨頭手中,那么他們可能會(huì)失去對(duì)其母語(yǔ)和文化的控制。
對(duì)于擁有 Facebook 和 Instagram 等大型社交平臺(tái)的 Meta 來(lái)說(shuō),其更需要認(rèn)真看待這些問(wèn)題。
一直以來(lái),Meta 希望將其產(chǎn)品服務(wù)擴(kuò)展至全球市場(chǎng),但目前他們的產(chǎn)品仍只覆蓋到部分國(guó)家和地區(qū)。根據(jù)該公司的官方文件,其正在努力減少語(yǔ)言翻譯中所出現(xiàn)的仇恨言論及濫用行為,這些言論或行為都可能產(chǎn)生令人難以置信的可怕后果。
2017 年,有一名用戶在 Facebook 上發(fā)布了一條內(nèi)容帖子,隨后被警方誤抓。真實(shí)情況是這名男子輸入了阿拉伯語(yǔ)的"早安",而 Facebook 平臺(tái)卻將內(nèi)容翻譯為希伯來(lái)語(yǔ)的"攻擊他們"和英語(yǔ)的"傷害他們"。直到今天,涉及可疑翻譯的類似案件仍大量堆積在 Meta 的監(jiān)督委員會(huì)。
因此,除技術(shù)上的突破外,Meta 還需做到公平公正地運(yùn)用通用語(yǔ)音翻譯軟件的研究成果。
-End-
參考:
https://www.theverge.com/2022/2/23/22947368/meta-facebook-ai-universal-speech-translation-project
https://ai.facebook.com/blog/teaching-ai-to-translate-100s-of-spoken-and-written-languages-in-real-time
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。