|
您的位置: 首頁 > 網站資訊 > 谷歌神經翻譯引擎進步了多少? |
谷歌神經翻譯引擎進步了多少?發布日期:2017/7/9
美國時間9月27日,谷歌公布推出谷歌神經網絡機器翻譯體系(GNMT),采用神經網絡機器翻譯(NMT)技術大幅提拔機器翻譯的水平,《麻省理工學院技術評論》雜志MIT TR 報道稱“幾乎與人類無異”。
效果是讓人耳目一新的。翻譯界偕行Michael Zhang在其微信公眾號“譯言千金”做了一次谷歌翻譯引擎新老版本和人工翻譯的對比:下文的“GT1”代表2016年3月份GT機譯效果;“GT2”代表2016年10月中旬GT機譯效果。
老版本的谷歌譯文是讓人你認識的“機器文”:詞是對的,整句必要你在腦子里調整語序后再理解。新版本的譯文和人說話的語序幾乎一樣,和人工翻譯沒有大區別。 觸手可及的體感轉變觸動了用戶和媒體的心弦:它就是我們通常認為的那個會說人話的人工智能,科技的力量很推翻,至少“推翻了翻譯行業”。 谷歌引擎到底提高了多少?谷歌在發表的論文中列舉了幾個語向的翻譯錯誤降落率。 其中英語到西班牙語降落了87%,英文到中文降落了58%。 “錯誤率降落”是怎么回事?我的同事懸臂箱,商鵲網CTO魏勇鵬在接受雷鋒網的記者采訪時詮釋了谷歌是如何做的: 比如漢譯英。谷歌隨機從中文維基百科遴選500個句子,讓基于統計的老引擎PBMT、基于神經網絡的GNMT和諳練譯員各自做一次上海做網站站百度搜索排行,譯文質量打分從0到6分不等,6分為滿分。效果就是老引擎得分3.694,新引擎得分4.263,人工翻譯得分4.636。 錯誤率計算體例為:
勇鵬告訴記者:“一、從3.6提拔到4.2,和從4.2提拔到4.6,這兩個所必要支出的努力程度,后者可能是前者的10倍以上都不止,但Google就簡單的線性計算為縮小了60%的差距。二、中英的人工翻譯,得到的評分也就只是4.6,比英西的人工翻譯要低得多,這點說明用來作為基準的‘人’未必是靠譜的,以它為基準來評估也未必靠譜。” 加拿大國家研究委員會NRC多語言處理研究組陳博興研究員在他的微信同伙圈發文給了一個評價: “谷歌所做的事情是將這兩年學術界神經網絡機器翻譯的多種技術做了一個整合集成,行使他們壯大的工程能力和計算能力,搭了一個很好的體系。他們的單體系比我行使開源訓練的體系在統一個數據集上要好了也許3個多BLEU值。【注:BLEU標準是美國商務部部屬的國家標準與技術研究所NIST舉辦的一項機器翻譯研究水平評測,其原理是比較機譯效果和人譯效果的相似度,完全同等得分為100(當然不同的人的翻譯很難“完全同等”,所以得分100為理想值)。2008年NIST的英文-中文的機器翻譯評測效果,谷歌翻譯得分41.42。】3個多BLEU的差距,假如由人來判斷,細心看的話,是能感覺到的,但是也就是一個小的提高,談不上突破什么的。 “對于他們(谷歌發表)的文章,我覺得有兩個遺憾的地方:1.所采用的技術都是之前發表過的,沒有全新的技術(對google的要求天然要高一點,呵呵)。2. 假如我們有那么大的計算和工程能力以及那么多人力可以投入,即使只是整合已有技術,我覺得我們可以做得更好,比如我會加上清華大學劉洋他們首先采用的風險訓練方法來進行訓練,等等。” 陳先生提到的劉洋在接受媒體采訪時淡淡地說:“谷歌做的其實是把目前學術界的一些技術集成在一路。谷歌自己的數據、運算能力,還有工程師水平都特別很是高,所以他們通過集成做了一個特別很是強的體系,這個體系和傳統方法相比有比較明顯的進步。但媒體的報道有點夸張,并不能說機器翻譯已經接近人的水平,或者完全庖代人。谷歌這項工作還達不到 ‘推翻性突破’ 這種程度。” 專業人士的評價和通俗用戶的體感不完全同等。于是懂行的故意人找出了一些風趣的谷歌翻譯案例。加拿大博芬翻譯公司的趙杰打算寒假回過年,在網上查詢找到一家合適的酒店,各種條件都不錯,但是看到價錢時含糊了,“The price is quite high”。老趙找到酒店的原版中文介紹,原文是“性價比相稱高”,谷歌給的譯文把意思給弄反了。 谷歌新翻譯引擎在穩當處理原文譯文語序的同時,出現了一些莫名其妙的題目。 引擎把“美美”翻成了“美國和美國”,而一個標點或者一個近義詞的改變,會讓它的譯文發生很大的轉變,甚者譯文會意思迥異。相比之下,采用統計原理訓練的有道翻譯則把“我想美美地睡一覺”和“我要美美地睡一覺”給出了同樣的英文譯文。 “谷歌的新引擎的錯誤無法追溯。”中科院主動化所的張家俊副研究員說,多層神經網絡的算法模型的計算過程是一個黑盒子,人無法理解息爭釋程序主動學習的過程。“谷歌的新引擎在語言流利性有大幅度進步,但是在原文忠誠度上沒有顯明轉變。”張家俊說。 普通化的話來講,統計型翻譯引擎的基礎數據是雙語對齊的詞、短語和句子,數據對齊的精度越高翻譯質量也越高。但是數據精度越高,也意味著在現實應用中命中的概率也越低。曩昔以谷歌的壯大計算能力和的語言數據,也無法在窮盡各種語境、各種文句上可以再上一個臺階,谷歌的統計型翻譯引擎的BLEU值好幾年維持在40+的水平而無法顯明進步。 神經網絡的算法不再依靠人對語言的理解(詞、短語和句子的對齊譯法),在許多語種中把詞切分到字母的層級(即Subword),比如詞根、后綴等,對原文各個詞之間的關系也計算得更加過細。谷歌新翻譯引擎的神經網絡達到了八層,計算的過程耗費了偉大的計算能力。這有賴于谷歌本身開發專門面向深度學習的TPU處理器,其單位耗電量的性能達到GPU和FPGA的10倍,且不外賣。 “神經機器翻譯NMT體系是個好東西,但相對傳通盤計機器翻譯SMT來說,體系部署所需硬件投入至少漲十幾倍。舉個例子,拋開翻譯性能而言,像采用我們組裝的支撐4塊GPU的服務器,NMT體系在如許一臺價值4萬多元的服務器上運行速度和吞吐,才接近于SMT體系在3000多元的PC機上的性能。假設用戶為了知足大規模吞吐和翻譯工作的話,比如必要100臺機器的話,基于小牛翻譯SMT版本只必要投入30多萬硬件,但知足同樣的性能假如采用小牛翻譯NMT體系可能必要投入400多萬硬件。真的期待硬件成本繼承降落,才能真正讓小牛翻譯NMT體系真正走入中小企業啊。”小牛翻譯的創始人、東北大學朱靖波教授感觸道。 谷歌新引擎的發布讓機器翻譯行的專業人士達成了同等:神經網絡算法的翻譯引擎庖代傳統引擎是行業趨勢。但“庖代”是拋棄照舊迭代?這是一個龐大的題目,它意味著諸多傳統機器翻譯研究學者和行業從業者如何跨入下一步? 張家俊在10月下旬發表了一篇論文,宣布了他做的一項研究。他使用了一些傳統詞典的雙語數據支撐神經網絡的翻譯引擎。因為算法的不同,這些詞典的詞對齊數據無法直接被神經網絡的引擎使用。佳俊找到一些使用這些詞的公開語句,行使傳統引擎翻譯成英文,再把這些復活成的數據作為神經網絡引擎的源數據。在訓練后的翻譯引擎測試數據中,假如有100個低頻詞被詞典覆蓋,接近80個可以得到譯文,匹配度接近80%。 “把現有的詞典都照你的方法處理成神經網絡引擎的語料,它的詞的正確度就能大幅度進步嗎?”筆者問張先生。家俊說:“不是的。我給的數據是傳統翻譯引擎的譯文,有很大的噪音,因此不能說數據越多結果越好。” 張家俊說傳統研發的積累,讓他得以在新舊引擎之間找到了一些可以繼續并創新的方法,為神經網絡翻譯引擎的提高提出補缺的新思路。 陳博興研究員說:“機器翻譯在可以預見的將來庖代不了人工翻譯。尤其是如今的人工翻譯的市場跟機器翻譯的市場基本上不重合,人工翻譯對準的是高端市場,要求很的翻譯需求,而機器翻譯則是1,要求不那么的翻譯情景,比如旅游,比如網頁欣賞,比如信息監控等等。2,機器翻譯幫助專業翻譯人員進步服從。假如中國對交際流的程度達到歐美如今的程度,那么中國的高端翻譯市場將會是無比偉大的。有志于從事翻譯的同窗,放心勇敢地進來吧。” “舉例來說,理想的法律翻譯是100分,現實工作達到95或98分就很好了,80分、85分、95分的質量,收入/報酬的差別不是以五個百分點計算,而是以倍數計算。PE(注:譯后編輯,一種新的翻譯工作模式,譯員基于機器翻譯的效果進行校對編輯優化)假如沒有能力提拔那幾個百分點,那和機器翻譯沒啥差別,報價、收入一樣上不去。”微博上的一個資深法律譯者,@readthinker99 對譯后編輯的看法。 神經網絡翻譯引擎NMT對翻譯行業的益處是它給出的效果更吻合人的敘述風俗,可用的部分更多,而從事譯后編輯的譯員可以更專注在垂直的專業術語短語上給出好的翻譯,是一石二鳥服從進步成本降低的好事情。 —————————— 后記: 大賭注 面對神經網絡計算的黑盒子,身在現實研究和開發中的專家基本上都和陳博興老師持雷同態度:機器翻譯離理解人類語言還很遠,可見的時間里跨語種的深入交流必要借助有專業外語能力的人工幫助。由于神經網絡的深度學習體例和基于統計的機器翻譯算法一樣,都沒有涉及到語義的理解。無論如今神經翻譯引擎讀起來有多接近人的話語,這個軟件其實“不理解”它計算出來的譯文的意思。 人類對本身身認知過程的運轉機制,還處于很淺層的研究階段,腦科學還無法還原大腦在思考一個題目的心理過程。英國物理學家、認知學家戴維·多伊奇教授的看法是:“由于在其核內心有一個懸而未決的哲學題目:我們還不了解創造性如何運作。”所以人類也就無法復制創造的過程。這幾乎是人對自身認知、對人工智能AI的清醒的一個出發點,但是神經網絡研究者給了另外一條路徑。 清華大學的韓鋒先生給一本譯著《重新定義智能》作序著文《讓“人腦”走下神壇》,該文寫于Alphago與李世石大戰的過程中。其重要論點是,物理研究已經知道事物或體系有自相似性,基于一種重整化群的方法,使用神經網絡的算法和夠大的計算能力,可以計算出有計算機智能的邏輯,并得以詮釋對象,比如Alphago克服了李世石。(詳細闡述過程請參見原文) 韓先生的點出了大部分機器翻譯專家面對的一個隱蔽題目:他們認為以可靠的能力和認知,機器無法理解人。但是誰也不能確認下一步神經網絡會算出什么?那么韓鋒先生提出來得可能性不能被證偽。霍金、馬斯克說的機器威脅人類,也同樣不能被證偽。 真風趣啊。AI時代,人類認知學的大家伙廣告策劃,擁有大數據的公司都在面對、覬覦或憂慮有一個潘多拉的盒子被打開。更多的人則充滿熱情和信念、欣喜地預備歡迎新的AI的提高,并計算現有的數據和能力,在那能做什么。萬一沒實現呢,我們也不會失去將來。 (本文得到了我的同事魏勇鵬、胡日勒的專業支撐) 作者:鄒劍宇 |
其他相關文章 |
|
|
|
|||||||||
Copyright 2012-2025 上海蒙狼網絡科技有限公司 m.aqdzp.cn All Rights Reserved |