微軟人工智慧發展再突破,宣布機器翻譯水準媲美人類

進入雲端與AI運算時代之後,人工智慧的表現一日千里,微軟亞洲研究院與雷德蒙研究院合組團隊宣布其研發的機器翻譯系統,在通訊新聞報導測試集(newstest2017)的中翻英測試集上,達到與人工翻譯媲美的水準。

知名的科幻影集星艦迷航記(Star Trek),陪伴不少人度過了童年與青少年時光,其中最有趣也最直得討論的角色,大概就是機器人「百科(Data)」了。「百科」除了擁有龐大的星際資料庫外,其擬人化的反應、通曉所有已知的語言等能力,可說是現代電腦科技追求人工智慧表現的終極模型。

但完美的語言翻譯並不容易,因為語言是人類的特性,也是情感與理性的綜合表現,僅靠著邏輯運算的電腦科技,始終難以追上人工翻譯的水準。但是進入雲端與AI運算時代之後,人工智慧的表現一日千里,微軟亞洲研究院與雷德蒙研究院合組團隊宣布其研發的機器翻譯系統,在通訊新聞報導測試集(newstest2017)的中翻英測試集上,達到與人工翻譯媲美的水準。

newstest2017新聞報導測試集由產業界和學術界的合作夥伴共同開發,並於去年秋天在WMT17大會上發佈。newstest2017新聞報導測試集包括約2000個句子,由專業人員從線上報紙樣本翻譯而來。微軟團隊對測試集進行了多輪評估,每次評估會隨機挑選數百個句子翻譯。為了驗證微軟的機器翻譯是否與人類的翻譯同樣出色,微軟沒有停留在測試集本身的要求,而是從外部聘請了一群雙語語言顧問,將微軟的翻譯結果與人工翻譯進行比較。

驗證過程之複雜,也同時展現了機器翻譯要達到準確性有多麼複雜。以語音辨識為例,只要機器辨識的結果與人工辨識的結果相同,即可判定水準相同,但翻譯工作並非如此,因為即使兩位專業翻譯人員對於完全相同的句子,有很大的機會翻譯出不同用語的句子,卻表達出完全相同的語意。

微軟亞洲研究院副院長、自然語言計算組負責人周明

因此微軟亞洲研究院副院長、自然語言計算組負責人周明表示:「這也是為何機器翻譯較其它人工智慧任務複雜的原因,使用不同用語的翻譯結果,可能表達完全相同的意思,但沒有統一標準判斷何者為佳。」

此外,研究人員也提想大家,這並非代表人類已經解決了機器翻譯的問題,只能說我們朝終極目標又邁進了一步,因此這次的測試集中在常見的大眾類新聞詞彙,且中英文之間有相當成熟的訓練資料,所以在WMT17測試集上的翻譯結果才能達到人類水準。

四大技術創造中英翻譯里程碑

在這次的共同研究中,微軟亞洲研究院機器學習組將他們的最新研究成果-對偶學習(Dual Learning)推敲網路(Deliberation Networks)應用在此次取得突破的機器翻譯系統中。微軟亞洲研究院副院長、機器學習組負責人劉鐵岩介紹,所謂的「對偶學習」,是翻譯系統將中文句子翻譯成英文後,再將英文結果翻回中文,並與原始中文句子進行比對,根據比對結果不斷修正機器翻譯模型。而「推敲網路」則是模擬人類的文章寫作過程,透過多輪翻譯,不斷推敲改善翻譯結果,提升翻譯品質。

但機器翻譯的品質提升挑戰在於「沒有標準答案」,因此需要更複雜的演算法。周明表示,在此次的系統模型中增加了兩項新技術:聯合訓練(Joint Training)與一致性規範(Agreement Regularization)來提高翻譯準確性。所謂的聯合訓練,可理解為不斷反覆運算,並不斷反向翻譯來訓練資料集;而一致性規範指的是讓機器翻譯可以從句子開頭往後開始翻譯,或是從句子尾端往前翻譯,並不斷訓練最終讓兩個過程產生一致的翻譯結果。

研究團隊表示,此次技術將應用在微軟商業多語言翻譯系統產品中,以及機器翻譯之外的其他領域,協助更多人工智慧技術與應用的突破。

有興趣的人可點選以下連結試用該系統:
https://translator.microsoft.com/neural/

關於我們

自1990年創刊UXmaster雜誌,1991年獲得美國LAN Magazine獨家授權中文版,2006年獲得CMP Network Computing授權,2009年合併CMP Network Magazine獨家授權中文版,2014年轉型為《網路資訊》雜誌網站,為台灣中小企業協助技術領導者落實企業策略,了解網路規劃及應用,為企業網路應用、管理、MIS、IT人員必備之專業雜誌網站。


與我們聯絡

加入《網路資訊》雜誌社群

© Copyright 2017 本站版權所有,禁止任意轉載 網路資訊雜誌 / 心動傳媒股份有限公司 聯絡電話:+886 2 29432416