以技術為驅動力的網易有道最近開始在AI領域頻繁發力。早在7月,網易有道正式上線了面向企業的“有道智云”平臺,將以有道神經網絡翻譯(NMT)為主的自然語言翻譯和文字識別掃描(OCR)等技術全部集成在平臺上,供給第三方廠商使用。
有道智云針對各類行業客戶,提供NMT、OCR等眾多技術的集成解決方案。客戶可以通過有道智云調用翻譯API在線接口,實現聯網翻譯。上線五個月來,有道智云也實現了離線SDK在神經網絡翻譯(NMT)以及文字識別(OCR)方面的應用。其中,SDK技術更強調深度學習技術在移動客戶端的實現,使得速度更快,翻譯準確率更高,也能獲得更廣泛的應用。
離線NMT技術,翻譯效果更流暢
在自然語言翻譯網易有道離線SDK中,目前采用的是神經網絡翻譯模型,翻譯效果高于在線SMT(統計機器翻譯)。
在有道離線NMT與同類競品的橫向對比中,離線NMT翻譯質量也優于國內外競品,翻譯質量可媲美專業八級英語翻譯人員。小編選取了BBC news的一條導語,原文是:“More than a century ago, an antiquities dealer from Jerusalem claimed he had discovered an ancient version of the book of Deuteronomy. But was it a fake?”,讓網易有道與國內外競品的離線NMT對其進行翻譯成中文,通過對比顯示,有道離線NMT翻譯結果更符合人類語言習慣,而且對于特殊地名、人名有道離線NMT也都能精準翻譯。

(有道與競品離線NMT翻譯結果對比.英譯中)
為了對比檢測的準確性,小編又選擇了一條比較長的中文句子,原文是:“這幾年關于人工智能的討論不絕于耳。人們一邊早已習慣了種種“黑科技”對生活潛移默化的影響,一邊對讓世界翻天覆地的人工智能技術嘆為觀止。”讓三款離線NMT進行翻譯成英文,結果也顯示出,網易有道離線NMT的翻譯結果更加流暢、長短句斷句清晰、時態翻譯也更符合英文的語法習慣。

(有道與競品離線NMT翻譯結果對比.中譯英)
離線OCR識別技術,翻譯準確度更高
在有道神經網絡翻譯基礎之上的有道自主研發的文字識別OCR技術,可以直接對文字進行識別,其中,圖片標準文字尋找和識別率達97%以上,對于圖片中特殊文字尋找和識別率也可達90%以上。


(日文識別結果)

(傾斜角度離線OCR掃描翻譯)
有道智云,AI翻譯技術的集大成者
有道是國內最早進入翻譯服務市場的互聯網公司,聚焦中文與其他語言之間的翻譯,通過不斷提升機器翻譯的質量,從而為用戶帶來高質量的翻譯體驗。自從今年4月有道上線神經網絡翻譯之后,網易有道提供的翻譯質量提升是過去十年的總和。
根據網易有道的BLEU(雙語評估研究-Bilingual Evaluation Understudy)評估指標顯示,在中英互譯、日、韓測評中,有道神經網絡翻譯的翻譯準確度均高于國際同類產品。其中,在中英互譯的新聞和英語學習類語料方面并且BLEU值最高超出對手近10個百分點。

(有道神經網絡翻譯(中英互譯)BLEU值測評結果)
從2008年做翻譯服務至今,有道已經走過十年的歷史,從有道詞典、有道翻譯官、有道人工翻譯,再到有道智云,擁有十年語言翻譯領域技術積累的網易有道智云平臺或成為有道AI技術的集大成者。
作為網易有道的技術出口,有道智云將持續為行業客戶提眾多技術接口與服務。據悉,截至目前有道智云已經成為支付寶、微信、360、掌閱、網易郵箱、華為榮耀Magic手機、今日頭條海外版、智聯招聘等知名機構及產品的技術合作伙伴。