站長資訊網
最全最豐富的資訊網站

2020國際機器翻譯大賽:火山翻譯力奪五項冠軍

  在11月下旬結束的自然語言處理頂級學術會議EMNLP2020上,國際機器翻譯大賽(WMT20)公布了賽事最終結果,來自字節跳動火山引擎旗下的火山翻譯(Volctrans)在39支參賽隊伍中殺出重圍,以顯著優勢在「中文-英語」語向翻譯項目上拿下了冠軍。

  此外,火山翻譯團隊還拿下了「德語 -英語」和「德語-法語」語向機器翻譯項目的冠軍,更斬獲了平行語料過濾對齊項目普什圖語和高棉語的兩項第一。

2020國際機器翻譯大賽:火山翻譯力奪五項冠軍

      39支隊伍角逐國際頂級機器翻譯大賽WMT

  國際機器翻譯大賽(WMT)由國際計算語言學協會 (ACL) 舉辦,是全球學術界公認的國際頂級機器翻譯比賽,也是各大科技公司、頂尖院校與學術機構展示自身機器翻譯實力的較量舞臺。

  自2006年至今,國際機器翻譯大賽(WMT)已經成功舉辦15屆,本屆比賽共有39支隊伍參賽,包括微軟、Facebook、Google DeepMind、騰訊、小牛翻譯、華為、滴滴等實力雄厚的參賽團隊。

  組委會根據中英、英中、英德等22個不同翻譯任務提供測試數據集,并引入科學的語言專家人工評估流程。每個參賽系統首先由多名經驗豐富的語言學家進行評估,然后對最終分數進行標準化加權,最后進行排名。整個評估過程歷時四個月,評價結果有非常高的置信度。

  語言專家評估得分第一 火山翻譯拿下「中文-英語」語向冠軍

  歷年比賽中,「中文-英語」語向的翻譯任務都是參賽隊伍最多、競爭最為激烈的機器翻譯任務之一,今年更勝往年。

  火山翻譯團隊參加了非受限場景的比賽,也就是在給定測試集的情況下,可以使用任何數據和方法探索翻譯效果極限的比賽方式,組織方也引入了四個權威的在線機器翻譯商業系統(Online-A、G、Z、B)作為對比,這也是最能體現翻譯團隊數據和算法綜合能力的場景。在人工評估中,火山翻譯團隊(Volctrans) 力壓群雄,以明顯的優勢奪得了冠軍。

2020國際機器翻譯大賽:火山翻譯力奪五項冠軍

(圖:WMT2020 中英翻譯前幾名系統得分。Ave.z代表人工評估標準化分數,也是目前機器翻譯最受認可的指標。)

  相比「中文-英語」,「德語-英語」在 WMT 比賽上是傳統項目,也是歐洲國家最關注的語向。在最后的人工評價中,火山翻譯依然表現出色,取得了第一名的成績。國際機器翻譯大賽組委會給出了很高的評價,“作為新的參與者,火山翻譯表現尤為出色(particularly well),超越了很多傳統隊伍”。

  復旦大學計算機學院教授、EMNLP2021大會程序主席黃萱菁表示:“WMT是非常硬核的比賽,火山翻譯取得了出色成績。火山翻譯的LightSeq、mRASP等技術讓人眼前一亮,機器翻譯有廣闊的發展空間,非常期待火山翻譯為機器翻譯的技術研究和產品應用探索更多可能性。”

  領先的背后:火山翻譯致力于打造前沿研究、產品研發和用戶反饋的閉環

  火山翻譯(Volctrans)是由字節跳動計算機研究科學家、工程師、產品經理、產品運營和語言專家組成的專業團隊研發,其基于自主研發的機器學習技術,積累了百億多種語言語料,已支持超過50個語種、2500個語對之間的互譯,翻譯效果和速度業界領先。

2020國際機器翻譯大賽:火山翻譯力奪五項冠軍

(圖:火山翻譯官網。可以通過 https://translate.volcengine.cn/ 體驗火山翻譯,并了解更多產品能力。)

  目前,火山翻譯具備文本翻譯、語音翻譯、圖像翻譯、語種識別四種能力,在辦公、娛樂、新聞等場景表現優異。

  基于這些能力,火山翻譯推出了一系列形態多樣的產品與服務,包括機器翻譯云服務、智能視頻翻譯、智能同傳、翻譯瀏覽器插件等。此外,火山翻譯支持API、SDK、私有部署等多種接入方式,且支持垂直領域的快速模型定制,能夠滿足不同群體和不同行業的翻譯需求。

  在視頻翻譯場景,火山翻譯提供簡單高效的視頻“轉寫-打軸-翻譯”全流程服務,輕松聽譯、智能打軸、高效編輯、專業審校,集四大能力于一身,幫助創作者輕松高效地應對跨語言視頻創作。

  在語音翻譯領域,火山翻譯的智能同傳技術也表現卓越,能夠根據現場發言提供高品質、低延時的實時語音識別字幕結果,同時提供人工字幕保障方案,讓會議現場以及直播字幕更精準流暢。

  火山翻譯的技術來源于字節跳動團隊多年機器學習和自然語言處理領域的深耕。團隊擁有百余項技術發明專利,在人工智能頂級國際學術會議發表50余篇學術論文。在機器翻譯技術上更是獨創了mRASP多語言預訓練算法,把幾十種語言語料融合在一起訓練,獲得的模型在具體語對上微調取得了44個語對的業界最佳性能,整體效果力壓Facebook研發的mBART方法。同時,火山翻譯研發的LUT和COSTT語音到文本翻譯算法,從語音輸入(例如英語)可以直接輸出目標語言文字(例如中文),減少了錯誤累積,在效果上取得了業界領先。

  字節跳動杰出科學家、人工智能實驗室總監李磊稱:“火山翻譯核心優勢在打造前沿研究、產品研發和用戶反饋的閉環,研發團隊分布全世界多個國家,工作中也在使用自己打造的產品來跨語言溝通,在迭代中快速進步。”

  火山翻譯團隊還研發了多項機器翻譯前沿技術,目前已經集成到火山翻譯系列產品中,例如鏡像式生成模型MGNMT、CTNMT算法、交互式翻譯算法CAMIT、膠囊翻譯網絡、并行翻譯算法PNAT和GLAT等。火山翻譯還采用了自研的高性能序列推理引擎LightSeq,推理速度業界最快,比原生系統提高10倍,可以達到每秒兩萬詞的翻譯速度。

  李磊表示:“火山翻譯已經為飛書、今日頭條等多款海內外產品提供穩定和高質量的翻譯服務,每天處理數億次翻譯請求,為來自全球的過億用戶群體提供優質的翻譯體驗。未來,火山翻譯希望為更多用戶提供服務,幫助用戶更高效地實現國際信息無障礙交流。”

特別提醒:本網內容轉載自其他媒體,目的在于傳遞更多信息,并不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

贊(0)
分享到: 更多 (0)
網站地圖   滬ICP備18035694號-2    滬公網安備31011702889846號
亚洲国产成人精品无码区在线网站| 日韩精品少妇无码受不了| 日韩AV片无码一区二区不卡| 精品久久久久久久免费人妻| 国产精品久久二区二区| 久久国产精品只做精品| 精品人妻系列无码人妻免费视频| 国产精品三级国语在线看| 99精品一区二区三区无码吞精| 午夜精品在线观看| 久久国产精品99久久久久久老狼 | 人妻AV一区二区三区精品| 日韩在线a视频免费播放| 精品国产乱码一区二区三区| a级精品九九九大片免费看| 日韩人妻精品无码一区二区三区| 久久精品人妻中文系列| 国内精品九九久久久精品| 久久精品日韩一区国产二区 | 人妻少妇精品专区性色AV| 久久精品中文无码资源站| 日韩人妻无码精品专区| 九九热视频精品在线| 国产成人精品男人免费| 99久久国产热无码精品免费| 四虎成人精品无码| 亚洲精品乱码久久久久久自慰 | 国产精品激情综合久久| 凹凸精品视频分类国产品免费 | 久久精品99久久香蕉国产色戒 | 国内精品久久久久影院免费| 国产精品极品美女自在线观看免费| 精品乱人伦一区二区| 日韩乱码人妻无码系列中文字幕| 精品国产一区二区三区香蕉事| 无码国产精品一区二区免费式影视| 久久er99热精品一区二区| 久草视频这里只有精品| 日韩一级精品视频在线观看| 国产精品原创巨作av女教师| 中文字幕日韩精品在线|