今年盛夏,對于開發者們來說,最火爆的事莫過于7月4日、5日在國家會議中心舉辦的百度AI開發者大會。7000余開發者齊聚一堂,共同見證、探索百度AI技術的最新技術和進展。
在主論壇上,百度發布了百度大腦3.0,百度高級副總裁、AI技術平臺體系總負責人王海峰表示:“百度AI能力的核心是百度大腦,百度大腦3.0是百度AI能力的集大成者。”
王海峰介紹了百度大腦的演變歷程。百度大腦1.0完成基礎能力搭建和核心技術初步開放,2.0形成了完整的技術體系,開放60多項AI核心能力,3.0的核心是“多模態深度語義理解”,同時開放110多項AI能力。
百度大腦3.0的核心是“多模態深度語義理解”,指對文字、聲音、圖片、視頻等多模態的數據和信息進行深層次多維度的語義理解,包括數據語義、知識語義、視覺語義、語音語義一體化和自然語言語義等多方面的語義理解技術。王海峰表示,“多模態深度語義理解不僅能讓機器聽清、看清,更能深入理解它背后的含義,深度地理解真實世界,進而更好地支撐各種應用。”
數據語義化技術可以將大千世界中多元、異構和多模態的三元空間大數據,形成包含千億節點、萬億關系的龐大數據語義網絡,從中總結規律、提煉知識、發現價值,助力經濟和社會發展。而多元語義知識方面,百度已經構建了包含數億實體、數千億級事實的龐大知識圖譜。除了基礎的由實體、屬性、關系構成的實體圖譜,百度還針對不同的應用場景和知識形態,構建了關注點圖譜、事件圖譜、多媒體圖譜、行業知識圖譜等多種圖譜。所有這些知識,構成了百度大腦的基礎。

視覺語義化可以讓機器從看清到看懂視頻,并提煉出結構化語義知識。視覺語義化技術應用于世界杯視頻解析,能夠全面識別視頻中的球員、裁判、球、以及球門、球場線等人、物和場景,可以捕捉射門、進球、角球、任意球、換人等事件。基于這些語義化知識,既可以完成機器人自動解說,也可以進行精彩片段集錦、以及各種數據統計分析等。

語音語義一體化和自然語言理解技術能讓機器準確識別并理解人說的話,實現更自然的人機對話。王海峰介紹,百度高噪聲環境Hand-free語音識別準確率已提升了10個百分點;語音語義一體化技術使得遠場語音識別準確率提升了10個百分點;在語音合成方面,WaveNet+拼接的情感語音合成技術,使得流暢度和自然度也大幅提升。
王海峰以對話理解和閱讀理解為例,為大家介紹了領先的百度自然語言理解技術。百度的對話理解技術已經積累多年,通過研發最新的深層注意力匹配模型,比已知的最好結果又提升了4.1%。在閱讀理解技術上,百度大腦已經閱讀了千億量級的文章,相當于6萬個中國國家圖書館的藏書,并由此積累了億級實體、千億事實的知識。通過持續獲取和積累知識,百度大腦的理解能力不斷升級,智能水平顯著提升,進而能夠更好地服務用戶。
特別提醒:本網內容轉載自其他媒體,目的在于傳遞更多信息,并不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。