Facebook因裁撤“熱門話題”人工編輯團隊導致平臺出現(xiàn)假新聞和一張普利策獲獎?wù)掌凰惴ㄕJ定是情色圖片直接刪除等負面消息,成功激起民憤。而比“憤怒的網(wǎng)民”更難以平復的,是“全權(quán)交由機器算法來決定新聞內(nèi)容的熱門程度是否真的可取?”這一話題引發(fā)新聞界業(yè)內(nèi)熱議。

一點資訊算法總監(jiān) 王元元
一點資訊算法總監(jiān)王元元在日前舉行的首屆“一點+媒體沙龍”上指出,移動互聯(lián)網(wǎng)時代,單純依賴編輯經(jīng)驗的內(nèi)容分發(fā)效率低下,這也是機器逐漸取代人工分發(fā)成為資訊客戶端內(nèi)容分發(fā)主要模式的重要原因。但另一方面,一味仰賴話題數(shù)據(jù)指標和話題相關(guān)性的算法分發(fā),容易帶來內(nèi)容品質(zhì)的下降,導致為滿足用戶碎片化閱讀時間和共性需求的標題黨、低俗文章、無營養(yǎng)的雞湯文大行其道。
因此,尋找人與機器算法之間的平衡之道,成為移動新聞甚至整個移動閱讀領(lǐng)域的未來趨勢。
碎片化時代下,人工編輯與機器的優(yōu)勢和陷阱
如今,人工智能概念已在科技、醫(yī)療、教育、購物、交通等各個領(lǐng)域落地,而機器在內(nèi)容領(lǐng)域的應用則讓內(nèi)容分發(fā)更加高效。細心的人會發(fā)現(xiàn),現(xiàn)在隨便打開一個視頻網(wǎng)站或新聞資訊APP,都會有“個性推薦”或“猜你喜歡”,系統(tǒng)會根據(jù)你的瀏覽記錄,自動為你推薦內(nèi)容。
王元元認為,這主要源于人工編輯在移動時代碎片化信息獲取中暴露的劣勢和短板:一方面,人工能干預的內(nèi)容數(shù)目受限,往往集中于最熱門的頭部內(nèi)容,無法滿足跟用戶生活、工作相關(guān)的,甚至更長尾的價值內(nèi)容;另一方面,以編輯經(jīng)驗主導的各大門戶的首頁呈現(xiàn)“千人一面”的特征,無法提供個性化閱讀體驗。
那么,人工智能在個性化資訊推薦中究竟肩負了哪些責任?王元元認為,人工分發(fā)的上述兩個不足,正是機器所擅長解決的。原因在于,一方面,機器分發(fā)能夠?qū)A績?nèi)容進行深度加工,包括提取分類、主題、標簽、風格等結(jié)構(gòu)化信息數(shù)據(jù),能使得算法更高效的調(diào)度流量,利用用戶的行為探索并發(fā)現(xiàn)有潛力的內(nèi)容;另一方面,機器排序徹底解決人工排序問題:算法排序的核心是根據(jù)用戶、內(nèi)容、上下文信息決定實時計算每個內(nèi)容的得分進行排序,結(jié)果是個性化的;此外外,模型的更新也是實時的,能夠充分的利用已有數(shù)據(jù),最大化優(yōu)化分發(fā)效率。
但機器并非萬能。盡管機器在內(nèi)容分發(fā)領(lǐng)域帶來極大的效率提升,要做到完全取代人工編輯仍困難重重。原因在于,單純依賴用戶瀏覽行為進行個性化推薦的邏輯雖然切中了人性弱點,卻也非常容易帶來內(nèi)容品質(zhì)的下降。
“基于一個類似黑盒子的算法模型,機器能夠讓用戶持續(xù)不斷的發(fā)生點擊行為。但純粹從模型驅(qū)動,就會導致用戶被數(shù)據(jù)欺騙,淪為‘烏合之眾’。用戶的點擊的欲望是有的,但其產(chǎn)生的價值其實是非常難衡量的”,王元元進一步解釋。
“現(xiàn)在,盡管你在Facebook上所看到的內(nèi)容大多依靠算法根據(jù)用戶興趣來進行挑選,但人工編輯也在驗證下恢復地位。而人工智能時代的到來讓我們看到了一個全新的機會——人工智能與專業(yè)編輯、領(lǐng)域?qū)<液陀脩舯旧斫M成的人工的結(jié)合,造就了人類閱讀的‘奇點’。”王元元認為,只有“人機”智能的結(jié)合,才能同時提供規(guī)模化、個性化、乃至基于人性的兼具價值與實用性內(nèi)容的大量產(chǎn)出。
一點觀:人機結(jié)合重構(gòu)資訊閱讀未來
與一般具備個性化推薦功能的移動閱讀客戶端不同,一點資訊憑借用戶興趣搜索+訂閱不同主題內(nèi)容的用戶興趣主動表達的“興趣引擎”,可以發(fā)現(xiàn)更加真實、完整的用戶畫像,為其推薦除了熱點、爆炸性新聞之外的更有意義和價值的信息,提供兼具共性與個性的移動價值閱讀平臺。
通過機器算法幫助用戶從海量信息中找出真正有趣有料有用有品的內(nèi)容,再根據(jù)用戶興趣圖譜推送,是一點資訊的平臺核心技術(shù)優(yōu)勢。而人工編輯、領(lǐng)域?qū)<疑踔劣脩舢a(chǎn)生的海量興趣數(shù)據(jù)對機器進行訓練,讓機器能夠更加精準地將具備價值性的內(nèi)容有效分發(fā)給對這部分內(nèi)容資訊、視頻及其他內(nèi)容載體端真正有需求的用戶。這也是一點資訊與單純?yōu)榱嗽黾佑脩羰褂脮r長而選擇基于人性弱點來推薦內(nèi)容的平臺的最大區(qū)隔。
一點資訊將機器學習+人工訓練的“人機智能”率先應用于移動資訊領(lǐng)域,致力于幫助用戶更好的發(fā)現(xiàn)、表達、甄別、獲取和管理對自己真正有價值的內(nèi)容,引導了用戶在移動端的深度閱讀行為,帶來深度內(nèi)容閱讀在移動互聯(lián)網(wǎng)的延伸。
以一點資訊上基于普利策新聞獎的機器學習和個性化推薦為例,人工編輯將上萬篇包括普利策新聞獎在內(nèi)的優(yōu)質(zhì)文章輸入內(nèi)容庫用以訓練機器,讓機器通過尋找其中共性,學習篩選具備同類文章特質(zhì)的優(yōu)質(zhì)內(nèi)容形成“品讀”系列的內(nèi)容分類器。
目前,人機結(jié)合下的內(nèi)容分發(fā)質(zhì)量提升已初獲成效。一點資訊官方數(shù)據(jù)顯示,品讀系列與客戶端平均水平對比下,單篇文章閱讀時長提升93.1%;單篇收藏量數(shù)比例提升208.2%。在海量文章中篩選更多高質(zhì)量的內(nèi)容,為用戶進行基于自身興趣的價值內(nèi)容推薦,是一點資訊在擁有人工智能先進技術(shù)下的創(chuàng)新愿景。
作為一家集搜索引擎和個性化推薦于一身的下一代內(nèi)容平臺分發(fā)平臺,一點資訊自誕生時就具備人工智能的基因,其全球首創(chuàng)的“興趣引擎”技術(shù)擁有30多項國際專利。王元元表示,“在現(xiàn)下這樣一個浮躁的時代,用戶的閱讀呈現(xiàn)碎片化、娛樂化,我們一點資訊的挑戰(zhàn)在于怎么樣喚醒用戶,讓用戶能夠感知到在消費那些跟自己毫不相關(guān)的娛樂八卦熱點新聞的同時,仍然有這么一個平臺能夠提供除了有趣有料,還有用有品的價值內(nèi)容。”
特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關(guān)內(nèi)容。本站不承擔此類作品侵權(quán)行為的直接責任及連帶責任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系我們,本站將會在24小時內(nèi)處理完畢。