10月22日,在2016英特爾中國行業峰會的“互聯網高峰論壇”上,搜狗公司首席架構師周天凌發表了“智能時代的搜狗企業搜索”主題演講,面向參會的數百家企業首次深入介紹了搜狗企業搜索業務及優勢,受到了與會者的關注并引發了現場熱烈討論。

(搜狗首席架構師周天凌演講現場照片)
搜狗搜索是中國第二大搜索引擎,從2004年上線至今已經超過12年,用戶數高達5.6億,覆蓋中國95%的互聯網用戶。搜狗企業搜索則是其近期推出的面向企業級客戶的新業務,在自身追求技術創新突破的同時,搜狗搜索把搜索引擎組件化、平臺化、服務化,形成了對各個網站的搜索開放能力,致力于為社會機構、企業及組織提供先進的搜索技術支持與服務,以期為更多合作伙伴的直接用戶帶來站內搜索體驗的升級。
論壇上,搜狗首席架構師周天凌表示,搜狗企業搜索將12年來搜狗搜索在To C領域所積累的成熟領先的技術進行輸出,應用最先進的大數據挖掘、自然語言處理、機器學習排序,以及最前沿的基于深度學習的語義計算等智慧搜索技術,幫助企業更好地讀懂用戶查詢背后真正的需求,并給用戶提供更精準的搜索結果,帶來搜索體驗升級。

(搜狗企業搜索展臺吸引了國內外行業用戶駐足)
針對企業搜索目前面臨的各種問題,搜狗企業搜索在為網站提供專屬搜索服務上優勢明顯,主要可以總結為幾個方面。
搜索結果的實時性、全面性
對于新發現的頁面,會實時進行頁面分析、建立索引并被用戶檢索到。頁面從發現到被檢索延遲在分鐘級內,一般重要頁面可以做到秒級延遲。根據具體情況,網站也可以將新增網頁實時推送至站內搜索系統,進而建立索引并被檢索,采用實時推送模式,頁面從產生到被檢索到的延遲可以控制在秒級內。
在對查詢意圖進行深入理解的基礎上給出精準結果
搜索系統會對用戶查詢進行多維度分析,包括查詢糾錯、實體識別、同義詞擴展以及查詢意圖識別等,并根據查詢詞權重進行查詢改寫,以保證召回符合需求的文檔。進而會對召回的文檔進行與查詢的匹配計算,在計算時會融合多維度特征,包括頁面特征、文本相關性、查詢時效性、頁面權威度、用戶行為特征等進行深度學習排序,將最滿足用戶需求的文檔排在前面。
系統具有高可用性和穩定性
搜狗企業搜索系統繼承了搜狗搜索的高性能與高穩定性,在單節點千萬級網頁量情況下,用戶平均查詢時間在100ms左右。搜狗搜索系統經過了長時間、大數據量以及高壓力的考驗,對各種異常情況進行了完善處理,其系統穩定性在99.99%+。
系統對接方便,簡單易用
使用搜狗企業搜索系統,企業只需要提供網站數據以及進行結果展現。在數據提供上,用戶可以選擇數據推送和spider抓取兩種方式。另外,搜狗企業搜索提供了豐富的結果展現樣式,企業只需簡單調配顏色、添加網站Logo即可使用。
在提供基本搜索服務同時,搜狗企業搜索系統還提供了完善的監控與運營數據查詢功能。通過監控及統計系統,可以查詢檢索量、索引量、檢索耗時、熱搜詞等,及時掌握應用的運營情況,同時提供完善的監控報警及故障應急機制,保證應用的正常運行。
周天凌向與會者說明了搜狗企業搜索的發展歷程,并結合2016年4月搜狗企業搜索為清華校園搜索系統(http://search.tsinghua.edu.cn/)提供整套校園搜索服務的案例,對搜狗搜索成熟的校園搜索解決方案進行了展示。通過對清華校園網搜索日志進行分析,搜狗企業搜索總結出用戶檢索需求主要分為導航類、信息公告類查詢、人物類查詢幾種,并針對這幾種查詢需求演示了具體的解決方案。
例如,對于查詢詞“美院”,搜狗企業搜索引擎對其進行查詢分析,將其擴展為“美術學院”,同時對官網頁面及時效性頁面進行分析并與查詢詞進行匹配計算,最終返回用戶所需要的文檔,效果如下圖所示。
信息公告類查詢是學校師生需求比較強的一類查詢,從檢索日志中可以看出,有大量的查詢公告的請求,比如“暑期夏令營”、“暑期社會實踐”、“畢業離校通知”等。搜狗提供的站內搜索系統可以做到將頁面秒級內建立索引并被檢索,保證結果的時效性。此外,為了能夠讓用戶更好檢索到最新信息,搜狗提供的站內搜索引擎在顯著位置設置了時間篩選功能,比如查詢“領軍計劃初試結果”,可以進行“一天內”或者“一周內”等篩選,以便更精準獲取所需結果。

(清華大學官網搜索結果截圖)
除了搜狗企業搜索本身的優勢介紹之外,周天凌還提及了搜狗在技術研發方面的實力背書,據悉,2015年搜狗的2400余名員工中,研發人員所占比例高達76%,中國所有互聯網公司中排名最高;技術專利排名行業第3,僅次于騰訊、百度。
現今,越來越多的網站對于搜索功能有更高的需求,而真正實用的搜索功能不只是查詢詞的精確匹配,還需要對用戶的查詢以及要檢索的文檔進行理解,并進行多維度的相關性計算,找出真正滿足用戶需求的文檔,而這涉及到了計算機科學與技術領域最前沿、最復雜的技術。搜狗搜索具有強大的技術團隊以及技術積累,并且具有成熟的技術輸出經驗,有能力并且有意愿為社會機構、企業及組織提供先進的搜索技術支持與服務,為更多合作伙伴的直接用戶帶來站內搜索體驗的升級。
特別提醒:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。