8月29日的“ABC SUMMIT 2019”百度云智峰會在京舉行。百度智能云帶著20大新產品,與近萬名的客戶、合作伙伴及開發者們共同見證了這場席卷而來的“人工智能工業化”時代浪潮。
而在智能視頻展臺及智能視頻分論壇,備受關注的百度智能云短視頻解決方案以智能、創新、開放、便捷的姿態重磅亮相。

一站式智能小視頻解決方案,助您一天搭建短視頻業務
隨著大視頻時代的到來,短視頻已應用到各類場景中,不論是以短/小視頻內容運營為主營業務的APP,還是美食、母嬰、電商、生活等垂直APP,紛紛以短視頻UGC/PGC的方式,爭奪用戶時長,增加用戶粘性。而據第三方數據顯示,2018年短視頻行業月獨立設備數已近7億臺,2019年更是持續增長。
百度智能云構建了智能小視頻端到端全鏈路解決方案,提供了采、編、播、管、存、發等短視頻一站式服務,開發者僅需簡單幾步即可拉起一個短視頻APP。在短視頻競爭白熱化的階段,讓您能更快更高效的上線短視頻業務,專注業務運營,贏在起點。

智能小視頻解決方案涵蓋了移動端和服務端,移動端包含了短視頻創作SDK、播放器SDK、FEED流、完整APP模版,服務端包含了短視頻的管理、存儲、轉碼、抽幀、審核、去重、標簽化、分發、個性化推薦等。其中,短視頻創作SDK提供了全面智能的AR特效和視頻編輯能力,激發用戶創新玩法,打造內容差異化。而MCT智感超清轉碼在保證同等畫質的情況下,大大降低了視頻碼率,大幅度降低了帶寬存儲成本。自動審核/智能去重/智能標簽更是提高了內容管理運營的效率和短視頻分發推薦的質量。
智能小視頻整體優勢如下:
全面賦能:全面的能力矩陣,端到端全流程解決方案,AI加持,全面賦能創業團隊;
簡單快捷:標準易用的配置操作引導,短視頻業務上線,快人一步;
創新引領:最智能的AR特效拍攝工具,最IN的視頻生產玩法,引領業界風向標;
開放源碼:APP模版和對應server服務開放源碼,方便個性化定制開發;
短視頻+AR,激發內容創作新玩法
移動端短視頻創作SDK結合了DuMix AR 5.0人臉肢體手勢環境一體化交互技術,讓視頻拍攝更美、更具趣味性。
人臉特效能力能精準定位150個2D關鍵點,涵蓋78個骨骼關鍵點,能輸出3D人臉姿態。對于嘴部和眼球這兩個最“出戲”的部位,我們提供了更加精準的解析,以保障應用層可實現更多更優的玩法。此外,我們還對人臉平面進行了三角剖分,分成264個三角形,并進行了5210個三角形人臉立體剖分,基于這個面部網格可以制作各種2D/3D貼紙、臉部變形等其他拓展。
同時,我們預設了32個人臉表情基和15個表情語義,包含如微笑、大笑、睜眼、閉眼等一些常見的表情。通過內置的19套塑形參數、5種基礎美妝、3D立體妝容等更加高階的能力,可以滿足開發者對于人臉特效玩法的各種需求,如美妝美體、微整形、多人實時換臉和個性化美顏需求等。并且在應對光照劇烈變化、大角度追蹤、抖動遮擋這些復雜情境都能表現出很強的穩定性和魯棒性。

手勢特效預設了8種手勢語義,包含21個關鍵點,能夠復原出3D的手掌姿態;肢體特效提供59個輪廓點、d18個關節點兩種輸出方式,其中18個關節點的識別速度,全機型測試最多不超過6.7毫秒;人像分割更是達到IOU 93.76%的高指標。
從人體跟蹤到物理世界大場景跟蹤,依靠低成本的地圖采集和在線融合跟蹤方案,百度AR推出了VPAS視覺定位與增強服務,用戶在打開時省去了掃描平面這一步驟,體驗路徑更加順暢。開發者可以在真實世界中構建更加宏大的虛擬場景,我們提供的實時渲染能力對于26萬面大場景在普通手機上的渲染幀率也達到了30fps。


開放架構+創意工具+生態閉環,自主可控,靈活擴展
大多數廠商的短視頻AR特效SDK是以一個黑盒的方式提供給開發者,開發者無法融入自己更多的算法和能力,無法靈活擴展迭代自己的需求,只能強依賴于供應商的迭代速度和基礎能力。因此,為了降低使用門檻,讓開發者們自主可控,百度DuMix AR平臺對架構進行了整合和改造,確保開發者可以自主高效地進行能力和玩法擴展。
如下圖所示,在算法層,開發者可以靈活加入自研或外采的其他算法和能力;在架構層,提供了標準的管線搭建API、算法調度API、場景操作API以及易擴展、可編程的渲染管線;在應用層,針對不同需求的互動特效貼紙的制作者,百度DuMix AR特效開放平臺也提供了兩套不同的工具:具備創意技術能力的PGC企業組織可以應用Maya插件工具進行內容制作,也可以通過生態合作伙伴進行定制化生產;而廣泛的個人開發者則可以使用PC端的編輯器DuMix AR Studio和移動端預覽工具DuMix AR Cam進行開發和實時調試。

AI賦能,讓視頻編輯更高效更便捷
除了AR特效外,百度智能云短視頻創作SDK工具還提供了強大專業的后編輯能力:
Vlog剪輯:支持多段視頻剪輯、拼接、添加、刪除,以及視頻/圖片混編,可靈活調整片段的順序,可進行畫面旋轉,可添加轉場特效,縮略圖時碼線可實時預覽視頻內容等。
雙語字幕:通過語音識別能力一鍵將語音轉化成文本疊加字幕,并通過智能翻譯自動實現雙語字幕。此外還提供了多種字幕包裝樣式,支持編輯字幕顏色、字體等,支持設置字幕背景、逐字運動等效果。
編輯特效:除了拍攝特效外,在視頻編輯階段,也提供了豐富的特效能力,包括:畫面特效-黑白、放大、靈魂出竅、抖動等;分屏特效-三屏、六屏、九屏特效等;時間特效-反復、變速、倒放等等;轉場特效-淡入、漸變等基礎特效和多種絢麗高級轉場。
時光相冊:利用AI圖像理解技術,根據人臉/地點等實現照片智能聚合,并根據風格內容理解,自動匹配最優的主題模版、標題字幕和背景音樂。
音頻編輯:我們聯合太和音樂提供了60w+的音樂版權庫,支持資源靈活對接和配置等。同時,我們提供音軌分離,多段音頻的剪輯,音頻的轉場特效等編輯能力。
百度智能云智能小視頻解決方案致力于將最IN最全最智能的服務開放給我們的客戶,發揮我們在AR、AI、渲染能力上的優勢,以最低的價格普惠廣大開發者。助您以最快的速度最低的成本上線短視頻業務,讓您專注于業務運營,實現商業價值最大化。
特別提醒:本網內容轉載自其他媒體,目的在于傳遞更多信息,并不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。