涌現科技
為全面數字化賦能的國民科技企業
隨著5G、人工智能、虛擬現實、超高清等技術的快速發展,視頻新型應用已經不再局限于娛樂場景,而是向工業制造、金融醫療、生產辦公等場景拓展。視頻大數據時代,視頻編碼的任務不再局限于節約存儲空間和傳輸帶寬,以及提供好的主觀質量,而且還要能為視頻分析處理需求提供更智能的視覺數據表示支撐,智能視頻編碼是視頻產業未來發展的必由之路。

作為國家高新技術企業,涌現科技一直處于智能視頻編碼領域創新研究的第一梯隊,創新性地定義了智能視頻編碼:智能視頻編碼是指同時面向人眼視覺和機器視覺,運用神經網絡等人工智能技術,改善甚至重構現有視頻編碼框架,實現智能視頻高效編碼以及視頻信息的高效處理。智能視頻編碼包含“AI for Coding”和“Coding for AI”兩個部分:
“AI for Coding”是指用AI來增強視頻編碼的效率和質量,同時滿足視頻處理中更廣泛的智能化需求。在執行信號壓縮任務中,對編碼場景、參數、模式選擇等信息進行面向應用場景和內容特征的分析,利用AI技術對去噪聲、圖像增強、細節改善等環節進行預處理,基于最佳模式的配置與編碼,實現精準化編碼控制,在壓縮效率、圖像質量、場景功能擴展上實現全面優化。
當前智能視頻編碼的主要應用為研究各類可替代或優化傳統編碼技術的神經網絡編碼工具,通過在各個編碼模塊中嵌入離線訓練好的神經網絡模型以提升編碼性能或進行編碼優化,比如AI視頻增強、ROI智能編碼、AI精準編碼、AI快速編碼等。

AI視頻增強:AI視頻增強技術通過在編碼環節對視頻進行預處理,能夠對采集設備較差、網絡環境欠佳、拍攝時間久遠等導致效果不佳的視頻進行優化,包括視頻降噪、去馬賽克、色彩增強、智能補幀等,能夠大幅提升視頻質量,優化終端用戶體驗;
ROI智能編碼:在云會議、安防監控等場景中,ROI智能編碼可以將動態的人物和近乎靜態的背景進行分離,并采用不同的編碼方式分開編碼整合,對關注度更高的人物區域進行針對性地畫質以及編碼參數調整,實現不同等級的碼率分配,有效實現編碼碼率和畫面質量之間的平衡;
AI快速編碼:當前的視頻編碼標準中編碼非常復雜,每個像素塊編碼都可以選擇不同的編碼模式,AI快速編碼利用神經網絡算法,能夠對多種可用編碼模式進行比較,并選擇最佳的模式,實現對每個像素塊的最優編碼,從而提升視頻編碼效率;
AI精準編碼:AI精準編碼能夠全面利用AI性能,實現像素塊級別的精準控制、分析和判斷,從而針對其信息特征進行專門的編碼優化,在控制碼率的前提下大大提升人眼視覺清晰度、流暢度的感知。
目前AI for Coding已經在互聯網視頻、云會議、安防監控、工業醫療等多個領域都有成功落地的技術應用,未來智能視頻編碼有望實現從端到端的全神經網絡編碼,從整體上對編碼框架實現最優設計。

傳統視頻編碼都是基于像素塊的處理,對像素塊做預測變換編碼,“Coding for AI”則為視頻編碼提供了全新的思路,即通過特征分析、特征提取,按照智能分析需求進行特征編碼,從而優化解碼應用端的智能分析過程,減少解碼端重復調用AI進行特征提取分析和處理,為后續針對性重構視頻場景、執行智能分析任務奠定基礎。
在執行智能分析任務中,完整的視頻信息中存在大量冗余,如果我們能夠實現針對所有特征信息的智能編碼,就可以大幅提升智能分析任務的效率。比如在人臉識別、AI質檢等任務中,算法只需要提取其中人臉或者產品瑕疵相關的特征信息進行判斷,從而簡化了任務處理流程,大量的冗余消除又降低了帶寬、時延等方面的要求,進一步提升智能編碼效率。

智能視頻編碼打破了傳統編碼模式下壓縮編碼與智能分析相割裂的“1+1”分布式模式,整合了編碼、重組、解碼及智能應用等視頻鏈環節,實現從視頻編碼到重構分析的一體化智構編碼,達到通用數據表示意義下媒體編碼與理解分析的統一,在節省存儲與傳輸寬帶成本、降低時延、保障視覺質量的基礎上滿足對視頻感知、分析、理解等智能應用方面的需求,將成為AIoT全場景下的視頻圖像人機高效處理的重要動力引擎。
隨著智能編碼技術的場景滲透和虛擬終端、VR/AR等下游新興市場的增量起勢,智能視頻編碼的市場規模加速提升。根據艾瑞咨詢測算,2021年中國智能視頻編碼整體市場規模為237億元,較2020年增長64.5%,預計2025年智能視頻編碼市場規模有望超600億元,基于智能視頻編碼及軟硬件整體解決方案衍生的泛視頻產業整體市場規模已突破萬億級別。未來,涌現科技將持續推動產品創新,深入“產學研用”深度融合,引領智能編碼行業,加速實現“智構視頻”,促進視頻產業高效、快速發展。