華宇材料識別系統是基于深度學習的AI引擎,利用圖像OCR、基于深度學習的圖像分類和目標檢測、實體識別等技術,針對卷宗等材料實現智能識別分析,使卷宗材料具有更好的利用價值。華宇卷宗識別引擎具有4大模塊(10大核心能力):材料類型識別、材料內容識別、材料優化治理、材料關系判定。
1. 對卷宗材料進行分析并輸出材料的類型、材料的屬性及材料的標題等信息,為上層應用提供底層支撐。目前積累了近4000種材料類型的識別,基本可以覆蓋公檢法司常見材料類型(法律文書、審批表單、制式文件),也支持對證據材料及偵查過程中涉及的通用材料(卡片證照、表單票據、網絡圖片、場景、人、物品)進行識別。
2. 通過對材料內容的設定,并對大量材料的標注、特征抽取、訓練,在感知層實現對圖像特征信息的識別和定位,對材料整體內容進行分析并識別,將識別的結果反饋給上層應用。目前支持對結構化信息、指紋、印章、二維碼、頭像、手寫簽名等內容進行識別,并可根據需要設定識別模板,不斷豐富支持的材料種類及材料的內容。
3. 材料優化治理利用邊緣檢測法、虛化檢測法等技術,對卷宗中黑邊嚴重、空白頁、圖片歪斜、像素低下、圖片模糊不聚焦等圖片效果不好的材料,進行優化處理,提高材料的可利用性。
目前材料類型覆蓋4000余垂類材料類型。
優化材料質量后對材料命名并對材料中的目標信息,結構化信息精準提取,提升實體材料的應用價值。
支持多種模板定制,可根據實際情況配置,滿足多樣化需求,覆蓋更多的場景。
學習能力的提升和性能不斷提升,反饋結果速率及準確率不斷攀升。