1月21日,全球OCR領(lǐng)域公認最權(quán)威的學(xué)術(shù)會議“2017國際文檔分析與識別大會(ICDAR)”揭曉2017ICDAR競賽結(jié)果,360企業(yè)安全人工智能團隊?wèi){借深度學(xué)習(xí)OCR技術(shù)獲得自然場景中文文字識別比賽第一名。 ICDAR專注于文本領(lǐng)域的識別與應(yīng)用,有OCR領(lǐng)域的奧斯卡盛會之稱,是全球OCR領(lǐng)域公認最權(quán)威的學(xué)術(shù)會議之一,由其組織的RCTW-17競賽也是當(dāng)前OCR技術(shù)領(lǐng)域全球最具影響力的比賽之一,競賽中的諸多方法對文字識別技術(shù)的發(fā)展具有強大推動力。高技術(shù)難度、強大實際應(yīng)用性,也使該盛會受到科研院校、科技公司等的關(guān)注,至今已有89個國家的3500多支隊伍參與。
ICDAR官網(wǎng)公布的比賽成績單
360企業(yè)安全人工智能團隊參加的專門針對中文識別的“端到端識別任務(wù)”是該項賽事的高難度項目,評測和檢驗的是對自然場景和網(wǎng)絡(luò)圖片、以及復(fù)雜視頻中的文字的提取和智能識別能力,比賽中主辦方會提供街道視圖、海報、菜單、室內(nèi)場景和屏幕截圖等大規(guī)模的圖片,這些圖片中文字有傾斜、垂直、不同字體、各種清晰度等非常不規(guī)則和多樣化的形態(tài),是傳統(tǒng)OCR無法提取和識別的,這也是人工智能技術(shù)應(yīng)用的一個重要方向。
最終360企業(yè)安全人工智能團隊?wèi){借在深度學(xué)習(xí)領(lǐng)域的深厚技術(shù)積累和應(yīng)用實踐獲得了該項目的冠軍。并同時獲得了另一個項目“文字檢測任務(wù)”的第四名。
ICDAR官網(wǎng)公布的比賽圖例
該團隊負責(zé)人王占一表示,OCR技術(shù)可以廣泛應(yīng)用于卡證類、票據(jù)類的文字識別、車牌檢測識別、商標(biāo)識別、道路標(biāo)識識別、自動駕駛等,大大提升產(chǎn)品檢測識別效果和用戶體驗,降低人力成本。360企業(yè)安全的深度學(xué)習(xí)OCR技術(shù)適用于政企機構(gòu)的數(shù)據(jù)防泄露和網(wǎng)站內(nèi)容違規(guī)監(jiān)測中,對代碼、郵件、文件等不同類型的文檔進行分類,然后識別發(fā)現(xiàn)文檔中的違規(guī)行為,對違規(guī)文檔進行過濾;標(biāo)記被監(jiān)測網(wǎng)站中的圖片,對圖片中的違規(guī)、違法、色情的文字內(nèi)容進行識別發(fā)現(xiàn)。