時間:2022-08-26
隨著計算機神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)技術(shù)的普及,人工智能(AI)開始快速應(yīng)用到各個行業(yè)。世紀(jì)安圖作為深耕電子政務(wù)領(lǐng)域二十年的高新技術(shù)企業(yè),一直不斷地探索如何為政府部門提供高效可靠的政務(wù)服務(wù)軟件平臺。近期我公司研發(fā)的人工智能平臺,引入深度學(xué)習(xí)技術(shù),與傳統(tǒng)的OCR技術(shù)相結(jié)合,解決了傳統(tǒng)OCR識別準(zhǔn)率低的問題,讓政務(wù)智能審批真正落地,極大提升行政效能。
智能化政務(wù)審批,主要是需識別大量掃描圖片的內(nèi)容,與其它渠道獲取的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行比對,然后自動判斷申請材料是否正確、真實,大幅減少人工比對的工作量,提高審核效率。然而受掃描或拍攝設(shè)備及周邊環(huán)境的影響,掃描圖片并不是特別規(guī)范,存在傾斜、褶皺、拼湊、邊緣模糊等情況。文字內(nèi)容很多時候并不規(guī)范,存在換行、部分遮擋等情況。傳統(tǒng)的OCR技術(shù)識別文檔,一般是基于行掃描,將文字逐行識別出來。如果不對圖像預(yù)先定位和糾正,識別的性能會很低,而且所期望結(jié)果的準(zhǔn)確率也會比較低。計算機深度學(xué)習(xí)在目標(biāo)檢測上的優(yōu)勢,正好填補了OCR的不足,兩者結(jié)合可以大大提高識別效率和準(zhǔn)確率。

注:圖片來源于網(wǎng)絡(luò)
以身份證識別為例,市場上的身份證識別產(chǎn)品很多,但絕大多數(shù)是識別規(guī)范拍攝的身份證。而在政務(wù)審批的實際應(yīng)用場景中,申請人提交的很可能是這樣的掃描件:

我們利用計算機深度學(xué)習(xí)技術(shù),通過采集樣本進(jìn)行針對性的訓(xùn)練,可以讓計算機“認(rèn)識”圖片里哪一部分是身份證正面,哪一部分是身份證反面,然后將身份證部分裁剪出來,通過糾偏、遮罩等圖像處理,再用OCR去識別我們想要文字。

兩種技術(shù)結(jié)合,每張圖片識別速度在0.5秒以內(nèi),識別準(zhǔn)確率達(dá)到90%以上。針對政務(wù)智能審核場景,對于大多數(shù)業(yè)務(wù)而言,只要提交的材料沒有遺漏和嚴(yán)重污損,計算機比對成功的會自動審核通過,這樣可節(jié)省90%的人工核對工作量,實現(xiàn)真正的“秒批”。
深度學(xué)習(xí)技術(shù)在政務(wù)服務(wù)、違法預(yù)警、執(zhí)法舉證等很多方面都有適合的應(yīng)用場景。目前應(yīng)用的難點主要在于技術(shù)參數(shù)的調(diào)優(yōu)以及樣本獲取,我們將持續(xù)投入研發(fā)力量,并與客戶持續(xù)合作共同推進(jìn)人工智能在各個領(lǐng)域內(nèi)的深入應(yīng)用。
供稿:研發(fā)中心? 陳東
編輯:譚琳