聯系我們

扭曲的條形碼,逃不過人工智能的火眼金睛

2021-04-17

先行示範區的這片沃土(tǔ)上,綠樹(shù)成蔭,清風拂面,一片生機盎短來然的景象。作為空氣質量最好的一線城市,深圳藍屢屢沖上熱搜,這是大家空美都向往的深圳,我們的生活環境在變得越來越好,路短我們的生活方式在變得越來越智能。現如(rú)今,是“一物一碼”的物聯費間網時代。條形碼、二維碼就是物品的身份證、通(tōng)行證,人機北很對話已不是科幻電影中(zhōng)的場景,萬物互聯“能碼皆碼”。 也子;

我們的生活越來越智能便捷,我們的工作方式同樣也是如(技是rú)此。現場大會越來越少(shǎo),視頻慢議會議越來越多。辦理證件已不用去市政大廳,兵機直接在官網提交資(zī)料,等郵政上門送件即可(什為kě)。同樣工作人員也無需再人工審核紙(zhǐ)質材料,分門服還别類辨認真僞,直接通(tōng)過系統審核即可快器(kě),這樣既縮短(duǎn)了核驗時間,也避免了人為差錯。

但問(wèn)題也随之而來。如(rú)果這個(gè)物品條碼說和打歪了,标簽貼錯了,出現張冠李戴,混淆視聽事刀的情況,或者出現更多不确定的問(wèn)題怎麼辦呢(ne)?别擔心,有了人工技舊智能的加持,物品的“身份證”錯不了,再扭曲也逃綠錢不過人工智能的“火眼金睛”。

為了更好地服務企業(yè),國家超級計算深圳中(zhōng)心啟化放動(dòng)“智能服務與決策支持平台”項那話目,成功開發“物碼智能識别系統”,能夠“全亮快天候”應對各種複雜的識别、驗證問(wèn)題,大幅提高了辦件效區書率,也在信息真實性的核驗上大有作為,具體應用場景見下(xi呢跳à)文(wén)。

 

扭曲的條形碼也能被人工智能“抓住”

原本企業(yè)申請科創委項目時,需要打印出去務填好的項目申請書,到現場提交,并等待工作人員核驗各項信息。有姐麗了“物碼智能識别系統”以後,企業(yè)申請項目時,隻需要在系統爸務中(zhōng)上傳帶簽字、蓋章的申請書掃描件,工作人員在系統中拍師(zhōng)對申請書進行審核即可(kě)。

每份申請書上有一個(gè)專屬的條形碼,它相公得當于項目在系統中(zhōng)的“身份證”。萬物皆可(kě)碼,分報這一回我們将條形碼技術(shù)帶給了科創委業(yè)務申請系統,技但加上了專屬條形碼的申請書是這樣的。


圖1. 一份完美的申請書辦件

這是一份完美的申請書,頁面平整條碼清晰,但在實際操作過程中(zhōng),我還說們發現并不是每一份申請書都能按照規定格式上傳。盡管線上上傳申請書讓申道去請流程方便快捷了許多,卻帶來了一些新的問(wèn)題。

(一)傳錯文(wén)件,申請失敗

當企業(yè)希望同時申請科創委的多個(gè)項目時,申請書會有多份,上區在上傳過程中(zhōng)由于人員疏忽傳問音錯申請書,造成項目申請書與對應的項目編号不文錢匹配。文(wén)不對題,A題目答上了B内容,B題目答成了C你女内容,C題目答為了A内容,造成文(wén)檔舞歌交叉犯錯,這樣所有的申請書都白做了,最終一個(gè麗冷)項目都沒申請成功。實踐中(zhōng)存在大量類似問(wèn)題。


圖2. 現實中(zhōng)經常發生的不匹配錯誤,浪費申報到要人的時間,也給整個(gè)申報流程帶來諸多不下知确定因素

(二)惡意上傳,系統崩潰

如(rú)果說以上是粗心犯錯,那這一種情況可(kě)能是“有心犯錯”,或受我答黑客控制上傳虛假文(wén)件“欺騙”系統,飛白企圖以假亂真,考驗系統的“智商(shāng)”。這種情況造成了大冷商量的網絡空間浪費,大量無效的文(wén)檔資(zī)料占據了空間,有光就效的資(zī)料想上傳卻上傳不了,系統擁擠網絡崩潰,還大幅海紅增添了後期審核的成本。


圖3. 現實中(zhōng)存在的“惡意”上傳頻錯破壞系統的情況,導緻系統經常宕機;此問(wèn)件筆題也是“雲”環境中(zhōng)的普遍存要算在的嚴重隐患

(三)文(wén)件扭曲、識别困難

大多數申請書采取手機拍照再上傳的方式。但由于拍攝角度的不同、拍攝光線是否充足舊外、圖片的像素是否足夠,等等,這些因素都會影響上傳兵時辦件最後的質量。這樣的掃描件可(kě)能會存在畫面不夠清晰、訊坐多噪點、扭曲變形等問(wèn)題,從而給系統定位、識别條形碼森金增加了難度;現實中(zhōng)此類文(wén)件的識别成能匠功率僅為1%。


圖4. 各種不确定的情況造成的文(wén)件扭曲,導緻系統識别風唱困難;糾錯過程浪費大量人力物力

此外,由于企業(yè)上傳提交的掃描件并非标準化、統一的,掃描件清晰行的度不一,條形碼也可(kě)能存在扭曲的情況,各種人為錯誤和(hé)非人為因素工醫錯綜複雜摻和(hé)在一起,給系統識别、認清條形碼帶來了很大的難度唱窗。

怎麼解決這些問(wèn)題呢(ne)?


成功率99.53%!多機器(qì)學習模型協作實現解碼

辦法總是有的,國家超級計算深圳中(zhōng)心提多黑出用基于機器(qì)學習的條形碼識别技術(shù)解決問(wèn)題。通(t影秒ōng)過使用FASTER-RCNN模型,快速定位條形碼,提取得到條形外吧碼。參考人臉識别技術(shù),使用自監督學習訓練Triple花好t網絡模型,最終判别提取的條形碼與項目編号是否匹配。在實踐中(zhōn哥票g),企業(yè)在系統上傳簽字、蓋章的掃描件後,系統将首先定位紙(z做理hǐ)質掃描件上的條形碼位置,提取出條形碼,與正确的條形碼書時庫進行分析比對,從而核實該申請書與系統中(zhō熱和ng)留存的項目編号是否匹配。

條形碼識别包括了定位和(hé)判斷兩個(gè)任務:區多定位是高精度的單目标檢測問(wèn)題,判斷是無監督數據的二分類問(理物wèn)題。本項目摒棄了常用的降噪、補全等圖片修複技術(shù),通(國快tōng)過對FASTER-RCNN模型的調整實現了條靜和形碼在文(wén)件中(zhōng)的精确定位。Triplet網絡模通紙型通(tōng)常用于目标跟蹤、人臉識别間生等領域,本項目将其應用于物碼識别領域。通(t女醫ōng)過自監督學習挖掘出條形碼特征,分析比對爸機錨樣本與正負樣本間的距離(lí),最終判斷待檢樣本是否匹配,準确率達到99車市.53%。圖5給我們展示整個(gè)系統的工作流程。


圖5. “物碼智能識别系統”的應用架構

在實踐中(zhōng),這項基于機器(qì)學習的條形碼制去校(xiào)驗技術(shù),定位并識别掃描件中(zhōng)條形碼的成功率笑個達到99.53%,接近100%。該方法簡潔兵麗高效,部署成本低、使用門檻低、維護成本低、占用系統資(z市從ī)源少(shǎo)。不僅如(rú)此,還節省了人力成本。據科創委數據統計,2信山020年,企業(yè)一共上傳了近3萬個(gè)掃描件,人工校(xiào子鐵)驗(速度為5分鐘/件),需要310人工作1天,使請樹用機器(qì)學習的校(xiào)驗技術(shù),僅需要2人工作短玩1天。


圖6. 新系統大幅降低了各項成本,無論是申報者還是系統維護人員都新錢會感覺輕松很多;本項目是人工智能技術(shù費開)一次“接地氣”的實戰

機器(qì)學習技術(shù)對于有噪點、術新拉伸和(hé)扭曲等低質量圖片有很好的魯棒性,可(kě下好)以避免出現企業(yè)反複掃描、上傳占用空間、多次識别的問拿廠(wèn)題,使得大規模使用“上傳掃描件友廠”替代“遞交紙(zhǐ)質件”成為可(kě)能,讓企業(yè)“少(s慢業hǎo)跑腿”,讓數據“多跑路(lù)”。

“物碼智能識别系統”隻是我們在“智能服務與決策支持平台”項目中得弟(zhōng)邁出的一步,在此基礎上我們将繼續開發完善平台的其他功長算能,真正把高端技術(shù)下(xià)沉河小到實際應用中(zhōng)去“接地氣”,為終端畫理用戶提供更好的交互體驗,節省企業(yè)成本、提高辦事效率。

科技向善,引領未來!未來已來,你(nǐ)準備好了嗎?


國家超級計算深圳中(zhōng)心于2009年獲國家科技部批準成立,是深圳建市以來規模最大的國家級重大科技創新基礎腦店設施,是深圳先行示範區的創新名片。超算中(zhōng)心堅持以技術暗制(shù)為引領、以市場為導向、以品質為追求、以服務為根本,在外關科學計算、工程計算、生物醫藥、動(dòng)漫渲染、海洋石油等領域支持能跳國家科技創新,成果卓著。深圳超算是世界上最早布局雲計算、大數據得腦、人工智能的超算中(zhōng)心之一,建立之初,聯合相關(guān呢小)企事業(yè)單位,開展智慧城市等方面技術(shù)創新與服務。深圳公文城安雲已經在為每一位市民保駕護航,深圳健康雲正在努力削平醫療資(zī)源和(hé分好)服務的不均衡,深圳教育雲将讓中(zhōng)學生票煙來揭示AI的奧秘。目前中(zhōng)心雲計算、大數據和(hé)人工智能機構用戶超過2萬家,個(gè)人用戶超過1200萬人。

誠聘英才
友好鍊接
業(yè)務咨詢及參觀訪問(wèn):0755-8657608放飛5    0755-865用森76086    地址的民:深圳市南山區笃學路(lù)9号
國家超級計算深圳中(zhōng)心(深圳雲計算中(zhōng)心)&nb刀行sp; ©2014-2020&n物花bsp; 粵ICP備10220126在爸号