百度聯(lián)合主辦OCR領(lǐng)域頂級AI競賽ICDAR 2019,上百支精英團(tuán)隊(duì)挑戰(zhàn)超高難度文字識(shí)別
由百度聯(lián)合馬來亞大學(xué)、華南理工大學(xué)、西班牙巴塞羅那自治大學(xué)-計(jì)算機(jī)視覺中心、中國圖象圖形學(xué)會(huì)主辦的ICDAR 2019-LSVT(Large-scale Street View Text with Partial Labeling,弱標(biāo)注大規(guī)模街景文字)、ICDAR 2019-ArT(Arbitrary-Shaped Text,任意形狀場景文字)國際權(quán)威競賽任務(wù)于5月圓滿結(jié)束。此次競賽共吸引來自業(yè)界頂尖技術(shù)團(tuán)隊(duì)、高校及科研機(jī)構(gòu)共118支團(tuán)隊(duì)參賽,有效提交結(jié)果總計(jì)339個(gè)。經(jīng)過兩個(gè)月的激烈角逐,ICDAR 2019-ArT競賽五項(xiàng)子任務(wù)的冠軍分別由中科院(文字檢測)、曠視(Latin文字識(shí)別)、韓國NAVER(Latin中文混合文字識(shí)別)、北京航空航天大學(xué)(Latin文字、Latin中文混合端到端文字識(shí)別)獲得,ICDAR 2019-LSVT競賽文字檢測和端到端文字識(shí)別兩項(xiàng)任務(wù)冠軍由騰訊團(tuán)隊(duì)獲得。
精英薈聚ICDAR2019 桂冠引群雄爭奪
ICDAR“Robust Reading Competitions”競賽是評估自然場景/網(wǎng)絡(luò)圖片/復(fù)雜視頻文本提取與智能識(shí)別新技術(shù)進(jìn)展的權(quán)威國際賽事及評測標(biāo)準(zhǔn),競賽中涌現(xiàn)出諸多方法持續(xù)推動(dòng)業(yè)界新技術(shù)的創(chuàng)新與應(yīng)用。在ICDAR2019百度發(fā)布的兩項(xiàng)極具挑戰(zhàn)的競賽任務(wù)中, ICDAR 2019-LSVT競賽數(shù)據(jù)包括5萬張精標(biāo)注街景圖像、40萬張弱標(biāo)注街景圖像,聚焦探索大規(guī)模數(shù)據(jù)場景下深度學(xué)習(xí)文字識(shí)別能力極限。ICDAR2019-ArT競賽數(shù)據(jù)總計(jì)10176張,是業(yè)界最大的任意形狀場景文字集合,聚焦推動(dòng)自然場景下任意形狀文字檢測識(shí)別能力新突破。
各工業(yè)界與學(xué)術(shù)界頂尖團(tuán)隊(duì)充分發(fā)揮各自技術(shù)優(yōu)勢,針對競賽任務(wù)不斷優(yōu)化創(chuàng)新方案與算法效果,經(jīng)過激烈角逐的比賽結(jié)果展現(xiàn)出大規(guī)模街景文字識(shí)別深度學(xué)習(xí)、任意形狀文字檢測與識(shí)別技術(shù)新高度。百度聯(lián)合學(xué)術(shù)界將持續(xù)對該競賽集合及榜單進(jìn)行維護(hù),為推進(jìn)相關(guān)視覺AI技術(shù)領(lǐng)域不斷發(fā)展貢獻(xiàn)力量。
圖1. ICDAR 2019-LSVT競賽結(jié)果示例:人工標(biāo)注 vs 算法效果
圖2. ICDAR 2019-ArT競賽結(jié)果示例:人工標(biāo)注 vs 算法效果
百度OCR實(shí)力強(qiáng)勁 多場景應(yīng)用實(shí)踐豐富
此次ICDAR 2019國際競賽任務(wù)推動(dòng)了大規(guī)模街景深度學(xué)習(xí)文字識(shí)別及任意形狀文字識(shí)別方向的發(fā)展,是一場學(xué)術(shù)交流與技術(shù)碰撞的盛宴。而在ICDAR 2019國際競賽中,百度OCR承擔(dān)競賽組織者角色,這也進(jìn)一步加強(qiáng)了百度的國際影響力。
百度曾在2015至2019年期間多次獲得ICDAR 2013、 ICDAR 2015、ICDAR 2017-MLT、ICDAR2017-RCTW權(quán)威集合檢測、識(shí)別、端到端各項(xiàng)任務(wù)榜單第一,處于業(yè)內(nèi)領(lǐng)先水平。近兩年來,百度OCR也多次在CVPR,ICCV,BMVC,ACCV,ICDAR等會(huì)議上發(fā)表論文,此次ICDAR 2019有兩篇新工作被接收。"An End-to-end Video Text Detector with Online Tracking" 致力于解決視頻OCR檢測問題,將視頻文字檢測和在線跟蹤任務(wù)高效集成到統(tǒng)一、可訓(xùn)練的網(wǎng)絡(luò)框架中。"EATEN: Entity-aware Attention for Single Shot Visual Text Extraction"提出端到端的結(jié)構(gòu)化信息提取方法,同時(shí)公開了結(jié)構(gòu)化信息提取領(lǐng)域的大型數(shù)據(jù)集合。
百度不僅致力于OCR技術(shù)領(lǐng)域的縱深研究,同時(shí)也是“領(lǐng)先且實(shí)用AI視覺技術(shù)”的堅(jiān)定實(shí)踐者。多年實(shí)踐經(jīng)驗(yàn)積累形成了豐富的百度OCR產(chǎn)品矩陣。通用系列文字識(shí)別能力不僅能高精度的識(shí)別文字,還支持中、英、日、韓、法等十國語言的識(shí)別以及置信度、位置等信息的返回;卡證識(shí)別能力不僅支持對身份證、銀行卡、護(hù)照、名片等常見卡證的識(shí)別,還支持卡證采集、分類、屬性判斷等能力;票據(jù)識(shí)別能力不僅支持財(cái)務(wù)場景全品類識(shí)別,還支持金融、醫(yī)療等場景票據(jù)識(shí)別;針對終端文字識(shí)別場景,百度領(lǐng)先的模型壓縮技術(shù)應(yīng)用于所有OCR終端產(chǎn)品,OCR終端SDK與多家手機(jī)廠商達(dá)成合作,將識(shí)字能力賦予手機(jī)。目前,百度OCR產(chǎn)品能力已超50項(xiàng),在各行業(yè)實(shí)現(xiàn)了諸多技術(shù)突破與產(chǎn)品落地,覆蓋了財(cái)務(wù)、銀行、醫(yī)療、政法、教育、交通、電商、快遞等場景。
未來,百度會(huì)與各企業(yè)持續(xù)探索OCR的落地可能性,讓OCR賦能更多企業(yè),同時(shí)也將持續(xù)秉持普惠的價(jià)值理念,在產(chǎn)業(yè)實(shí)踐中不斷打磨,持續(xù)賦能服務(wù)客戶,持續(xù)打造領(lǐng)先且實(shí)用的AI技術(shù),用科技的力量讓復(fù)雜的世界更簡單。
更多競賽詳情請見官網(wǎng):
ICDAR 2019-LSVT:http://rrc.cvc.uab.es/?ch=16
ICDAR 2019-ArT:http://rrc.cvc.uab.es/?ch=14
- 1-9· 多部門聯(lián)合印發(fā)指導(dǎo)意見 促進(jìn)數(shù)據(jù)產(chǎn)業(yè)高質(zhì)量發(fā)展
- 12-9· 三部門聯(lián)合關(guān)愛貨車司機(jī)保障合法權(quán)益
- 11-14· 路地聯(lián)合開展演練 提高自防自救能力
- 7-11· 2024長三角物流展完美收官,聯(lián)合新能源閃耀展會(huì),收獲滿滿
- 5-20· 五部門聯(lián)合開展2024年新能源汽車下鄉(xiāng)活動(dòng)
- 5-6· 北京車展最大“黑馬”——聯(lián)合新能源引領(lǐng)行業(yè)變革,攜手車企共贏換電新未來
- 4-26· 聯(lián)合新能源“1155”前端換電體系及10款全系車型全球首發(fā),轟動(dòng)2024北京國際車展
- 12-23· 前端換電 · 無限續(xù)航丨聯(lián)合新能源引爆2023中國國際換電模式產(chǎn)業(yè)大會(huì)
- 10-16· 京津冀聯(lián)合制定營商環(huán)境建設(shè)工作要點(diǎn) 聚焦5大重點(diǎn)領(lǐng)域
- 6-12· 推廣聯(lián)合河湖長制 長三角積極探索共同治水