在全球OCR规模公认最权威的学术集会会议“2017国际文档阐明与识别大会(ICDAR)”中,北京奇安信科技有限公司(360企业安详团体)人工智能团队曾凭借深度进修OCR技能,得到自然场景中文文字识别角逐第一名。

ICDAR专注于文本事域的识别与应用,有OCR规模的奥斯卡盛会之称,是全球OCR规模公认最权威的学术集会会议之一,由其组织的RCTW-17比赛也是当前OCR技能规模全球最具影响力的角逐之一,比赛中的诸多要领对文字识别技能的成长具有强大敦促力。高技能难度、强大实际应用性,也使该盛会受到科研院校、科技公司等的存眷,至今已有89个国度的3500多支步队参加。

奇安信人工智能团队获OCR比赛冠军

 

图:ICDAR官网发布的角逐后果单

奇安信人工智能团队介入的专门针对中文识此外“端到端识别任务”是该项赛事的高难度项目,评测和检讨的是对自然场景和网络图片、以及巨大视频中的文字的提取和智能识别本领,角逐中主办方会提供街道视图、海报、菜单、室内场景和屏幕截图等大局限的图片,这些图片中文字有倾斜、垂直、差异字体、各类清晰度等很是犯科则和多样化的形态,是传统OCR无法提取和识此外,这也是人工智能技能应用的一个重要偏向。

最终奇安信人工智能团队凭借在深度进修规模的深厚技能积聚和应用实践得到了该项目标冠军。并同时得到了另一个项目“文字检测任务”的第四名。

奇安信人工智能团队获OCR比赛冠军

 

图:ICDAR官网发布的角逐图例

该团队认真人王占一暗示,OCR技能可以遍及应用于卡证类、单据类的文字识别、车牌检测识别、商标识别、阶梯标识识别、自动驾驶等,大大晋升产物检测识别结果和用户体验,低落人力本钱。奇安信的深度进修OCR技能合用于政企机构的数据防泄露和网站内容违规监测中,对代码、邮件、文件等差异范例的文档举办分类,然后识别发明文档中的违规行为,对违规文档举办过滤;标志被监测网站中的图片,对图片中的违规、违法、色情的文字内容举办识别发明。

奇安信人工智能团队获OCR比赛冠军

 

图:在“文字检测任务”中得到第四名

人工智能技能的应用是网络安详行业技能成长的一个偏向,奇安信很早就开始了对呆板进修、深度进修等人工智能技能在网络安详规模的研究、摸索和实践,取得了阶段性的成就并乐成应用于产物中。早在2015年,奇安信人工智能团队的《深度进修在流量识别中的应用》议题就得到了世界网络安详行业承认,团队成员受邀在BlackHat大会上演讲。奇安信旗下网神天眼新一代威胁检测系统、NGSOC和态势感知系统等产物和方案中,在数据挖掘、异常检测、巨大网络阐明中都乐成利用了深度进修和呆板进修技能。