清华电子系在第25届模式识别国际会议阿拉伯文视频文本检测与识别竞赛中夺冠

2021-02-08 08:15:04

在近日线上举行的第25届模式识别国际会议（International Conference on Pattern Recognition，ICPR）上，第三届阿拉伯文视频文本检测与识别竞赛结果揭晓。清华大学电子工程系媒体大数据认知计算研究中心彭良瑞副教授指导的2017级博士生闫睿劼、2019级硕士生肖善誉等提交的算法在文本检测和文本识别两项任务中均获得第一名。

阿拉伯文视频文本检测与识别竞赛（Competition on Text Detection and Recognition in Arabic News Video Frames, AcTiVComp）由瑞士西部应用科学大学、弗莱堡大学和突尼斯苏斯大学主办。参赛队伍包括来自中国、瑞士、马来西亚、挪威、印度、巴基斯坦等多个国家的高校与学术机构。

阿拉伯文视频文本检测获奖证书

阿拉伯文视频文本识别获奖证书

阿拉伯文等多文种文字识别技术在促进全球化时代信息交流及利用中具有重要作用，也是机器学习和人工智能研究领域的前沿课题。在彭良瑞的指导下，参加阿拉伯文视频文本检测与识别算法研究的研究生包括2017级博士生闫睿劼、2019级硕士生肖善誉、2019级博士生姚刚、2020级硕士生石浩东等。提交的文本检测算法由肖善誉负责研制，肖善誉在深度学习模型架构设计和多任务监督学习机制方面进行了创新研究；提交的视频文本识别算法由闫睿劼负责研制，在高效特征表示学习和迁移学习方面取得了突破进展。此前，彭良瑞研究组曾在2017文档分析与识别国际会议（International Conference on Document Analysis and Recognition，ICDAR）上的阿拉伯文视频文本检测与识别竞赛全部两项任务中取得领先成绩。本次参赛算法与2017年的算法相比，在文本检测和文本识别方面都有大幅度的提升。

本次参赛算法相关研究工作得到科技部重点专项、清华大学国强研究院以及北京信息科学与技术国家研究中心的资助。（文/清华大学）