首页科学研究学术预告 正文

人工智能前沿技术高端学术论坛(六)

【 发布日期:2022-08-29 】    作者:罗昕

报告题目:光学文字识别:从数据多样化到模型自监督

报告人:金连文,华南理工大学教授

报告时间:202209月02日,19:30

直播链接https://meeting.tencent.com/l/rCJS1727Jbw7

报告摘要:光学文字识别(OCR)技术在图像理解、信息录入、智慧金融、智能办公、身份认证、电子商务等诸多领域有非常广阔的应用前景,是计算机视觉及人工智能领域的重要研究问题之一。近年来,基于数据驱动的深度学习方法已成为主流,但其性能极大依赖费时费力的海量样本收集和标注。在本报告中,我将从如何低成本生成/利用大规模数据、如何通过降低模型训练对标签的依赖这两个新的角度来介绍文本识别领域的一些最新进展,包括可学习数据增广方法、手写风格参数可调的数据合成方法、弱监督自对齐生成对抗文本去噪模型、相似度风格归一化自监督表征学习方法等。

报告人简介:金连文,于中国科技大学获学士学位、华南理工大学获博士学位,目前为华南理工大学二级教授,兼任中国图像图形学学会(CSIG)常务理事、CSIG文档图像分析与识别专委会主任、中国人工智能学会(CAAI)模式识别专委会常务委员、中国自动化学会(CAA)模式识别与机器智能专委会常务委员等。主要研究领域为文字识别、深度学习、计算机视觉及应用等,在IEEE Transactions及其它重要国际学术期刊、CVPR/AAAI/IJCAI/NeurIPS/ECCV/ICDAR等重要国际会议上发表论文200余篇,Google Scholar 论文被引用数10000余次、H指数52,获省部级科技奖5次,指导学生荣获国际学术竞赛冠军20余次。