第十九届国际文档分析与识别大会举办
发布时间:2025.09.24

来源:软件学院 编辑:牟梓苓霄 浏览次数:

新闻网讯 9月16日至21日,第十九届国际文档分析与识别大会(ICDAR 2025)在武汉召开。本届大会由我校软件学院承办,共吸引来自31个国家和地区的431位学者与企业代表参会。


大会设置主会、专题教程、博士生论坛及多个主题研讨会,呈现DAR领域在大模型与多模态时代的最新进展。大会共接收投稿314篇,录用口头报告40篇、海报论文102篇,内容涵盖文档布局分析、手写识别、多模态文档理解、历史文档分析等多个前沿方向。


主旨演讲嘉宾Koichi Kise教授


日本大阪公立大学KoichiKise教授以“从AI到AI——文档分析与识别为何脱颖而出:个人见解(From AI to AI-Why Document Analysis and Recognition Stands Out: A Personal Perspective)”为题,从个人研究历程出发,阐释DAR在人工智能中的独特地位。他强调,文档不只是“图片上的文字”,而是人类知识的载体,高质量的DAR系统应当在数据、模型与任务设计上兼顾“结构意识(structure-awareness)”与“可组合推理(compositional reasoning)”。


主旨演讲嘉宾乔宇教授


上海人工智能实验室乔宇教授在报告“面向文档理解的大型多模态模型:进展与挑战(Large Multi-modal Models for Document Understanding: Advances and Challenges)”中梳理大模型在文档理解中的进展与挑战。他指出,随着跨模态对齐能力的增强与上下文长度的提升,模型对长文档、多页布局、跨图表与正文的关联推理能力显著提高;但真正的挑战在于“跨域泛化、数据治理与工程可用性”的三重平衡。


主旨演讲嘉宾Josep Lladós教授


西班牙巴塞罗那自治大学计算机视觉中心(CVC)的Josep Lladós教授以“The Dual Syntax of Documents. Structural Reasoning in Document AI”为题,提出“文档的双重语法”框架:其一是可见语法——文字、版面、图表的显式结构;其二是隐含语法——跨段落、跨页面甚至跨文档的语义连贯与论证结构。


此外,大会论文口头报告覆盖从低资源场景的文字识别,到复杂长文档的结构化理解,再到历史文档的数字化保护等多个前沿方向。同时,产业界的联合论文与演示侧重“可工程化”的实践:通过合同审阅、政务质检等场景,勾勒新一代文档大模型可复现、可拓展的落地路径。



会议期间举办以“超越基础模型:文档分析的下一个挑战(Beyond Foundation Models: The Next Challenges in Document Analysis)”为主题的圆桌讨论,清华大学彭良瑞教授主持,来自学界与业界的专家就文档基础模型的未来发展方向展开交流。技术竞赛与博士生论坛为青年学者提供展示与交流的平台,促进学术创新与跨界合作。


产业展区展示DAR技术在办公自动化等领域的落地应用。会议期间还颁发了最佳论文等奖项。


据悉,ICDAR 2025由我校软件学院院长白翔教授、中国科学院自动化研究所刘成林研究员、意大利佛罗伦萨大学SimoneMarinai教授以及印度统计学院UmapadaPal教授共同担任大会主席。下一届ICDAR将于2026年在奥地利维也纳举行。

学校微博
单周单篇点击量排名
Baidu
map