近日,计算机学院张洪博副教授课题组一项关于图像中人物交互行为检测的研究成果(题为"Interaction Confidence Attention for Human-Object Interaction Detection")在中国计算机学会(CCF)推荐的人工智能 A类顶级学术期刊 International Journal of Computer Vision (IJCV) 2025年第8期上正式发表。图像中的人物交互理解是计算机视觉研究中的一项重要挑战,是实现图像内容高语义理解的关键技术之一。同时,注意力机制是当前人工智能模型的内在关键技术之一。这项工作中主要探讨了基于Transformer架构的人-物交互检测方法,利用图像中的人-物关键点构建了可学习的查询生成器,并设计了一种新的面向人-物交互任务的注意力计算方法,并行地实现人体检测、物体检测及其交互识别。该研究在人-物的通用数据集上进行了大量实验,验证了所提出方法的有效性。
图1 本研究所设计的注意力计算方法
图2 本研究的模型在不同场景中的注意力可视化
IJCV,即国际计算机视觉期刊,是由 Springer 发行的计算机视觉领域顶级学术期刊,被 CCF 认定为 A 类学术期刊。该期刊主要发表计算机视觉领域的最新研究成果,包括但不限于目标检测、图像理解、视觉推理、深度学习、几何计算等方向,是计算机视觉领域最具影响力的期刊之一。
在该研究工作中,我校为第一完成单位,计算机学院张洪博副教授为第一作者,2021级软件工程硕士生林王凯为第二作者,雷庆副教授、刘景华副教授、杜吉祥教授和2023级研究生苏杭参与了研究工作。近几年,课题组针对人体行为理解的相关任务展开系统性的研究,在IEEE TIP、ECCV、ACM TOMM等计算机视觉和图像处理领域的顶级期刊和会议发表了多项相关研究成果。
该研究工作得到福建省大数据智能与安全重点实验室、福建省计算机视觉与机器学习高校重点实验室、厦门市计算机视觉与模式识别重点实验室的大力支持。
初审:张洪博
复审:彭佳林
终审:陈荣美