澳科大博士生在国际顶级会议发表创新研究成果

发布时间

近日,澳门科技大学创新工程学院计算机科学与工程学院一年级博士生杨俪莹作为第一作者在国际顶级会议“International Conference on Computer Vision (ICCV)”上发表了题为Not All Frame Features Are Equal: Video-to-4D Generation via Decoupling Dynamic-Static Features《并非所有帧特征都相同:通过解耦动态-静态特征实现单目视频到4D的生成》的学术论文。该论文的通信作者为计算机科学与工程学院梁延研副教授。ICCV是人工智能与计算机视觉领域的国际顶级会议,被中国计算机学会(CCF)推荐为人工智能领域的A类会议,其Google Scholar H5-index高达291,在全球所有出版物中排名第13位。此次发表是澳科大作为第一单位在ICCV上发表的第四篇论文,进一步彰显了澳科大在人工智能领域的卓越研究实力。

杨俪莹博士生

ICCV会议在全球所有出版物中的排名

近年来,从视频中生成动态三维物体(4D)取得了显著进展,但现有方法在处理动态与静态区域交织的场景时,往往因静态区域占比较大而忽略动态信息,导致结果纹理模糊。针对这一问题,梁副教授及其团队提出了一种创新性解决方案——动态-静态特征解耦模块(DSFD)。该模块通过时间轴分析,将当前帧与参考帧的显著差异区域识别为动态特征,其余部分视为静态特征,从而生成由动态特征和当前帧特征共同驱动的解耦特征。此外,团队还设计了时空相似性融合模块(TSSF),在空间轴上自适应选择动态区域的相似信息,以增强动态表示并确保运动预测的准确性。基于这些技术,团队构建了名为DS4D的新方法,实验证明其在视频到4D生成领域达到了最佳性能(SOTA),并在真实场景数据集中验证了其有效性。

论文提出的方法整体流程图

4D生成的示例效果图

该研究成果不仅为视频到4D生成领域提供了新的技术路径,还为复杂场景下的动态物体建模开辟了可能性。论文通过理论创新与实验验证,展示了澳科大在计算机视觉与人工智能领域的领先水平。杨俪莹作为论文第一作者,其研究成果的发表也体现了澳科大在培养高水平科研人才方面的卓越成就。

澳科大将继续支持前沿科学研究,推动人工智能领域的创新发展,为全球科技进步贡献更多智慧与力量。