近日,澳門科技大學創新工程學院計算機科學與工程學院一年級博士生楊儷瑩作為第一作者在國際頂級會議“International Conference on Computer Vision (ICCV)”上發表了題為Not All Frame Features Are Equal: Video-to-4D Generation via Decoupling Dynamic-Static Features《並非所有幀特徵都相同:通過解耦動態-靜態特徵實現單目視頻到4D的生成》的學術論文。該論文的通信作者為計算機科學與工程學院梁延研副教授。ICCV是人工智能與計算機視覺領域的國際頂級會議,被中國計算機學會(CCF)推薦為人工智能領域的A類會議,其Google Scholar H5-index高達291,在全球所有出版物中排名第13位。此次發表是澳科大作為第一單位在ICCV上發表的第四篇論文,進一步彰顯了澳科大在人工智能領域的卓越研究實力。
楊儷瑩博士生
ICCV會議在全球所有出版物中的排名
近年來,從視頻中生成動態三維物體(4D)取得了顯著進展,但現有方法在處理動態與靜態區域交織的場景時,往往因靜態區域佔比較大而忽略動態信息,導致結果紋理模糊。針對這一問題,梁副教授及其團隊提出了一種創新性解决方案——動態-靜態特徵解耦模塊(DSFD)。該模塊通過時間軸分析,將當前幀與參考幀的顯著差異區域識別為動態特徵,其餘部分視為靜態特徵,從而生成由動態特徵和當前幀特徵共同驅動的解耦特徵。此外,團隊還設計了時空相似性融合模塊(TSSF),在空間軸上自適應選擇動態區域的相似信息,以增强動態表示並確保運動預測的準確性。基于這些技術,團隊構建了名為DS4D的新方法,實驗證明其在視頻到4D生成領域達到了最佳性能(SOTA),並在真實場景數據集中驗證了其有效性。
論文提出的方法整體流程圖
4D生成的示例效果圖
該研究成果不僅為視頻到4D生成領域提供了新的技術路徑,還為複雜場景下的動態物體建模開闢了可能性。論文通過理論創新與實驗驗證,展示了澳科大在計算機視覺與人工智能領域的領先水平。楊儷瑩作為論文第一作者,其研究成果的發表也體現了澳科大在培養高水平科研人才方面的卓越成就。
澳科大將繼續支持前沿科學研究,推動人工智能領域的創新發展,為全球科技進步貢獻更多智慧與力量。