近日,國際人工智能和計算機視覺頂尖期刊International Journal of Computer Vision(IJCV,計算機視覺國際期刊)在線發(fā)表了計算機與人工智能學院李天瑞教授團隊的最新研究成果:“Deep Hierarchical Learning for 3D Semantic Segmentation”。文章從人類認知和三維世界本身具有的多層次視角,首次提出了面向三維語義分割的深度層次學習模型和理論分析框架。
該篇論文以西南交通大學為第一署名單位,李崇壽副教授為第一作者,香港城市大學研究助理教授李欣科為通訊作者,與西南交通大學利茲學院計算機科學與技術專業(yè)2020級本科生劉宇恒、2021級本科生張裕寧、李天瑞教授以及紐約州立大學布法羅分校袁俊松教授共同完成。
IJCV是中國計算機學會(CCF)推薦的人工智能領域的4個A類期刊之一,也是計算機視覺領域最被認可的兩大期刊之一,2025年影響因子11.6,年發(fā)文量僅170篇左右,偏重視覺智能基礎理論。這也是學校首次在IJCV上發(fā)表科研論文。本項研究得到了國家自然科學基金青年基金、面上項目、四川省自然科學基金創(chuàng)新研究群體等資助。

3D場景的分層語義理解是計算機視覺領域的關鍵挑戰(zhàn),如何有效捕捉和利用物體之間的層次關系一直是研究的難點。本論文從人類認知固有的層次特性出發(fā),首次從理論上構建了跨層次語義一致性與各層熵最大化之間的理論關系,搭建了層次學習的理論分析框架?;诖死碚?,構建了深度層次學習方法,設計了分層嵌入融合模塊,有效捕獲點與點之間的層次關系,通過引入層次正則化項,將不同層級預測間的層次連貫性與分類損失有機結合。最后,借助視覺語言模型,開發(fā)了自動高效構建類別層次結構的技術,拓展了層次學習的適用范圍。實驗結果表明,本文所提出的深度層次學習模型能顯著提高3D語義分割性能,為自動駕駛、城市規(guī)劃和數(shù)字孿生等領域提供了重要技術支持。
李天瑞教授團隊近年來始終專注于人工智能領域的前沿基礎理論研究和面向國家重大需求的應用研究,承擔國家重點研發(fā)課題、國家自然科學基金等國家級項目30余項,研究成果已發(fā)表在PNAS、IEEE TPAMI、IJCV等國際頂級期刊,中國科學、軟件學報、計算機學報等國內頂級期刊以及AAAI、ACL、CVPR、ICCV等國際一流會議等。
論文鏈接地址:https://link.springer.com/article/10.1007/s11263-025-02387-6