号外!未来本科生又发顶会啦!
学院2021级本科生李佳旭以第一作者身份发表的论文《SelM:基于选择性算法的视听分割》(SelM: Selective Mechanism based Audio-Visual Segmentation)被多模态/多媒体领域顶级会议ACM MM2024接收并被大会录用为Oral Presentation(口头汇报)录用率仅3.97%。
ACM MM 会议,全称为ACM International Conference on Multimedia,是由国际计算机学会组织的多媒体研究领域国际顶级会议。目前该会议H5指数为101,在多媒体领域会议中影响力位列第一,同时也是中国计算机学会(CCF)推荐的A类国际学术会议。该会议将于2024年10月28日至11月1日在澳大利亚墨尔本举行。
该研究聚焦于多模态视听分割任务,其核心思想旨在基于状态空间建模与多模态协同交互,实现基于声源信息的视频目标分割。该工作提出了基于选择性时序建模与条件去噪方法,有效解决了声源数据与发声物体难以精准匹配定位问题,抑制了模型的幻听错分现象,实现了推理高效、精确稳定的分割结果。
模型架构示意图
回顾科研历程,李佳旭认为扎实的研究基础与坚持不懈的努力是至关重要的,并表示“只有了解到前人工作中的优势与不足,才能发现研究的正确方向”。作为本科生,在初次进行科研工作时,难免会遇到各种困难与碰壁,实验时常出现失败的情况。在成长过程中,指导老师王一帆老师与王立君老师为他提供了至关重要的帮助,时常教导他要从多种角度看问题,对于研究过程一定要细致。在未来的科研生活中,李佳旭希望能够继续留在学校IIAU实验室进行深造,不断提升科研素养、开阔学术视野并脚踏实地,力争做出有影响力的开拓性工作。
上述成果凸显了未来技术学院在人才培养方面的显著成效。学院将不断创新人才培养模式,持续探索教育教学改革路径,着力提升学生创新意识与科研能力,为未来科技领军人才的成长过程全面赋能。