近日,我院智能信息处理研究团队2021级硕士研究生唐松同学在唐荣年教授和李创教授的联合指导下,在国际顶级会议IEEE/CVF International Conference on Computer Vision(简称ICCV)上发表最新研究论文(如图1所示),题目为“SwinLSTM: Improving Spatiotemporal Prediction Accuracy using Swin Transformer and LSTM”。ICCV 是全球计算机领域顶级的学术会议,每两年召开一次,享有极高的学术声誉,本届会议共有 8068 篇投稿,接收率为26.8%。
图1 文章首页
该论文首次提出整合Vision Transformers(ViTs)和LSTMs的方法用于时空建模,且在四个常用的时空预测数据集上达到了最先进的性能,具有以下两大创新点:
1、 提出了一种新的循环单元SwinLSTM,它能够有效地提取时空表征。与以往基于卷积神经网络的方法不同,完全采用自注意力机制建模全局空间信息,减少了局部建模带来的信息损失。
2、 提出了两个新的预测网络SwinLSTM-B和SwinLSTM-D(如图2所示)用于时空预测任务,它可以有效地建立空间和时间依赖性。
图2 SwinLSTM模型整体框架图
文章链接:https://arxiv.org/abs/2308.09891
海南大学为该ICCV论文的唯一完成单位,该论文是我院首篇人工智能领域的顶级会议论文。