时间:2024年 4月9日 下午2:00-5:20
地点:广州大学 (大学城校区) 理科南314
报告 1:
报告人:郑成龙(硕士生)
指导老师:郑成龙
报告题目:毕业论文进展汇报
在本次组会上,郑成龙同学汇报了他的研究进展,主要研究方向为交通流量预测。首先,郑成龙同学介绍了一篇使用时空自适应嵌入的原生Transformer 来进行交通流量预测工作,接着,他介绍了一种结合递归神经网络来降低Transformer长序列复杂度的注意力架构Retnet,并介绍了其中的旋转位置编码技术rope和xpos. 在Retnet的基础上,郑成龙同学提出了一种用于建模时空序列数据的线性注意力机制,该方法利用了Retnet中提出的分块递归形式来避免了直接计算注意力系数矩阵带来的高空间复杂度, 同时在时间维度采用旋转位置编码,而在空间维度采用自适应编码,来更好的捕捉时序位置关系,且能够对时间序列的偏移有更好的鲁棒性,同时使用了可学习参数来替代retnet中按token间距离指数衰减的系数。实验结果在PEMS03, PEMS04, PEMS07, PEMS08上的MAE和MAPE均指标超过使用原生Transformer的方法。为了取得更为显著的效果提升,将进一步在时空位置编码上进行进一步优化。

报告2:
报告人:张冠桦(硕士生)
指导老师:方美娥
报告题目:Dual Attention Multi-Instance Deep Learning for Alzheimer’s Disease Diagnosis With Structural MRI
在本次报告中,张冠桦同学首先介绍了阿尔茨海默症以及sMRI的一些相关背景信息,让大家对这篇论文献决的问题有了一个初步的认识。然后她对该篇文章提出的一种名为双重注意多实例深度学习网络(DA-MIDL)的新模型进行了一个系统的介绍,该模型包括三个主要部分:Patch-Nets带空间注意力块,用于提取每个结构MRI(sMRI)补丁内的鉴别特征,同时增强大脑中异常变化微结构的特征;注意力多实例学习(MIL)池化操作,用于平衡每个补丁的相对贡献,并为整个大脑结构提供全局不同加权表示;注意力感知的全局分类器,进一步学习整体特征并做出与AD相关的分类决策。该研究在两个独立数据集(即ADNI和AIBL)的基线sMRI扫描中的1689名受试者上评估了DA-MIDL模型。实验结果显示,DA-MIDL模型能够识别出与病理特征相关的鉴别性位置,并在准确性和泛化能力方面,与其他几种最先进的方法相比,取得了更好的分类性能。这项工作不仅在技术上取得了创新,而且在临床应用中具有重要的潜在价值,有助于提高阿尔茨海默病的早期诊断准确性。报告完毕后,老师和同学们都提出了宝贵的意见。

报告3:
报告人:张泽初(博士研究生)
指导老师:方美娥
在这次组会上张泽初同学介绍一种具有骨架一致性的 3D 面部生成器SCULPTOR。该方法使用学习参数面部生成器进行具有骨架一致性的 3D 面部创建,旨在通过混合参数物理表示轻松创建解剖学上正确且视觉上令人信服的面部模型。重点介绍了使用的LUCY数据库,该数据包括 72 名受试者(31 名男性和 41 名女性)的 144 次扫描,其中每个受试者在正颌手术前和手术后进行两次 CT 扫描。他详细分析其优缺点,该方法统一的数据驱动框架下对头骨、面部几何形状和面部外观进行联合建模。与现有方法相比,SCULPTOR 在面部生成任务中保留了解剖正确性和视觉真实感。他同时提是该方法缺少颞下颌关节运动的研究,缺少对肌肉的建模,因此无法作为有限元模型为口腔医疗方案进行定量的分析。他希望结合现有数据与解剖学的知识,进一步探索参数面部生成器在口腔医疗上的作用。
