时间: 2024年4月16日 下午2:00-5:20
地点:广州大学 (大学城校区) 理科南314#
报告 1:
报告人:吴焯标(硕士生)
指导老师:方美娥
报告题目:语义SLAM与3D-GS的结合
在本次组会上,吴焯标同学讲述了3D-Gaussian-Splatting的垂直应用:语义SLAM与3D-GS的结合,围绕SemGauss-SLAM这一个基于3D-GS的稠密语义SLAM工作进行讲述。首先,吴焯标同学介绍了原始3D-GS工作的基本原理、应用背景与重要单元,为后续在与语义SLAM的结合铺垫。接着,吴同学就SemGauss-SLAM对于3D-GS的改进进行了阐述,具体讲述了SemGauss-SLAM方法中的3D高斯新参数Dinov2语义特征、SemGauss-SLAM方法的跟踪与建图过程、该方法在跟踪优化与建图优化中的损失函数以及该方法的实验效果。结合上述介绍后,总结出语义SLAM与3D-GS的结合所带来的优势与不足,并提出一些两者的结合工作在实时性与大场景下的改进可能性,以及结合自身的工作与老师共同探讨可借鉴的地方。

报告 2:
报告人:何向荣(硕士生)
指导老师:王艳
报告题目:文献阅读分享
在本次组会上,何向荣同学分享了一篇发表在WWW'2024上的推荐系统领域研究的文章,该文章引入了GraphPro,这是一个以参数有效的方式将动态图预训练与提示学习相结合的框架。这种创新的混合使GNN能够熟练地掌握持久的用户偏好和短暂的行为变化,从而提供精确和最新的建议。首先,何向荣同学介绍了文章的研究背景。通过将用户和物品视为节点,将它们的交互视为边缘,GNN 可以捕获用户和物品之间复杂的多跳关系,从而促进个性化推荐结果的生成。尽管这些方法表现出了令人印象深刻的性能,但它们主要关注静态场景,而忽略了推荐的动态性质。然后,何向荣同学介绍了文章的框架。文章的方法首先基于大量历史交互数据对图神经网络进行预训练,使它们能够捕获长期用户偏好和项目相关性。随后,在对最新目标数据的微调阶段,文章的模型通过提示学习模式,实现了有效的知识转移。同时,文章的框架集成了时间提示机制和图结构提示学习机制,将新数据注入时间感知上下文,使模型能够适应不断变化的用户偏好。在文献分享后,何向荣同学与老师同学们就本文章进行了讨论,得到了宝贵的建议。

报告 3:
报告人:尚毅(硕士生)
指导老师:李福芳
报告题目:半监督医学影像分割的解耦一致性
在本次组会上,尚毅同学汇报了一篇论文半监督医学图像分割的解耦一致性Decoupled Consistency for Semi-supervised Medical Image Segmentation和他近期的工作,该论文包含四个部分: 动态一致性阈值、一致性部分处理、不一致性部分处理和特征一致性。首先,尚毅介绍了半监督医学影像分割常用的方法和这些方法可以改进的地方。 接着,他动态一致性阈值的计算和原理,并对比分析了动态阈值的必要性。其次,根据动态阈值的划分,高置信度的部分采取交叉为监督的方法进行优化。低于动态阈值的部分使用锐化后的预测结果进一步划分为可靠数据和不可靠数据。可靠数据是指那些具有高锐化指的区域,不可靠数据是指那些靠近决策边界的区域。提出了方向一致性损失,主要把不可靠数据尽可能靠近指导数据。最后,介绍了特征一致性,论文认为除了像素级别的输出,特征图(feature map)也包含了丰富的中间层次信息,因此将特征图直接纳入训练过程。为了减少计算量,论文中采用平均映射方法来降低特征图的维度。对每个通道 C 内的特征值进行绝对值运算并加权求和(权重参数为p,通常设置为大于1的数值,如p=2),然后除以通道数 C,得到一个维度较低的特征向量。这一过程有助于提取各通道特征的重要信息,并将其压缩到一个更紧凑的表示中,便于后续的损失计算和梯度反传。在这篇论文上,介绍了自己的想法和改进思路,主要是在一致性部分上,用高置信度的伪标签和少量真实标签,对中间特征图进行编码并计算对比损失,让不同类别的向量在高维空间中尽可能地远。
