·厦门大学信息学院超智医疗创新研究中心

当前位置:

中文主页 >> 团队动态

皇家墨尔本理工大学博士生罗峰来我实验室开展学术交流与经验分享

发布时间:2026-03-20 点击次数:

2026314日至27日,受厦门大学信息学院副院长王晓黎副教授的邀请,皇家墨尔本理工大学博士生、昆士兰大学访问学者罗峰来到我们实验室进行为期两周的学术访问与合作交流。本次交流旨在探讨大语言模型赋能的数据准备(LLM-enhanced data preparation)等AI前沿话题,并推进相关技术在实际应用中的落地。

访问期间,罗峰为实验室师生作了一场干货满满的内部学术报告,报告内容涵盖了科研方法论“AI4DB前沿研究两大核心板块。

在科研经验分享环节,罗峰以《如何通过阅读论文学习开展研究》(How to Learn Research from Papers)为题,系统讲解了持续跟进同行论文的必要性,以及高效阅读文献的三遍法:第一遍快速浏览摘要与引言,第二遍精读图表与实验部分,第三遍深挖感兴趣的技术细节。她结合自身经验,启发同学们在阅读后深入思考输入数据、核心方法、目标输出与约束条件之间的多维逻辑关系,并推荐了Gemini/ChatGPT Deep ResearchAgenticScholar等前沿科研工具辅助探索。

在专业学术探讨环节,罗峰聚焦于数据管理与人工智能的交叉领域(AI4DBDB4AI)。她指出,数据科学家日常约有80%的精力耗费在高质量数据的准备工作上,而异构的数据湖中平均存在高达38%的缺失值,这对数据发现与集成提出了巨大挑战。

为此,她详细介绍了其关于表格数据湖缺失值补全的最新研究成果。针对现有检索式方法(Search-based)和估计式方法(Estimation-based)在处理不同表格和数据类型时的局限性 ,罗峰提出了一种名为“CESID”的混合式补全框架。该方法创新性地设计了上下文搜索(Contextual Search)、获取引导估计(Acquisition-guided Estimation)以及KNN分类器(Classifier)三大模块 ,有效应对了多列表格搜索空间大、小表格估计不准以及最优补全策略动态选择等技术难题 。实验结果表明,CESID在处理复杂的HTML网页表格和CSV表格时,均展现出了卓越的整体性能。

罗峰的研究始终致力于为复杂且以数据为中心的AI系统设计先进的数据管理技术。此次内部学术报告不仅为实验室同学们提供了系统性的文献阅读指导,也极大地拓宽了大家在数据湖治理与AI4DB领域的学术视野,为双方未来在智能数据处理方向的深度合作奠定了坚实基础。