[No.87]Diversity Enhanced Active Learning with Strictly Proper Scoring Rules

2024年10月18日 10:13
新IT卓越大讲堂

新IT卓越大讲堂 No.87期题目：Diversity Enhanced Active Learning with Strictly Proper Scoring Rules报告人：杜岚，澳大利亚莫纳什大学数据科学与人工智能副教授时间：2024年10月20日（周日）14:30地点：燕山校区1406会议室主办：计算机科学与技术学院摘要：报告分享近期在主动学习领域一些新的理论研究，该工作主要研究用于文本分类的主动学习（AL）中的获取函数。

新IT卓越大讲堂 No.87期

题目：Diversity Enhanced Active Learning with Strictly Proper Scoring Rules

报告人：杜岚，澳大利亚莫纳什大学数据科学与人工智能副教授

时间：2024年10月20日（周日）14:30

地点：燕山校区1406会议室

主办：计算机科学与技术学院

摘要：报告分享近期在主动学习领域一些新的理论研究，该工作主要研究用于文本分类的主动学习（AL）中的获取函数。现有的期望损失减少（ELR）方法侧重于分类错误率减少的贝叶斯估计，最近被更新为不确定性平均目标成本（MOCU）函数。我们将ELR框架转换为估计（严格适当）评分增加的函数，例如对数概率或负均方误差，称之为贝叶斯均值适当评分估计（BEMPS）。我们还借鉴了MOCU证明思路，证明了BEMPS收敛性。为了更好地进行新获取函数的实验，我们开发了一个互补的批次主动学习算法，旨在提高未标注数据中预期评分变化向量的多样性。为了实现高性能的文本分类器，我们将集成方法和在预训练语言模型上动态构建验证集相结合。通过广泛的实验评估，我们探讨了这些不同的获取函数的性能。结果表明，使用BEMPS的均方误差和对数概率能够提供稳健的获取函数，且其性能在测试中始终优于其他方法。

报告专家：

杜岚博士，澳大利亚莫纳什大学数据科学与人工智能副教授，IEEE高级会员。研究兴趣集中在机器/深度学习与自然语言处理的交叉领域，特别关注主动学习、不确定性估计和知识蒸馏等方向，还致力于探索这些技术在公共卫生、市场营销、化学、烟草等多领域的应用。近年在机器学习、自然语言处理和数据挖掘的几乎所有顶级会议/期刊上发表了100多篇高质量的研究论文，例如NeurIPS、ICML、ACL、EMNLP、AAAI、TPAMI、IJCV、TMM和TNNLS。担任《机器学习》期刊、《ACM概率机器学习事务》以及《大数据研究》杂志的编委，担任AAAI人工智能会议的领域主席，并且是所有顶级机器学习和自然语言处理会议的程序委员会成员或审稿人。作为首席研究员，成功获得了三项政府资助，包括一项NHMRC创意基金、一项ARC DP基金以及一项MRFF基金，总研究经费约为300万澳元。

学校、学院简介：

莫纳什大学是澳大利亚最大的一所大学，也是享有盛誉的八校联盟成员之一，在2025年QS世界大学排名中位列全球第37位。学校位于墨尔本，这座城市不仅是澳大利亚最佳学生城市，还被评为澳大利亚最宜居城市，全球排名第4，仅次于维也纳、哥本哈根和苏黎世。信息技术学院在八校联盟中独树一帜，是唯一一所专注于信息技术的学院。学院拥有超过300名学术人员，11,155名本科生和研究生，以及435名博士研究生，成为前沿研究和教育的中心。学院下设三个系：数据科学与人工智能、软件系统与网络安全、以及人本计算。值得一提的是，数据科学与人工智能在2024年QS世界大学学科排名中位列全球第34名。学院的使命是通过负责任的、创新的IT研究和教育，推动社会进步，并利用跨学科的方法促进社会福祉。