再见2023! 你好2024!
2023年,我们共同经历了无数挑战和机遇,也收获了无数的成功和成长,实验室在科研探索、师生成长、项目合作等方面都取得了长足的进步。在这里,我们对过去一年实验室所取得的成果进行总结和回顾,也为即将到来的龙年拉开帷幕。感谢每一位关注我们的朋友!
【荣誉奖项】
2023年1月,我组2017级博士苗旭鹏获得2022年度ACM中国“优秀博士论文奖”。
ACM中国“优秀博士论文奖”由ACM中国理事会从2014年设立,为表彰中国计算机领域的青年学者和博士生所取得的优秀研究成果和高水平博士论文,并进一步推动青年学者在科研领域的发展和进步。2022年全国共有2位博士荣获该奖项。
苗旭鹏获得2022年度ACM中国“优秀博士论文奖”
2022年度ACM中国“优秀博士论文奖获得者”展览
【论文录用】
2023年2月,我组硕士生王子威的一篇论文被ICDE 2023录用。
【论文简介】
Ziwei Wang, Zheng Zhong, Jiarui Guo, Yuhan Wu, Haoyu Li, Tong Yang, Yaofeng Tu, Huanchen Zhang, Bin Cui. REncoder: A Space-Time Efficient Range Filter with Local Encoder,ICDE 2023.
范围过滤器是一种用于回答范围成员查询的数据结构。范围查询在现代应用程序中很常见,范围过滤器可以通过滤除空范围查询来提高范围查询的性能,因此受到越来越多的关注。目前最先进的范围过滤器,如SuRF和Rosetta,分别存在高误报率和低吞吐量的缺陷。因此,论文提出了一种新的范围滤波器(REncoder)。它将所有键的前缀组织成一棵线段树,并将线段树局部地编码至布隆过滤器中以加速查询。REncoder可自适应地选择要存储的线段树的层数来支持不同的工作负载。论文从理论上证明了REncoder的误差是有界的,并推导出了其在有界误差下的渐近空间复杂度。论文在合成数据集和真实数据集上进行了实验,结果表明,REncoder优于全部现有范围滤波器。
【学术活动】
2023年4月3日至7日,国际数据库与数据管理顶级会议ICDE 2023召开,我组博士生谢旭、硕士生王子威在大会上为录用论文进行了学术报告。
【论文录用】
2023年4月,我组科研实习生姜友和、博士生符芳诚等同学合作的一篇论文被IJCAI 2023录用。
Youhe Jiang, Fangcheng Fu, Xupeng Miao, Xiaonan Nie, Bin Cui. OSDP: Optimal Sharded Data Parallel for Distributed Deep Learning,IJCAI 2023.
大规模深度学习模型在多个人物场景中展现出了显著的提升。数据并行和模型并行分别是基于模型的复制和划分来支持超大规模模型分布式训练的常见范式。本文提出了最优分块数据并行范式(OSDP),一种结合了数据并行和模型并行优点的自动并行训练框架。给定模型描述和设备信息,OSDP在显存占用量和计算利用率之间进行权衡,从而自动生成分布式计算图,并最大化整体训练吞吐。此外,OSDP引入了算子切分技术,以进一步降低训练过程中的峰值显存占用,从而提升可支撑的模型规模。在多类大规模模型上的实验表明,OSDP相比现有方法具有显著的提升。
【论文录用】
2023年5月,实验室共有5篇论文被国际顶级学术会议或期刊录用:
【论文简介】
【学术活动】
2023年6月18日至23日,国际数据库与数据管理顶级会议SIGMOD 2023召开,我组博士生聂小楠、黄世悦、张心怡在大会上为录用论文进行了学术报告。
【学术活动】
2023年8月29日至9月1日,国际数据库与数据管理顶级会议VLDB 2023召开,我组博士生聂小楠、2017级博士苗旭鹏在大会上为录用论文进行了学术报告。
【荣誉奖项】
2023年9月,我组2018级博士符芳诚入选2023年度博士后创新人才支持计划。
【论文录用】
2023年9月,实验室共有3篇论文被国际顶级学术会议或期刊录用:
【论文简介】
【荣誉奖项】
2023年10月,我组2017级博士黎洋获得2023年度ACM中国北京分会“优秀博士论文奖”。
【荣誉奖项&学术活动】
2023年10月7日,在武汉举办的国际数据挖掘与数据管理会议APWeb-WAIM 2023(Asia Pacific Web and Web-Age Information Management Joint International Conference on Web and Big Data,简称APWeb-WAIM)上,北京大学计算机学院崔斌教授课题组的论文“一种基于显式捕获多样图信息的多任务属性图聚类方法(Graph-Enforced Neural Network for Attributed Graph Clustering)”获得大会最佳论文提名奖(Best Paper Runner Up)。
Zeang Sheng, Wentao Zhang, Wen Ouyang, Yangyu Tao, Zhi Yang and Bin Cui. Graph-Enforced Neural Network for Attributed Graph Clustering,APWeb-WAIM 2023.
该论文对现有的基于GAE的属性图聚类方法做了定量实验分析,发现这些方法受三类图信息缺失问题的影响。在此基础上,该论文提出了三类具有创新性的图信息维持任务,包括图结构、图中节点特征以及全局聚类结构,并综合到一个多任务学习框架中,最终取得了显著的性能提升。该论文有助于属性图社区推进对于聚类算法的研究,为新算法的提出提供了新的思考方向。
【论文录用】
2023年10月,实验室共有2篇论文被国际顶级学术会议或期刊录用:
【论文简介】
【荣誉奖项】
2023年10月, 我组博士研究生张心怡通过层层遴选,以卓越的学术成果、优异的个人实践,荣获2023年度字节跳动奖学金。
字节跳动奖学金计划是字节跳动公司发起的一项年度人才培养项目。该计划面向中国大陆地区高等院校的在校生,每年支持10余名学生,为每位获奖学生提供10万元人民币奖学金,旨在帮助具有创新精神的科技人才用专业知识解决实际难题,用技术回馈社会,引领未来。2023年共有13人荣获该奖学金。
2023年度字节跳动奖学金颁奖仪式
【荣誉奖项】
2023年11月,国际电气和电子工程师协会(IEEE)公布了 2024 年度新晋 Fellow 名单,由于对大规模数据管理、处理和分析的贡献,崔斌教授入选为IEEE Fellow。
IEEE,全称Institute of Electrical and Electronics Engineers,是国际性的电子技术与信息科学工程师的协会,在160多个国家中,拥有42万多会员。IEEE Fellow,为协会最高等级会员,是该组织授予的最高荣誉,当选人需要对工程科学技术的进步或应用做出重大贡献,为社会带来重大价值。每年由同行专家在有突出贡献的会员中评选,当选人数不超过IEEE会员总人数的千分之一。
【新闻动态】
2023年11月,我组2017级博士张文涛入职北京大学国际机器学习研究中心,担任助理教授、研究员和博士生导师。
【论文录用】
2023年11月,实验室共有4篇论文被国际顶级学术会议或期刊录用:
【论文简介】
【荣誉奖项】
2023年12月,我组2017级博士张文涛获得2023年北京市优秀博士学位论文。
【学术活动】
2023年12月10日至12月16日,国际机器学习与人工智能顶级会议NeurIPS 2023召开,我组博士生张海林、杨灵在大会上为录用论文进行了讲解。
【学术活动】
2023年12月3日至6日,2023国际测试委员会智能计算与芯片联邦大会召开,我组开源项目河图(Hetu)被评为BenchCoucil年度世界开源杰出成果之一,我组2018级博士符芳诚受邀在大会上进行题为“河图:高效可扩展的分布式深度学习系统/Hetu: An efficient and scalable distributed deep learning system”的演讲报告。
河图(Hetu)被评为BenchCoucil年度世界Top100开源成果
【论文录用】
2024年1月,我组博士生杨灵共有3篇论文被ICLR 2024录用。
【论文简介】
【荣誉奖项】
2024年2月,我组2017级博士张文涛获得2023 年度吴文俊人工智能科学技术奖“优秀博士学位论文获奖论文 ”。
【论文录用】
2024年2月,我组2017级博士张文涛的一篇论文被SIGMOD 2024录用。
【论文简介】
Wentao Zhang, Guochen Yan, Yu Shen, Yang Ling, Yaoyu Tao, Bin Cui, Jian Tang. NPA: Improving Large-scale Graph Neural Networks with Non-parametric Attention,SIGMOD 2024 (Industry)
非参数化的图神经网络(GNN)在大规模图数据上取得了广泛的使用。例如,Open Graph Benchmark中大部分排名靠前的方法都是非参数化GNN。尽管非参数GNN具有很高的预测性能和可扩展性,但仍面临两个限制。1)由于过平滑特征的传播,它们会随着传播深度而遭受严重的性能退化。2)忽略了非参数传播过程中的特征影响,导致传播特征次优。本文提出了非参数注意力插件来解决这些限制,取得了ogbn-papers100M的最好性能,在腾讯实际应用中部署实现并取得良好效果。
2023年的征途与荣光已属于过去,2024年的挑战与机遇已经开始。兔去龙来喜气浓,家家户户庆丰功。祝福新老朋友们,龙年行大运,龙飞凤舞生活乐,鱼跃龙门事业兴!新春快乐!