近日,IEEE Transactions on Big Data(以下简称“IEEE TBD”)公布了2021年度论文Winner奖和Runner Up奖。IEEE TBD由IEEE下设的9家分支机构联合支持出版,其中包括IEEE最大的两家协会——计算机协会和通信协会,以及信息处理协会、计算智能协会、汽车技术协会和消费技术协会等。
IEEE TBD期刊主要讨论大数据相关的创新和应用,始终坚持发表关于大数据系统、理论和实践领域高质量文章,并在全球范围内鼓励与支持大数据、知识工程、人工智能等多学科的工作。
在2021年的最佳论文奖项中,来自Meta AI Research(原Facebook AI Research)的Jeff Johnson、Matthijs Douze和Hervé Jégou因在“相似性搜索”领域做出的突破性成果而获得了论文Winner奖。
在三者合著的论文《Billion-scale similarity search with GPUs》中,Johnson等人提出了用于k-selection的设计,其运行速度可以达到理论峰值性能的55%,实现了比之前最佳GPU方法快8.5倍的最近邻搜索。
Runner Up奖则由圣卡洛斯联邦大学副教授Murilo C. Naldi、阿尔伯塔大学教授Joerg Sander等人获得,其在发表的论文《Hierarchical Density-Based Clustering Using MapReduce》中,提出了一种使用MapReduce的基于层次密度的新型聚类方法。
在该论文中,Naldi等人首先讨论了为什么当人们想要计算基于密度的聚类层次结构时,采用以前的方法来使用MapReduce并行化单链接聚类会导致非常低效的解决方案。随后,他们提出了一种不同的并行化方案,该方案基于一种更快的递归采样方法计算一个近似的聚类层次结构,能够使得使用MapReduce的方法可以有效地将基于层次密度的聚类应用于大型数据集。