信息检索与推荐必读论文

AMiner 研究团队开发出一款利用人工智能（AI）技术、帮助科研工作者阅读论文的智能论文搜索工具。该工具可以展示出该领域的必读论文，并且对所选论文进行“智能”阅读，反馈给你该论文的综述、研究方法及主要结论，即帮你快速阅读文献，大大地节省了时间和精力。信息检索（Information Retrieval，IR）是指信息的表示、存储、组织和访问。

信息推荐（Information Recommendation）是指系统向用户推荐用户可能感兴趣但又无法获取的有用信息。信息检索与推荐的学术论文数量众多，并且每年高度增长。

对于该领域科研人员来说，工作负担越来越重、耗时越来越长、精力越来越不够用……作为信息检索和推荐领域的研究人员，如何快速、准确、便捷地从浩瀚的文献资源中找出必读论文，阅读所需要的相关文献知识，并且能够从大量数据中发现隐含的、有价值的信息，进而整合与创造出更大的科研成果和社会效益？

经过热心用户的精心整理，AMiner 推出了信息检索与推荐必读论文，并辅以“一键综述”、“智能论文精读”等工具帮助科研工作者高效阅读论文。下面我们精心挑选信息检索与推荐领域必读论文 10 篇奉上，帮助你快速了解相关知识。

1. 论文标题：Information filtering and information retrieval: two sides of the same coin? 作者：Nicholas J. Belkin, W. Bruce Croft 期刊/会议：Commun. ACM, pp. 29-38, 1992. 一键综述：信息过滤和信息检索：同一枚硬币的两个侧面？

方法：信息检索与过滤模型：l 信息检索与信息过滤的一般概念 l 特定的信息检索模型，这些模型主要集中在比较过程中。三大替代方法是布尔，向量空间和概率检索模型。l 检索与过滤的概率模型 l 过滤模型结论：本文考虑了信息过滤和信息检索之间的关系。在抽象层次上，两者之间差异不大：它们的目标基本上是相同的，此外，起初看来是信息过滤所特有的大多数问题实际上是 IR 问题的专业化。

2. 论文标题：Content-based multimedia information retrieval: State of the art and challenges 作者：Michael S. Lew, Nicu Sebe, Chabane Djeraba, Ramesh Jain 期刊/会议：TOMCCAP, 2(1), 1-19. 一键综述：基于内容的多媒体信息检索超越了科学、艺术和文化的范围，为搜索世界各地各种媒体提供了新的范例和方法。

方法：本研究回顾了 100 多篇有关基于内容的多媒体信息检索的最新文章，并讨论了它们在当前研究方向中的作用，包括浏览和搜索范例、用户研究、情感计算、学习、语义查询、新功能和媒体类型、高性能索引和评估技术。结论：尽管多媒体信息检索方面的学术研究取得了长足的进步，但 MIR 研究对商业应用的影响相对较小，除了一些细分市场，例如视频分割。

但这些研究尚处于起步阶段，未来有必要避免 MIR 社区与现实世界的利益隔离。

3. 论文标题：Learning to rank: from pairwise approach to listwise approach 作者：Zhe Cao, Tao Qin, Tie-Yan Liu, Ming-Feng Tsai, Hang Li 期刊/会议：ICML, pp. 129-136, 2007. 一键综述：本文涉及学习排名，即构建用于对对象进行排名的模型或函数。

学习排名对于文档检索、协作过滤和许多其他应用很有用。方法：l Listwise 方法：以文档检索为例，对学习排名进行了一般性描述。l 概率模型：我们使用一种概率模型将分数列表映射到概率分布，然后将两个概率分布之间的任何度量作为损失函数。这两个模型分别称为置换概率和最高概率。l ListNet 学习方法：以神经网络为模型、梯度下降为优化算法，基于最高概率对列表式损失函数进行优化。

结论：本文提出了一种学习排名的新方法，称为列表方法。并认为，在学习排名时，采用这种方法要比传统的成对方法更好。在列表式方法中，我们在学习中使用对象列表作为实例，而不是使用对象对作为实例。列表方法的关键问题是定义逐列表损失函数。本文提出了采用概率方法来解决这个问题，具体而言，利用概率模型，即排列概率和排名靠前的概率，将排名分数转换为概率分布。

然后，将概率分布之间的任何度量（例如交叉熵）视为按列表损失函数。作者使用神经网络和梯度下降技术开发了一种学习方法。通过三个数据集的实验结果表明，该方法比现有的成对方法（如 RanNet，Rating SVM 和 RankBoost）效果更好，这表明采用列表方法来学习排名更好。

4. 论文标题：Extended Boolean information retrieval 作者：Gerard Salton, Edward A. Fox, Harry Wu 期刊/会议：Commun. ACM, pp. 1022-1036, 1983. 一键综述：在常规的信息检索中，使用索引项的布尔组合来制定用户的信息请求。

虽然原则上可以通过布尔查询检索任何文档，但是通过布尔处理可获得的输出量很难控制，并且检索到的项目不会按对用户群体重要的任何重要顺序排列。方法：该论文引入一个处于查询处理的布尔系统和矢量处理模型之间、新的扩展布尔信息检索系统，该系统保留了布尔系统固有的查询结构，同时可以将加权术语合并到查询和存储的文档中；检索到的输出还可以按照与用户查询严格相似的顺序进行排序。可以修改常规检索系统以利用扩展系统。

实验室测试表明，扩展系统比布尔或矢量处理系统产生更好的检索输出。结论：新的扩展系统在对布尔逻辑使用中固有的术语连接词的严格解释与完全不存在表征矢量处理系统的查询结构之间架起了一座桥梁。通过各种样品收集获得的实验证据，表明扩展匹配系统比常规布尔系统或矢量处理系统更强大。

5. 论文标题：The Role of Google Scholar in Evidence Reviews and Its Applicability to Grey Literature Searching 作者：neal r haddaway, alexandra collins, deborah coughlin, stuart a kirk 期刊/会议：PLOS ONE, 2015. 一键综述：Google 学术搜索（GS）在证据审核中的作用及其在灰色文献搜索（是指商业学术出版商未正式发表的文章）中的适用性。

方法：使用来自环境科学的系统评价案例研究，该文调查了 GS 在系统评价和寻找灰色文献中的效用。结论：GS 的结果包含适量的灰色文献，大多数平均在第 80 页上找到。当进行特定搜索时，使用 Web of Science 鉴定的大多数文献也都是使用 GS 发现的。

但是，当在 Web of Science 中使用类似的搜索字符串时，显示结果存在中等/较差的重叠和 GS（10％到 67％），并且在六个案例研究中的五个案例中，GS 错过了一些重要的文献。此外，一般的 GS 搜索无法从涉及手动搜索组织网站的案例研究中找到任何灰色文献。如果用于灰色文献的系统评价，作者建议对文章标题的搜索应集中在前 200 至 300 个结果上。

结论是，尽管 Google 学术搜索可以找到许多灰色文献和特定的已知研究，但不应单独将其用于系统的评论搜索。相反，它是其他传统搜索方法的有力补充。此外，作者提倡使用工具透明地记录和分类 GS 搜索结果，以保持较高的透明度和更新能力，这对于系统评价至关重要。

6. 论文标题：Novelty and diversity in information retrieval evaluation 作者：Charles L.A. Clarke, Maheedhar Kolla, Gordon V. Cormack, Olga Vechtomova, Azin Ashkan, Stefan Büttcher, Ian MacKinnon 期刊/会议：SIGIR, pp. 659-666, 2008. 一键综述：将 PRP 解释为定义由 IR 系统优化的目标函数的起点。

方法：l 探索了基于先前理论的测试集合的创建。l 以 TREC 2005 和 2006 问答环节的测试集作为起点。l 尽管这些集合是为完全不同的目的而构建的，但它们确实提供了所需集合的基本结构。l 使用 TREC 2005 QA 测试集进行探索性工作；与 2006 年馆藏的结果一致。结论：该文提出了一种评估框架，可以系统地奖励新颖性和多样性。

根据累积收益将这个框架发展成为一项具体的评估指标，使用基于 TREC 问答路径的测试集证明了所用方法的可行性。目标是为信息检索定义一个可行的评估框架，以合理的方式说明新颖性和多样性。文件通过信息块与相关性链接，信息块一方面代表文件的属性，另一方面代表信息需求的组成部分。

7. 论文标题：Resolving Ambiguity for Cross-language Retrieval 作者：L. Ballestreros, W. B. Croft 期刊/会议：ACM SIGIR, pp. 64-71, 1998. 一键综述：改善跨语言检索效率的主要障碍之一是减少与查询翻译相关的歧义。方法：l 平行语料库可用于消除术语翻译的歧义。

l 可以使用共现统计来消除术语作为短语成分的歧义。可以将其用于一般术语的歧义消除，并将其与并行语料库技术进行比较。l 将术语与歧义配对，以消除歧义. l 在此调查中，锚是具有明确翻译，专有名词或短语翻译的查询名词。结论：l 改善跨语言检索效率的主要障碍之一是减少与查询翻译相关的歧义。l 翻译错误主要是由于添加了多余的术语以及无法正确翻译短语。l 短语翻译更成问题。

l 词典无法提供足够的上下文来进行准确的短语翻译。l 语料库分析可以利用此信息来大大减少短语翻译的歧义。l 共现技术可用于减少术语翻译的歧义。

8. 论文标题：An Overview of Microsoft Academic Service (MAS) and Applications 作者：Arnab Sinha, Zhihong Shen, Yang Song, Hao Ma, Darrin Eide, Bo-June Paul Hsu, Bo-June Paul Hsu, Kuansan Wang 期刊/会议：WWW (Companion Volume), pp. 243-246, 2015. 一键综述：该文描述了 Web 规模实体图的新版本，作为 Microsoft 学术服务（MAS）的骨干，其范围扩大到同名垂直搜索引擎，该引擎自 2008 年以来作为研究原型。

方法：本文提出了两个在学术领域的应用出版物来展示新兴搜索范式的潜力。第一个应用程序说明了自然语言驱动的交互式搜索体验。通过利用学术领域中实体之间的关系，自然语言处理器能够获取语法和语义线索，以解析和预测用户查询。第二个应用程序演示了推荐系统如何利用不同类型实体之间的关系来提供异构建议。

结论：MAS 的核心是一个异构实体图为学术活动建模，该图由六种类型的实体组成：研究领域，作者，机构，论文，会场和事件。除了像以前所做的那样从发布者供稿中获取这些实体之外，此版本中还包括来自 Web 索引的数据挖掘结果以及来自主要商业搜索引擎 Bing 的内部知识库。Bing 集成的结果是，新的 MAS 图的大小显着增加，随着搜索引擎发现新的信息，这些信息将自动流过。

此外，知识库中包含的丰富实体关系提供了其他信号，以消除和丰富学术领域内外的实体。例如，根据 Microsoft Research 的学术活动得出的测试数据集，由 MAS 编制索引的论文数量已从低数千万增长到 8,300 万，同时保持了 95％以上的准确性。基于数据集，我们演示了这项工作中的两种情况：知识驱动的高度交互性对话框，将对话式搜索和主动式建议体验无缝地结合在一起，以及主动式异构实体推荐。

9. 论文标题：Toward the Next Generation of Recommender Systems: A Survey of the State-of-the-Art and Possible Extensions 作者：Gediminas Adomavicius, Alexander Tuzhilin 期刊/会议：IEEE Trans. Knowl. Data Eng., pp. 734-749, 2005. 一键综述：本文介绍了推荐系统领域，并介绍了当前的推荐方法，这些推荐方法通常分为以下三个主要类别：基于内容的推荐方法，协作推荐方法和混合推荐方法。

方法：推荐系统：基于内容的推荐方法、协作推荐系统、混合方法。结论：本文描述了当前推荐方法的各种局限性，并讨论了可能的扩展，这些扩展可以提高推荐功能并使推荐器系统适用于更广泛的应用程序。这些扩展包括：改善对用户和项目的理解，将上下文信息纳入推荐过程，支持多重标准评级，以及提供更灵活，更具干扰性的推荐类型。

过去十年中，当多种基于内容、协作和混合的方法并开发了几种“工业强度”系统时，推荐系统取得了长足的进步。但是，尽管取得了所有这些进步，但本文当前推荐系统仍需要进一步改进以制定推荐方法在更广泛的应用中更有效。本文回顾了当前推荐方法的各种局限性，并讨论了可以提供更好推荐功能的可能扩展。

这些扩展包括：改进的用户和项目建模，将上下文信息合并到推荐过程中，对多重标准评级的支持以及提供更灵活，更具侵入性的推荐过程。

10. 论文标题：Evaluating collaborative filtering recommender systems 作者：Jonathan L. Herlocker, Joseph A. Konstan, Loren G. Terveen, John T. Riedl 期刊/会议：ACM Transactions on Information Systems (TOIS), pp. 5-53, 2004. 一键综述：推荐系统已经以许多通常无法比拟的方式进行了评估。

本文回顾了评估协作过滤推荐器系统的关键决策：正在评估的用户任务，正在使用的分析类型和数据集，测量预测质量的方式，对除质量以外的预测属性的评估，以及基于用户的整个系统评估。方法：本文回顾了评估协作过滤推荐器系统的关键决策：正在评估的用户任务，正在使用的分析类型和数据集，测量预测质量的方式，对除质量以外的预测属性的评估，以及基于用户的整个系统评估。

除了回顾以前的研究人员使用的评估策略外，还提供了对一个内容域中各种准确性指标进行分析的经验结果，其中所有测试指标都大致分为三个等效类。每个对等类别中的指标高度相关，而不同对等类别中的指标不相关。结论：本文概述了评估中已考虑的因素，并介绍了应在评估中考虑的新因素。此外，介绍了关于准确性指标的经验结果，从而提供了有关不同评估指标的结果可能如何变化的一些初步见解。

本文将提高人们对报告的评估中潜在偏见的认识，在必要时增加评估维度的多样性，并鼓励开发更加标准化的评估方法。