2021年4月23日,国际万维网会议委员会宣布,今年的「Seoul Test-of-Time Award」大奖授予于WWW 2011上发表的论文「Information credibility on twitter」。该论文的作者为西班牙庞培法布拉大学教授Carlos Castillo、智利大学副教授Barbara Poblete、智利圣玛利亚理工大学副教授Marcelo Mendoza。
该论文是社交网络信息可信度分析的里程碑式工作,它通过经典的统计分析和机器学习方法巧妙地设计了用于自动评估推特帖子可信度的特征,详细地探究了各特征对推文可信度评估任务的影响,对后继研究具有巨大的启发意义。
在本文发表之前,研究人员针对传统社交媒体和博客上的新闻可信度进行了大量的研究。
在Twitter新闻可信度分析领域,Schwarz和Morris于2011年的人机交互顶级会议ACM CHI大会上在论文「Augmenting Web Pages and Search Results to Support Credibility Assessment」中指出,向用户提供互联网内容的可信度估计结果是非常有意义的。
相关研究发现,在缺乏外部信息的情况下,对于在线内容可信度的感受会在很大程度上收到与风格有关的特征的影响。而用户也可能会由于推文作者的性别而转变其对推文可信度的感受。与传统媒体相比,当相同新闻标题出现在Twitter上时,用户往往会觉得新闻的可信度有所下降。
在本文中,作者分析了通过Twitter传播的新闻的可信度。
在此之前,研究工作往往表明在Twitter上发布的信息大多数是真实的,但是实际上Twitter服务也常常在无意间被用于传播错误或虚假的信息。在本文中,作者提出了自动评估给定的Tweet文章的可信度的方法。具体而言,作者对与热门话题相关的微博帖子进行了分析,并根据从中提取到的特征将帖子分为「可信」和「不可信」两类。
在本文中,作者使用到的特征包括用户发布帖子、转发帖子的行为,帖子的文本,以及对外部信息源的引用。在评估本文提出的分析方法时,作者使用了大量对于近期发布的Twitter帖子样本内容可信度的人工评价。研究结果表明,我们可以测量出信息传递方式之间的差异,这些差异可以被用来自动地对信息的可信度进行分类,分类的准确率在70%-80%之间。