受够了喷子?这个AI想帮你找回评论区的清净

作者: 窗敲雨

来源: 果壳

发布日期: 2019-03-15

谷歌旗下的Jigsaw公司推出了一款名为“Tune”的工具,旨在帮助用户个性化过滤恶意评论,恢复网络评论区的清净。该工具通过AI技术对评论进行“恶意度”评分,并根据用户设置的过滤程度屏蔽攻击性评论。然而,该技术仍存在局限性,如对语言复杂性的理解不足,以及可能被简单的语言技巧绕过。

我原本以为,互联网会让交流变得更容易。只需要连上网络,人们就能随时抒发自己的感想,可以和来自全国各地甚至世界任何地方的人交谈。但在社交网络上,事实越来越走向了反面:明明只是说几句个人感想,却一不小心就惹来了喷子。总有些人会在评论区留下语气最恶劣的攻击,看上一条就足以毁掉一整天的心情,这让人越来越失去了在网上讨论问题的欲望。

当然,我们可以选择把那些讨厌鬼和烦人的关键词统统拖进黑名单,只到私密的小圈子里说话,或者干脆什么也不说。但真的必须要这样吗?现在,一个看起来似乎更美妙的选项出现了:谷歌旗下的Jigsaw公司推出了一款名叫“Tune”的小工具,让用户个性化地过滤恶意评论,帮助人们把那些不和谐的声音调小。

Tune是一个chrome应用程序扩展,它从设计界面到宣传语都让人心情颇为舒畅。

简洁的设置界面中间是一个白色的旋钮,用鼠标点一点就可以在“安静”、“中等”、“大声”之类的档位之间随意切换。这些像音量旋钮一样的档位代表的是对评论的过滤程度。指针接近“安静”的一边,程序就会用更严格的标准去除有可能带有恶意的评论,让它们都从浏览者眼前消失。如果选了“大声”的一边,筛选标准就会相对放松。只要选好“音量”和在哪些网站进行使用,就可以开始浏览评论了。

Tune只会从特定用户的浏览器页面上去除攻击性评论,这些评论并不会真的被删除。同时,用语平和的反对意见也不会受到影响。那Tune怎么判定评论是否恶意呢?它其实使用了这家公司此前发布的应用程序接口Perspective,在背后负责为评论的“恶意度”打分的是一个AI。

AI会用数值评价一条评论是“健康”还是“有毒”(toxic),这里“有毒”的定义是:“用语粗鲁、不尊重或者不合理的评论,让人很想立刻终止讨论。”

开发Perspective时,人们首先提取了数以百万计的网络评论,招募人类打分员来为这些评论的“有毒程度”打分,然后再把这些作为AI的学习资料。在Perspective的网站上(www.perspectiveapi.com)有一个评论输入框可以用来感受这套AI打分系统。输入想测试的英文句子,网页就会迅速反馈这句话包含恶意的可能性有多少,如果觉得结果不对还可以点击进行修正。

像转音量旋钮一样轻松屏蔽讨厌的评论,单就创意来说这真是棒得让人想立刻点十个赞。但是,现在的Tune离让互联网环境变友好的理想还相差很远。这不仅仅是因为它还只能在chrome浏览器使用、只支持英文以及只适用于少数几个社交平台。最重要的问题在于:AI真能胜任这项工作吗?以及,我们真的要把管理评论的工作交给AI吗?

从2017年Perspective发布开始,这个评论识别技术其实就受到了不少批评。试用过评论打分框的人们纷纷吐槽这个AI还是太“傻”,不足以理解人类语言的复杂性。比如说,它有时会给实际并不激烈的言辞打出奇怪的高分,例如“如果他们干掉奥巴马医保人们就会死”。而且,真正的攻击性言论要想绕过AI其实也一点都不困难:有时候只需要删除几个空格,或者故意加点拼写错误就够了。

Jigsaw官方倒是也大方地承认了这些缺陷。他们在介绍页面声明:这只是一个试验产品,目前还在改进中。它现在还是会漏掉一部分恶意评论,或者不小心就把原本没什么问题的评论给隐藏了。同时他们也强调,这些技术不会成为解决全部互联网恶意的万灵药,当然更不可能解决那些针对性的威胁。不过他们觉得,这至少比完全关闭评论要好多了。

UUID: 2b2a8433-b3f1-426d-b634-47e11225c066

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/果壳公众号-pdf2txt/2019/2019-03-15_受够了喷子?这个AI想帮你找回评论区的清净.txt

是否为广告: 否

处理费用: 0.0037 元