受够了喷子？这个AI想帮你找回评论区的清净

我原本以为，互联网会让交流变得更容易。只需要连上网络，人们就能随时抒发自己的感想，可以和来自全国各地甚至世界任何地方的人交谈。但在社交网络上，事实越来越走向了反面：明明只是说几句个人感想，却一不小心就惹来了喷子。总有些人会在评论区留下语气最恶劣的攻击，看上一条就足以毁掉一整天的心情，这让人越来越失去了在网上讨论问题的欲望。

当然，我们可以选择把那些讨厌鬼和烦人的关键词统统拖进黑名单，只到私密的小圈子里说话，或者干脆什么也不说。但真的必须要这样吗？现在，一个看起来似乎更美妙的选项出现了：谷歌旗下的Jigsaw公司推出了一款名叫“Tune”的小工具，让用户个性化地过滤恶意评论，帮助人们把那些不和谐的声音调小。

Tune是一个chrome应用程序扩展，它从设计界面到宣传语都让人心情颇为舒畅。

简洁的设置界面中间是一个白色的旋钮，用鼠标点一点就可以在“安静”、“中等”、“大声”之类的档位之间随意切换。这些像音量旋钮一样的档位代表的是对评论的过滤程度。指针接近“安静”的一边，程序就会用更严格的标准去除有可能带有恶意的评论，让它们都从浏览者眼前消失。如果选了“大声”的一边，筛选标准就会相对放松。只要选好“音量”和在哪些网站进行使用，就可以开始浏览评论了。

Tune只会从特定用户的浏览器页面上去除攻击性评论，这些评论并不会真的被删除。同时，用语平和的反对意见也不会受到影响。那Tune怎么判定评论是否恶意呢？它其实使用了这家公司此前发布的应用程序接口Perspective，在背后负责为评论的“恶意度”打分的是一个AI。

AI会用数值评价一条评论是“健康”还是“有毒”（toxic），这里“有毒”的定义是：“用语粗鲁、不尊重或者不合理的评论，让人很想立刻终止讨论。”

开发Perspective时，人们首先提取了数以百万计的网络评论，招募人类打分员来为这些评论的“有毒程度”打分，然后再把这些作为AI的学习资料。在Perspective的网站上（www.perspectiveapi.com）有一个评论输入框可以用来感受这套AI打分系统。输入想测试的英文句子，网页就会迅速反馈这句话包含恶意的可能性有多少，如果觉得结果不对还可以点击进行修正。

像转音量旋钮一样轻松屏蔽讨厌的评论，单就创意来说这真是棒得让人想立刻点十个赞。但是，现在的Tune离让互联网环境变友好的理想还相差很远。这不仅仅是因为它还只能在chrome浏览器使用、只支持英文以及只适用于少数几个社交平台。最重要的问题在于：AI真能胜任这项工作吗？以及，我们真的要把管理评论的工作交给AI吗？

从2017年Perspective发布开始，这个评论识别技术其实就受到了不少批评。试用过评论打分框的人们纷纷吐槽这个AI还是太“傻”，不足以理解人类语言的复杂性。比如说，它有时会给实际并不激烈的言辞打出奇怪的高分，例如“如果他们干掉奥巴马医保人们就会死”。而且，真正的攻击性言论要想绕过AI其实也一点都不困难：有时候只需要删除几个空格，或者故意加点拼写错误就够了。

Jigsaw官方倒是也大方地承认了这些缺陷。他们在介绍页面声明：这只是一个试验产品，目前还在改进中。它现在还是会漏掉一部分恶意评论，或者不小心就把原本没什么问题的评论给隐藏了。同时他们也强调，这些技术不会成为解决全部互联网恶意的万灵药，当然更不可能解决那些针对性的威胁。不过他们觉得，这至少比完全关闭评论要好多了。