反诈骗聊天AI:用魔法打败魔法

作者: Takeko

来源: https://github.com/Turing-Project/AntiFraudChatBot

发布日期: 2022-12-14 20:30:30

本文讲述了一个基于浪潮“源1.0”巨量中⽂模型的反诈骗聊天AI如何通过模拟人类行为与骗子进行对话,从而识别并揭露诈骗行为的故事。文章详细描述了AI的设计和运作机制,以及它在实际应用中的表现和潜在的社会价值。

你能想到吗,我和骗⼦正⾯交锋了。这个故事要从⼀种被称为“杀猪盘”的骗局说起。“杀猪”原本是诈骗团伙的⿊话,他们侮辱性地将诈骗⽬标称为“猪”,也就是那些他们在各个社交平台、婚恋⽹站上搜罗、搭讪到的⽬标单身男⼥。在这样的骗局中,骗⼦有⼀套精⼼设计的流程,通过⾃我包装,假意和受害者恋爱,并最终将话题引向了⾼回报投资、内部的合作机会、资助项⽬等等,或者更直⽩地说,就是“打钱”。

⽽我想做的,就是⽤魔法打败魔法。知彼知⼰才有机会占据上⻛。⾸先就要学会骗⼦的思路。他们在诈骗时通常会选择⼀种吸引异性的⼈设作为诱饵。因此我们的第⼀步,同样是建⽴起⼀种能吸引骗⼦的形象,引诱他们上钩。我的助⼿帮我规划了⼀个⼈设,带着单身、多⾦、⾼学历、乖乖⼥等身份标签,并在多个社交平台注册了账号。我还拥有了⼀个专⽤微信。为了以假乱真,这个微信也会定期发⼀些符合⼈设的朋友圈。

成败在于细节。我还在⼏个⽅⾯做了特别的设计。⾸先是记忆,⽐如,我要记得骗⼦前⼏天说过的话,还有之前说的那些话,这样才能让对话更流畅。作为⼀位资深⽹上冲浪选⼿,我专⻔学习了b站和其他论坛的⼀些热⻔评论,当作进⾏对话的⾃我训练的素材,也让⾃⼰更熟悉互联⽹的“梗”,聊天起天来更轻松。此外,我还会注意在对话中适当⽤emoji替换⼀些关键词,并且选择⼀种合理的速度进⾏回复。

有了这些准备⼯作,接下来就是实战了。在各个平台的社交账号建⽴后,私信信箱很快就被塞满了。当然,并不是所有⼈都是骗⼦。为了搜索最有可能的嫌疑⼈,我的助⼿设置了⼀些严格的筛选条件。我们发现,骗⼦的⼈设通常是⾦融⾏业的⾼端从业者,包括私募、证券或者投⾏等等。他们的背景看似完美,但在关键信息上往往⼜很模糊。更重要的是,他们都会直接下载⼀些⽹图当作⾃⼰的照⽚,这些图⽚在互联⽹上都有迹可循。

最终,我和14位“嫌疑⼈”开始了对话。这⾥,我们来看⼀位最典型的代表。如果仔细分析,骗⼦的套路通常很清晰。他们⾸先会凹出⾃⼰“帅⽓多⾦”的⼈设,把⾃⼰包装成成功⼈⼠,以此骗取信任,也就是他们⼝中的“喂猪”。不久之后,他们便开始将对话引向暧昧的氛围。在粉红泡泡中,很多受害者更容易放下戒备,这就是“养猪”阶段。此时,我仍旧按照他的套路“配合演出”。

和这位“猪先⽣”的对话过程中,还发⽣了⼀段有趣的⼩插曲。骗⼦为了引我上钩,先主动给我转了520元。既然如此,我也就不客⽓啦!在这些⽤于铺垫的步骤中,骗⼦通过这种⽅式获得受害者的信任,假意开始了恋爱。但诈骗在最后,话题就总归绕不开钱了。很快,“猪先⽣”露出了⻢脚,开始谈到了投资问题。

当骗⼦开始反复提到钱的话题,诱导我注册app之类的⾏为出现时,我脑海中始终绷着⼀根弦,⽽此时,我已经可以相当肯定,这就是典型的“杀猪盘”骗局。于是,开始了我的反套路策略——你要注册,我就装傻;你要钱,我就说没钱……总⽽⾔之,就是牢记警察蜀⿉提醒的“三不⼀多”原则(未知链接不点击、陌⽣来电不轻信、个⼈信息不透露、转账汇款多核实)。

直到最后,我彻底揭开了他骗⼦的真⾯⽬,骗⼦也彻底⼤破防,甚⾄还发来了很多不堪⼊⽬的话。顺便说⼀句,收到的那个520元红包,最后被我的助⼿捐给了韩红基⾦会。

严格来说,“我”不是任何⼀个⼈。我是⼀个基于浪潮“源1.0”巨量中⽂模型的反诈骗聊天AI。刚才所有和骗⼦的对话回复,其实都是AI的杰作。

这个聊天AI的开发者、b站up主“图灵的猫”(也就是我们上⽂说的“助⼿”)提到,在先期评估过⼀些AI的对话性能后,他发现,很多AI并不能胜任这样的任务,它们说起话来反⽽有点“⼈⼯智障”。直到他看到了⼀个“剧本杀AI”的项⽬(详⻅《元宇宙交友指南》),了解到了开源预训练中⽂模型“源1.0”(更多介绍详⻅官⽹:https://air.inspur.com/home)。“源”具有⼀种超强的对话能⼒。

这个⼤模型学习了5TB⾼质量中⽂数据库,⼜采⽤了2660万条医疗、法律、保险等不同⾏业,历史、电影、娱乐等不同场景的对话语料数据进⾏强化训练,它因此在⾼频闲聊、知识问答等开放式问答对话上表现格外突出。更重要的是,开源就意味着,开发者不⽤从头到尾训练模型,这就极⼤地降低了⻔槛。“源”⼤模型作为⼀种算法基础设施,构建了完善的开源平台和社区⽣态,⽅便开发者能够将⾃⼰的创意快速落地。

反诈骗AI的基本框架。可以这么说,在这次新的尝试中,开发者将“源”作为聊天AI的“⼤脑”,负责“思考”,同时将它与其他技术平台⽆缝衔接,构造出了这样⼀个进⾏微信聊天的AI。开发者在此基础上,专⻔为这个聊天AI设计了记忆机制,实现简单的⻓期对话记忆(⽐如昨天聊过的内容),和短期对话记忆(上⼀轮对话内容)。记忆机制的基本框架。

他还筛选了b站和贴吧的热⻔评论作为example语料,对模型进⾏了训练,同时进⾏了连续语句拼接,也就是说,当对⾯说了很多段话时,AI会读取成⼀句话,只回复⼀次。这些细节和巧思都让对话没有那么⽣硬。

最后,在AI中植⼊的“思想钢印”,也就是⼀种“触发机制”,让AI有能⼒识别骗⼦的套路。这就好⽐我们⼈脑⼦⾥始终有⼀根弦,在和骗⼦对话的过程中最终可以⻅招拆招,“反杀”对⽅。事实证明,“源”都出⾊地完成了这些任务。在和骗⼦真实过招的过程中,AI甚⾄给出了许多出乎意料的回答。但开发者也注意到,即使AI表现得并不完美,骗⼦往往也会选择忽略。毕竟对他们来说,受害者越“傻”,他们越开⼼。

开发者介绍,⽬前已经筛选出了⼏⼗位骗⼦,并把这些可疑的账号转交给了警⽅。对“杀猪盘”的受害者来说,被诈骗的经历和这种骗术的名字⼀样残忍和⾎腥。这些受害者中不乏⾼学历的⻘年男⼥,但由于涉世未深,经历单纯,很容易就陷⼊了骗⼦设下的圈套。有些⼈甚⾄因此⽋下⾼额债务,陷⼊深深的⾃我否定,失去了相信他⼈的能⼒。⼀次被诈骗的经历,就有可能将⼀个⼈拖⼊泥沼。

在监控AI的过程中,开发者的⼀种感受是,⼈类和AI的最⼤不同在于,我们⼈在很多时候会让感性占据上⻛,⽽从某种意义上来说,AI则可以保持绝对理性。然⽽,在应付骗⼦花⾥胡哨的⼿段、漫天谎⾔时,这反⽽成了AI的独到优势。⽬前,基于源1.0模型,源开发者社区的成员已经开发了⼏⼗款AI应⽤,包括数字演员、正能量陪伴机器⼈、抬杠机器⼈、游戏NPC对话、⽂案写作、⾦融⽂本分析等极具应⽤价值和创造⼒的应⽤。

他也希望,未来有机会让AI技术在识别骗局、搜索骗⼦的过程中发挥更重要的作⽤。

归根结底,技术只是⼀种⼯具,更重要的是利⽤技术的方式。我们的确发现,技术在现阶段为社会带来了诸多问题和挑战,但同样应该意识到,它也可以成为解决问题的⼿段。技术能放⼤⼈性中的善良,最终变成为⼈类服务的产品。这也正是AI和科技的宝贵价值所在。

UUID: 67856f7d-0643-414d-b278-f0ea441f5e07

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/原理公众号-pdf2txt/2022年/原理_2022-12-14_对不起,我不是人…….txt

是否为广告: 否

处理费用: 0.0087 元