技术吃瓜:金句还是鸡汤,我们用大模型训练了一个报警器

作者: 小赵

来源: 果壳

发布日期: 2024-05-19 20:00:31

本文介绍了如何使用AI训练一个鸡汤识别机器人,以鉴别网络上的“参哥金句”是否为成功学鸡汤。通过选择合适的模型和设定评估标准,AI能够生成“鸡汤度评估报告”,帮助用户识别和避免误食“毒鸡汤”。

最近,大厂高管璩静的翻车风波天天霸占热榜。道歉、秒辞职、各种被黑阴谋论接连上演……我们就像瓜田里的猹,吃完这个吃那个,根本停不下来。原本只是大厂高管“何不食肉糜”论调惹众怒引发的翻车风波,日前突然被爆,原来她炸裂言论短视频,都与抖音千万粉丝大网红“海参哥”脱不了干系。甚至还有网友贴出她在公司群内要求所有人学习120条“参哥金句”截图。

这个网传的“参哥金句”引起了我们的注意,难道一个叱咤职场多年的女强人,奋斗多年,真被一个成功学大师网红给忽悠瘸了?为此,我们用AI训练了一个鸡汤识别机器人,也来帮璩总鉴别一下,花大价钱到底是卖到了操盘个人IP的成功捷径,还是人类高质量PUA毒鸡汤。

要训练这个AI鸡汤报警器,第一关就是选要用的模型,测试了几个基础问题之后,我们选择了最近闷声干大事儿的海螺AI。它由中国估值最高的模型公司之一MiniMax自主研发,而且已经接入了4月底刚刚推出的万亿MoE模型abab 6.5。根据MiniMax发布的技术报告,在各类核心能力测试中,abab 6.5接近GPT-4、Claude 3 Opus、Gemini 1.5 Pro等世界领先的模型。

为了确保它对“鸡汤文”有一定认知,先做一个小测试:返回的结果令我们非常满意。衡量一篇文章是否是是“干货”还是“鸡汤文”的维度,AI与人类的判定方式基本一致:普适性言论、缺乏深度、情感化语言、过度简化问题、缺乏实用建议、重复性、过度乐观、模板化结构。

在认知一致的前提下,我们开始通过不断优化prompt,设置规则,让AI建立一套量化评估鸡汤文的标准:定义每一个评估维度、建立评分标准、制作评分表、标准化处理量化指标……最终训练了一个AI鸡汤报警器。

当我们发给鸡汤警报器任意一篇文章,AI就会根据要求,为我们生成一份“鸡汤度评估报告”。为了验证它的有效性,我们用海螺AI总结的鸡汤标准,使用其他模型生成了超高浓度的“鸡汤文”。每篇文章发给鸡汤警报器,很快“鸡汤度评估报告”生成出来,嚯,鸡汤浓度居然高达90%。

为了验证报警器能稳定评估每一篇文章的鸡汤浓度,在评估网传“参哥金句”之前,我们还找了几篇不同类型文章发给AI鸡汤报警器,看他是否能给出中肯的评价。鸡汤警报器给出了75%鸡汤浓度的评价。并从各个角度分别为这篇文章打分,最终判定这篇文章虽然缺乏深度建议,但展示乐观的人生观,给人有温度的鼓励,是一篇能够给人提供心灵慰藉和人生启发的“鸡汤”。

紧接着,我们喂给鸡汤警报器一篇果壳亲子上的高赞育儿干货文,想看看这篇文章的鸡汤浓度如何(长文慎读)。鸡汤警报器给出了20%鸡汤浓度的评价。他判定文章里鸡汤的部分主要来自于作者用情感化语言,描述了孩子的成长和家长的感受,给人“鸡汤”感,其他维度则完全符合实用性干货文章的标准。

那么,我们将“参哥金句”喂给鸡汤警报器,它会怎么判断呢。在AI鸡汤警报器的眼中,这份文档的鸡汤浓度竟高达60%。妥妥一篇“浓汤宝”。尤其是在“普适性言论”、“缺乏深度”、“简化问题”等维度上,“完美”的踩中了AI对鸡汤判定点,收获了AI对这篇文章满分鸡汤的评价。

有了这个“鉴鸡汤”神器,看到文章别急着感动、收藏、记笔记,先发给AI鉴定鸡汤浓度,一定能大大降低误食“毒鸡汤”的概率,也不至于被骗子网红忽悠瘸了。大家可以在评论区发出来你想拿来鉴鸡汤的文章,我们也来帮你鉴别一下!

UUID: 7fd58865-b54e-4272-b71e-4ebf42b24a27

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/果壳公众号-pdf2txt/2024/果壳_2024-05-19_技术吃瓜:金句还是鸡汤,我们用大模型训练了一个报警器.txt

是否为广告: 否

处理费用: 0.0080 元