最近,OpenAI给付费用户开放了一个新功能——GPT mentions,简单来说,就是你在对话框里可以打出“@”,召唤具体的GPTs(类似于配置好的app)。正值打工人年前述职,这会儿你就可以@出The Negotiator——一个提供谈判建议和技巧的机器人,具体咨询如何和老板谈升职加薪。The Negotiator会cos你的老板,和你激情谈判。
你还可以指定机器人直接唱反调,把谈判难度拉到地狱难度(万一你们老板就是这么难搞,也算是提前操练过了)。GPT Store上的应用千千万,你都可以@来干活,就像在群聊里为所欲为的老板一样。
如果这个工作流设计得足够丝滑,能闭环、滚动,GPTs之间自动化互动似乎很接近人们所说的AI Agent(智能体)。这个新功能让用户可以更直接地调用上架的GPTs,也让开发者看到,自己的应用有了一个被更直接、更高频调用的入口……这两方将互相驱动。
说到AI应用搭建平台,在上周,字节跳动上线了国内版Coze(中文名:扣子)。扣子界面很简洁,有已经配置好的Bots,比如“简历诊断”、“米其林星探”等等,插件则是各种各样的获取数据的接口,以及执行具体动作的工具。当你想创建一个bot,把这些插件直接拉来编排成工作流就能跑起来了。
这样的搭建体验让我想起iOS上的“快捷指令”(Shortcuts),根据自己的个性化需求,把实现路径拆解后,交由已有插件去连接和完成……它们还都是“开源”的。Coze上的bot和快捷指令都能分享出去,别人能打开后看到应用的运行逻辑,也能拿来魔改,自由度很高。目前,Coze支持一键发布到飞书、微信公众号、豆瓣等渠道。
大模型这把火,烧得哪儿都是。
市场低迷的智能手机厂商,像看到了救命稻草一般,都开始将自家手机包装成“AI手机”。但由于手机性能有限,装进手机上的大模型的参数规模一般较小,和参数规模高达千亿级且靠云端驱动的ChatGPT,有着本质上的差距。我们看到,这些厂商主打的AI功能大概就是对长文章进行总结,编辑小红书文案,以及用文字生成图片……有多少用户高频使用这些功能?有相关的统计吗?
有人说,“生成式大模型的远水,解不了智能手机厂商的近渴”。
值得注意的是,近期推出的三星S24系列,中国官网注明:“目前用户可免费使用Galaxy AI功能,但未来三星可能将其部分或全部AI功能变更为有偿服务;第三方提供的AI可能适用于不同的条款。”如果说目前手机上的AI功能只能算是“甜品创新”,那一个叫Arc Search的移动端AI搜索app,就是在具体需求的挖掘上做专精了,不少人直呼好用。
过程大概是这样:当你打出“Why is Twitter now called X”,就看到这个问题后面出现了“Browse for me”的标识,一点,只见AI展示了它刚读过的好几个相关网页,然后将答案总结后分点展示……结果直观呈现了Twitter到X的各个层面的变化、背后的原因、后续的影响以及马斯克对“X”的偏爱等等。可以直接问刚过去的球赛情况如何,AI直接做了个体育画报。
目前Arc Search的AI整理只支持英文。
Arc Search之所以让人眼前一亮,是因为它抓住了用户在小屏设备上想快速了解大致信息的诉求:不跳转、不切屏、一页看个大概。如果你上月底在X上搜索“Taylor Swift”,可能会查不到任何信息。因为在此之前,有人针对国际巨星Taylor Swift,用AI生成数百张色情图像。这惊动了白宫,发言人称女性是网络骚扰、欺凌的主要目标,社交媒体得起到规范作用。X屏蔽了词条,紧锣密鼓地整改。
现在,已搜不到相关不雅照了。但对名人,以及女性,都造成了不可逆的伤害。AI技术的滥用,让这些受害者遭遇了“数字强奸”。这些虚假照片大多用到了“Deepfake”——用AI把一个人的脸换到另一个人的照片/视频当中的技术。除了换脸,还有“一键脱衣”软件,比如Deepnude:上传人物照片,软件就能识别原始照片中的衣物,然后替换成裸露的皮肤。造黄谣的成本,不断降低。
这两天,苹果Vision Pro在美国上架,不少网友放出了体验视频,其中就有这个给男友实时换脸的应用。对此,微博网友@Naituw表示:“因为隐私的因素,目前visionOS SDK的能力还是比较受限的。视频里的概念效果,实际上目前第三方是无法实现的。”近期有报道称微软与OpenAI正洽谈参与人形机器人公司Figure的新一轮融资,本轮融资金额最高达5亿美元。
这已是OpenAI出手的第二家人形机器人公司,事实上,像谷歌、英伟达、马斯克这些布局大模型的玩家,都在探索人形机器人业务。据Figure介绍,他家的Figure 01可以在观看10个小时的视频后,开始独立操作咖啡机,完成出品。其工程师强调,Figure 01的行为,包括纠正行为,都是完全自主的,而不是远程操作的。
而我们之前报道《人造智障机器人终于来了点新活,这次会做粤菜了》过的Mobile ALOHA,它做家务的流畅演示大多是通过人类远程操作的结果。
Mobile ALOHA刷屏后,团队在YouTube上放出了机器人失败集锦视频。