AI日报|GPT-4教GPT-3.5编程,效果怎么样?

来源: 学术头条

发布日期: 2023-10-09 17:16:44

今日人工智能领域的重要动态包括微软CEO对谷歌的竞争扼杀指控、CEO们对AI投资的高度重视、科技公司对AI时代“iPhone”的争夺、IBM发布新的AI驱动的威胁检测和响应服务、以及关于GPT-4教授GPT-3.5编程效果的研究。

今⽇值得关注的⼈⼯智能新动态:抨击⾕歌!微软⾸席执⾏官:他们在扼杀竞争。微软⾸席执⾏官 Satya Nadella 与 Alphabet 获取免费报告存在分歧,并在最近针对⾕歌运营商的反垄断诉讼中出庭作证。Nadella 明确表示,他认为 Alphabet 利⽤其巨⼤的影响⼒来扼杀竞争。他还认为,Alphabet 在兜售⼀种错误的说法,即 OEM 合作伙伴有选择,但实际上他们没有选择。

另外,Nadella 还分享了他对⼈⼯智能的恐惧,他担⼼的是,现在所有⼈都能获得的内容——真正的知识,会变成专有内容。这可能不是机器⼈奴役⼈类,⽽是⼀种更难以防范的微妙危险。

毕⻢威调查:⾸席执⾏官们将 AI 视为投资的重中之重。毕⻢威对 400 名美国⾸席执⾏官的最新调查显示,超过三分之⼆的⾸席执⾏官将投资⽣成式⼈⼯智能(AI)作为公司的⾸要任务。

虽然⼈们对 AI 的兴奋是显⽽易⻅的,⽽且企业也将其作为重中之重,但这些投资可能需要⼀段时间才能获得回报。毕⻢威的调查发现,62% 的⾸席执⾏官预计 AI 投资将在三到五年内获得回报,⽽ 23% 的⾸席执⾏官预计仅⼀到三年就能获得回报。

谁将拥有 AI 时代的“iPhone”?

随着 ChatGPT 等⽣成式 AI ⼯具席卷全球,科技公司希望通过包含 AI 功能的新设备从炒作中获利——科技领导者将这种现象称为“iPhone 时刻”。上周,⻢克·扎克伯格推出了 Meta 的最新⼀代 Ray-Bans Meta 智能眼镜,佩戴者可以通过 Meta 的对话助⼿ Meta AI 与眼镜对话,实时接收信息,并⽤它来直播视频⽚段。

甚⾄有报道称,苹果公司前设计总监、曾领导 iPhone 设计的 Jony Ive 和 OpenAI ⾸席执⾏官 Sam Altman 正在共同打造⼀款专⽤的 AI 硬件设备,“采⽤全新的外形设计,不受矩形屏幕的限制”。据报道,软银⾸席执⾏官 Masayoshi Son 正考虑向该企业注资 10 亿美元。

这款神秘的设备还没有正式公布,但 Altman 告诉 Salesforce ⾸席执⾏官 Marc Benioff,“不把智能集成到每个产品和服务中,很快就会变得不可想象”。

IBM 发布新的 AI 驱动的威胁检测和响应服务。IBM 今天发布了其管理检测和响应服务的下⼀代产品,该产品采⽤了新的⼈⼯智能技术,包括⾃动升级或关闭⾼达 85% 的警报能⼒,有助于加快客户的安全响应时间。

新的威胁检测和响应服务(TDR)可全天候监控、调查和⾃动修复来⾃客户混合云环境中所有相关技术的安全警报,包括现有的安全⼯具和投资,以及云、内部部署和运营技术(OT)。托管服务由 IBM 咨询公司的全球安全分析师团队通过 IBM 先进的安全服务平台提供,该平台从公司庞⼤的全球安全⽹络中应⽤多层 AI 和上下⽂威胁情报,帮助⾃动消除噪⾳,同时快速升级关键威胁。

Thought Propagation:利⽤ LLMs 进⾏复杂推理的类⽐⽅法。随着提示⽅法的发展,⼤型语⾔模型(LLMs)在推理任务中取得了显著的成就。然⽽,现有的提示⽅法⽆法重复利⽤解决类似问题的经验,并且在多步骤推理中存在累积错误,因为它们会提示 LLMs 从头开始推理。

为了解决这些问题,来⾃中国科学院、英国耶鲁⼤学的研究⼈员提出了 Thought Propagation,它可以探索类似问题,并利⽤它们的解决⽅案来增强 LLMs 的复杂推理能⼒。实验表明,TP ⽐基线⽅法有了⼤幅改进,在最短路径推理中,找到最优解的绝对值平均提⾼了 12%;在创意写作中,⼈类的偏好提⾼了 13%;在 LLM-Agent Planning 中,任务完成率提⾼了 15%。

GPT-4 教 GPT-3.5 编程效果怎么样?研究⼈员研究了⽣成式 AI 模型在提供⼈类导师式编程提示⽅⾯的作⽤,来帮助学⽣解决程序中的错误。最近的⼀些研究已经针对各种反馈⽣成场景对最先进的模型进⾏了基准测试;然⽽,这些模型的整体质量仍然不如⼈类导师,还不能⽤于现实世界的部署。

来⾃⻢克斯·普朗克软件系统研究所、密歇根⼤学和微软的研究⼈员试图将⽣成式 AI 模型推向提供⾼质量编程提示的极限,并开发了⼀种新技术 GPT4Hints-GPT3.5Val。第⼀步,该技术利⽤ GPT-4 作为“导师”模型来⽣成提示。下⼀步,利⽤ GPT-3.5(⼀个较弱的模型)作为“学⽣”模型来进⼀步验证提示质量。

该研究使⽤三个真实世界的 Python 程序数据集进⾏了⼴泛的评估,涵盖了从基本算法到正则表达式以及使⽤ pandas 库进⾏数据分析等各种概念,从⽽展示了此技术的功效。

利⽤多代理强化学习进⾏⾃我监督神经元分割。现有监督神经元分割⽅法的性能⾼度依赖于准确注释的数量,尤其是在应⽤于⼤规模电⼦显微镜(EM)数据时。

通过从⽆标注数据中提取语义信息,⾃监督⽅法可以提⾼下游任务的性能,其中掩码图像模型(MIM)因其简单有效,能从掩码图像中恢复原始信息⽽得到⼴泛应⽤。然⽽,由于电磁图像具有⾼度的结构局部性,同时存在⼤量噪声,许多体素⼏乎不包含辨别信息,这使得 MIM 预训练在神经元分割任务中效率低下。为了克服这⼀难题,该研究提出了⼀种基于决策的 MIM,它利⽤强化学习(RL)⾃动搜索最佳图像掩蔽⽐例和掩蔽策略。

由于探索空间巨⼤,使⽤单个代理 RL 进⾏体素预测是不切实际的。因此,研究⼈员将每个输⼊补丁视为⼀个具有共享⾏为策略的代理,从⽽实现多代理协作。实验表明,在神经元分割任务上,此⽅法与其他⾃监督⽅法相⽐具有显著优势。

微软新研究:减少 LLMs 幻觉的⾃然语⾔推理链。⼤型语⾔模型(LLMs)可以在给定相关⽂档作为背景语境的情况下⽣成流畅的⾃然语⾔⽂本。

这种能⼒引起了⼈们对开发 LLMs ⾏业应⽤的极⼤兴趣。然⽽,LLMs 容易产⽣没有所提供来源⽀持的幻觉。该研究提出了⼀个分层框架来检测和减轻这种⽆根据的幻觉。该框架使⽤⾃然语⾔推理链进⾏幻觉检测,并通过后期编辑减少幻觉。此⽅法在幻觉检测⽅⾯实现了最先进的性能,并通过重写提⾼了⽂本质量,使⽤ LLM 时⽆需任何微调或特定领域的提示⼯程。

研究表明,这种简单的即插即⽤框架可以作为幻觉检测和减少幻觉的有效选择,在各种情况下都能实现具有竞争⼒的性能。

UUID: 0628ab67-da2b-4323-9b8e-280bc1b649a6

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/学术头条公众号-pdf2txt/学术头条2023年/学术头条_2023-10-09_AI日报|GPT-4教GPT-35编程,效果怎么样?.txt

是否为广告: 否

处理费用: 0.0077 元