全球人工智能新动态

全球首位人工智能DJ诞生。美国一家电台KBFF Live 95.5 FM通过使用RadioGPT软件，成为世界上首个推出由人工智能驱动的DJ电台，这为电台节目创作和内容推送带来了新的可能。

研究人员提出了AniFaceDrawing，可以使用StyleGAN将粗糙的草图转换为高质量的动漫肖像。

Stack Overflow的一项调查显示，44%的开发人员已经在使用AI工具，另有26%的开发人员将很快会使用。另外，77%的开发人员对AI工具在其开发工作中扮演的角色感到满意；33%的开发人员认为提高生产力是他们选择使用AI工具的最重要原因；42%的开发人员表示，他们相信AI工具输出内容的准确性。

研究人员公布了一个新颖的零样本文本指导的视频到视频的翻译框架，适应图像模型以创建高质量的连贯视频。该框架以较低的成本（无需重新训练或优化）实现了全局风格和局部纹理的时间一致性，其适应性与现有的图像扩散技术兼容。

S-Lab和微软训练了一个精通多模态感知和推理的视觉语言模型——Otter，人工评估显示，Otter在多模态感知、推理和语境学习方面展现出了惊人的能力，且可以有效地与用户的意图保持一致。此外，他们也提出了一个用于训练视觉语言模型的大型数据集——MIMIC-IT，其包含280万个多模态指令-反应对，其中有220万个为图像和视频指令。

格莱美禁止完全由AI生成的音乐参与提名，只有以人类为主导且做出重要贡献的音乐才有资格竞争奖项。

AI生成的《恶搞之家》直播因涉及炸弹威胁言论被禁。之前，AI生成的《宋飞正传》直播因恶意言论也被暂停播放。

Meta公司推出了开源音乐生成器MusicGen和Voicebox。MusicGen能将文字描述转化为音频，而Voicebox具备语音生成、编辑和风格化功能。据介绍，Voicebox超越了其他音频AI模型，它采用Flow Matching模型，能够实现文本与语音之间的非确定性映射，从而可以在不需要大量标注的情况下从各种语音数据中学习。

未来十年内，有声书的年销售额有望超过300亿美元，其中人工智能将扮演更重要的角色。Google Play和Apple Books采用了人工智能生成的声音，但在模仿人声的语调、抑扬顿挫和情感方面仍待完善。声优们建议克隆自己的声音以加快有声书籍的制作速度，降低成本。

Netflix的《黑镜》第六季首播集《Joan很糟糕》展现了当前AI的噩梦。该剧探索了移动设备监视和人工智能失控的问题。此前，《黑镜》制片人Charlie Brooker表示，他曾经ChatGPT写了一集《黑镜》剧本，结果“像屎一样”。

据知情人透露，近几个月来，OpenAI、谷歌、微软和Adobe都曾与媒体机构高管会面，讨论围绕他们的AI产品（如文本聊天机器人和图像生成器）的版权问题。他们希望达成一项通过向出版商付费以利用新闻内容来训练生成式人工智能模型的协议。这些媒体机构包括新闻集团（News Corp）、Axel Springer、《纽约时报》（The New York Times）和《卫报》（The Guardian）等。