我们在现场见证了一场AI成年礼

我们在现场见证了一场AI成年礼。

估计大家已经被各种AI应用冲击得趣味疲劳了吧——无论是忽然声名赫赫的OpenAI，还是每天被花样繁多的生成式AI应用搞得眼花缭乱，更不用提一下子各种“GPT”大乱斗……在一顿尝鲜和试用之后，极尽各种调戏之外，忽然觉得怅然若失：你说它没用吧，确实能时不时地给你来上些惊喜；你说它多有用吧，频繁地胡说八道、繁琐地调教训练，最烦的还是在一条任务中不停地跳转各种页面和应用……简洁又沉浸的操作、完整全面的场景生态，以及一个言而有信对自己负责的表现，是人们对生成式AI近在眼前的期待，就像是期望一个青春期的少年快快成熟长大。

在5月10日的Google I/O大会上（Google最重要的年度开发者大会），看上去更靠谱的AI来了：PaLM 2模型发布，Bard开放自由使用，并接入了Google“全家桶”应用，新安卓系统整合进更多的AI实用功能……虽说AI靠谱，但发布会暖场看起来是蛮不正经的。

虽迟但到，被OpenAI以及各种GPT拉进“AI新时代”之后，直到今天很多人才想起一家多年前就保持“AI First（AI为先）”的公司。

Bard（你可以简单理解为Google的ChatGPT）发布两个月了，这次它迁移到了PaLM 2模型之上——这也是今天Google I/O大会的发布重点。相比上一代模型，PaLM 2拥有更强的推理和编程能力，而且进行了超过100种语言的文本训练。

大会现场展示了一段用PaLM 2生成代码，然后自动添加韩语批注，然后又自动优化修改的全自动流程。这对于说不同母语的程序员之间协作起来，很友好。PaLM 2有大小轻重不同的四种版本可选，分别被命名为：Gecko（壁虎）、Otter（水獭）、Bison（野牛），和Unicorn（独角兽）。

目前有两个已经精调训练好的专家版本：专注安全的Sec-PaLM和专注医疗健康的Med-PaLM 2——这也是目前对于AI人们最期待的，也最重要的两个应用领域。据称，Bard将很快支持40种语言（包括中国和中文）。

新公布的Bard功能中包括了“给图”和“读图”：比如你问它去某某城市哪里好玩，它的回答就也会包括各个景点名胜的照片，甚至地图标记，你也可以让它把这些景点生成旅行计划表格；再比如你发给他一张图，让它给你编一句搞笑的描述或台词，也没问题。

最实用的是，Bard在每个对话框下面增添了一个导出按钮（目前可以选择内容导出到Google邮箱和Google文档应用，以后还将接上图表、网盘、地图等等）——想想自从“用AI武装了自己”，是不是最烦的就是频繁地在各种页面和应用之间来回切换？这下好了，胡编报告、自动写作业、发邮件怼老板……一气呵成、无缝连接。

大会上还展示了未来将接入Bard的第三方应用，比如前一段火热的AI绘画工具Adobe Firefly：对Bard说“绘制一张斗志昂扬的老板鼓励大家疯狂加班的插画海报”，几秒之后就大功告成（对于生成内容会同时遵守Google和Adobe双方的质量和道德标准）。

还记得一年前，当你尝鲜那些需要本地部署的AI绘图工具时电脑力不从心的样子么？现在在手机安卓系统上就能实现AI绘制手机桌面背景了（它甚至还会帮你优化提示词）。你看，自己还没来得及被AI武装起来，手机都武装起来了。要是觉得AI画桌面大材小用了，那让它帮你自动回复信息怎么样？

大会上展示了安卓系统中AI自动根据消息上下文进行回复的功能，你还可以加入特定的“风格和语气”设定：模仿HR跟老板智斗上几个回合，想想就刺激……另一个实用功能是手机上P图：美颜、优化、打字等等早就过时了。

既然叫了这么多年“智能手机”，那有了AI才是真智能：Google Photo新公布Magic Editor功能，可以直接实现对图像特定部分的编辑，人物、背景都可以，而其他部分会自动通过AI补充到理想又逼真的样子。什么“背景太假啦”、“构图太差了”再也不是情侣分手的借口。

搜索算是Google老本行。

属于这个AI时代的搜索，让你可以像前面提到的那样通过Bard对话来进行，也可以在传统搜索引擎中实现一种更新的体验：通过Google搜索框，你可以输入极其复杂的一句话来获得准确的搜索结果（之前你可能要不停地把你问题拆分或者把限制条件拆分）：比如“对于我这种又懒又想探索大自然户外运动旅行的人在带着80岁腿脚不便的老奶奶和3岁的娃以及两条狗的情况下应该在即将到来的端午节假期去什么地方旅行？

”搜索引擎会充分理解这个长句，然后在结果中给出带有预览的网页答案，还会自动提供引导问题，比如：假期玩多久？可以住哪里？交通怎么安排？等等。

与此同时，AI模型还会主动筛选掉那些虚假的和恶意诱导类型的结果。这种体验被Google成为“搜索实验室”，今天就正好开放注册（labs.google.com/search），你可以试试排队等待体验。

成熟负责的第一步是能够承担自己的行为和后果，对于AI来说也一样。同样是关于搜索，Google会在图片搜索中加入一个名为“关于此图（About this image）”的工具——它可以将所搜所得图片中有用的背景信息显示，包括图片首次在互联网上出现的时间和地点、有哪些网站出现过此图（主要会包括严肃新闻网站、事实核查网站与大众社交网站），很多虚假照片会在这些信息中被轻易识别。

大会现场就以“登月是假的、照片是摆拍”的所谓“摆拍图”来展示了这一功能。对于那些AI画出来的图，无论是否足以乱真，Google的搜索结果中也会自动识别，并增加一个“由AI生成”的标签。这些都来自于Google开始强调在图片中加入“水印”和“元数据”，“水印”用来表示一副图片最原始的版本，任何编辑修改都无法使其改变，而“元数据”则用来标识图片的最原始信息，以便准确溯源。

对于所搜得出的文字内容，Google在一部分需要的搜索问题之下加入了一个新的Perspective Filter（“视角”过滤器）。在这个过滤器处于打开状态的时候，搜索结果会优先把来自真实经历的内容放在更靠前的位置，而那些没什么关联通过关键词蹭热度的、那些低质量看似相关又不知所云的、那些虚假的无法被求证的，都将被“过滤”。

“大胆而负责”，是这次大会上Google CEO劈柴（Pichai）强调最多的，也是现场收获欢呼最多的。用AI作为工具，让AI负起责任，也许是缓解我们现在对于AI恐惧和厌烦的最好办法。

Google I/O是Google的年度开发者大会，也是科技行业最重要的年度大会之一。大会每年5月举办，今年刚好是第15周年。

互联网与人工智能历史上很多里程碑式的产品都是在这个大会上发布的：安卓系统、上一代AI明星AlphaGo、如今大语言模型基石Transformer……大会名称I/O的解释有三种：一是代表了“输入（Input）与输出（Output）”，这是计算机系统与世界交互的基础行为；第二是代表了“开放的创新（Innovation in the Open）”，这是Google产品形象中最有辨识度的两个特质；第三是代表了二进制数字当中开头的1与0，有一个英文单词用来表示1后面一百个零，googol——这就是Google公司名的由来。