人工智能是一个广阔的领域,涵盖了图像识别,自然语言处理(NLP)和机器人技术等各个领域。人工智能技术的发展有时似乎是疯狂的,因此很难跟上所有正在发生的事情。毫不奇怪,许多组织寻求其IT供应商合作伙伴来帮助他们开发和部署AI解决方案,以最好地满足他们的需求。
David Ellison是联想的高级人工智能数据科学家,他的职责包括使用尖端的AI技术为客户组织提供解决方案,同时内部支持联想全球数据中心集团的总体AI战略。
联想已经商业交付的项目包括使用卷积神经网络从图像中提取特征并将其分类为缺陷或非缺陷的工厂中检测制造缺陷的项目。联想还为赛车公司开发了计算机视觉系统,以决定是否应召唤特定的赛车维修保养。根据Ellison的说法,今年和不久的将来,人工智能的主要趋势包括基于计算机视觉的应用程序,用于训练AI模型的数据生成和数据标记算法的开发以及归因于变压器的自然语言处理的快速发展。
在计算机视觉方面,开发人员和研究人员现在开始探索将这种能力与人工智能的其他一些领域相结合的实用方法,比如机器人技术或自动应用图像字幕等应用的自然语言处理。据Ellison说,这部分是因为计算机视觉的一些基本问题已经被证明很难解决,研究人员正在寻找新的方法来解决这些问题,而不是简单地推动研究领域向前发展。
Ellison认为,这就是为什么机器人技术是目前最广泛研究的人工智能领域之一,因为它为人们提供了一个明确的目标。他列举的例子包括使人工智能能够使用视觉感应在其周围的空间中安全移动——无论是制造工厂的机械臂,还是使用人工智能导航到目的地的自动车辆。
已经熟悉AI的人们会知道,成功训练模型的关键因素之一就是数据,其中很多都是数据。实际上,对它进行训练的数据越多,传递所需结果的效果就越好。
根据埃里森的说法,计算机视觉目前正处于困境中,因为用于训练模型的数据集没有足够多的样本。例如,用于训练模型以导航室内空间的广泛使用的3D空间吉布森数据库(Gibson Database of 3D Spaces)包含572座由1,447层楼组成的完整建筑物。虽然令人印象深刻,但这不太可能是人工智能系统在现实世界中可以满足的全面要求。
建立数据集需要人工操作人员对数据进行大量手动标记,因此,现在越来越多的研究项目集中在自我监督算法上,这些算法可以获取已收集的数据并使计算机自动为数据添加标签。开发人员面临的另一个挑战是,一旦部署,AI系统极不可能遇到的数据点,因此可能无法在训练数据集中表示。但是,如果这些边缘情况代表实际情况,则需要考虑这些情况,以确保AI模型正确处理它们。
与此同时,过去几年自然语言处理领域的成功案例之一是基于转换的深度学习模型,埃里森相信这些模型将继续占据主导地位。这是因为它们已经发展到能够识别句子之间的依赖关系和连接,而早期模型中使用的递归神经网络(RNNs)本质上是顺序的,往往会失去单词的上下文。
这种架构已导致变压器在许多最近开发的NLP模型中扮演重要角色,例如Google的BERT和OpenAI的GPT-2,以及Facebook的RoBERTa和Microsoft的MT-DNN,它们在诸如此类的NLP任务中显示出巨大的希望例如文档分类,情感分析,问题解答和句子相似度。