AI是人类想要实现真正自由的梦想,到那时很多工作都会自动化,但在此之前,达到这一目标需要投入大量的劳动力。而中国甚至全球的人工智能产业飞速发展的背后是无数年轻工人作支撑,他们拿着低薪做着数据贴标工作,服务着国际科技巨头。多年前就有人提出,数据就是新的石油。而如果数据是新的能源和宝藏,那么中国已经成为最大的生产国。这所工厂挤满了劳动者,他们正努力为机器学习标注图像和数据。
机器学习的训练需要大量数据,在过去十年中,机器学习对高质量手工标注数据的需求飙升。一位在数据标签公司工作的年轻人说:“我曾经认为机器是天才,但现在我才知道我们(人类劳动者)才是它们成为天才的背后原因。”所有新兴行业,包括人工智能,都伴随着新型蓝领劳动力的需求激增。在从事AI相关的公司内,比老一代更精通技术的年轻工人正在从事手工标记数据工作。
这些年轻员工通常分布在较小的城市里,而这些小城市拥有多家AI初创公司,而这些公司存在的唯一目的是为大型机器学习公司提供高质量的数据。此前,我们也报道过这一产业现象:在河南一些农村地区,有一大群年轻人正成为“数据贴标人”,他们每天坐在电脑前八小时,点击几十张照片,概述背景、前景和特定物品。AI产业成为劳动密集型工作?
《Throwing Rocks at the Google Bus》一书的作者Rushkoff说:“(未来)找工作会更难,每个劳动者付出更多的时间却只能换来用更少的钱。技术似乎让我们永远处于这样一个状态,在这种状态下,劳动力和数据甚至时间都是从人类身上‘压榨’出来。”在这样一个时代,数据标记工作似乎已经成为保住年轻人饭碗的蓝领工作,帮助他们远离AI时代下的失业危机。
年轻一代似乎能够养活AI野兽而不是被它们吞噬。一个典型的例子是位于北京的创业公司Mada Code,大概拥有自由员工10000人。这些自由职业者为各种任务标记数据,如光学字符识别(OCR)和自然语言处理。该公司将微软、卡内基-梅隆大学和其他国际公司及机构都视为客户。
这些年轻人有两种工作形式:一种通过网络在线形式,人们可以通过移动应用程序标记图片;另一种形式则在线下,工厂里满满都是“数据贴标人”,他们坐在电脑前,轮流做手工标记。AI应该是人类想要实现真正自由的梦想,许多工作都能实现自动化。但在我们到达这样的理想境界之前,世界需要一大堆人类从事标记工作,这项工作可能是非常苛刻,也很单调乏味。
最低工资、最少福利,为硅谷巨头们工作没有手工标记就没有机器学习,因此人工智能生态系统需要这样的行业。正如一位中国数据标签公司的联合创始人所说:“我们是数字世界的建筑工人。我们的工作是不断地铺盖一块又一块砖。但如果没有我们在人工智能中发挥的重要作用,他们无法建造AI这座摩天大楼。”但这些工厂的情况与硅谷的豪华办公室或北京深圳的中国科技中心截然不同。
这些劳动者的工资很低,也不像许多科技公司还提供免费餐饮,更不可能有医疗保健甚至台球桌那样的其他福利。但是没有这些劳动者,人工智能的革命几乎是不可能成功的。这其实是一个积极的推动力,在劳动成本低得多的地区完成部分工作,可以进一步降低产业成本。在训练数据时,有些任务比其他任务困难得多,就像人体标记任务比别的都要困难得多,每个对象需要标记15-40个点。
Mada Code的项目经理说:“就像10年前那样,那时还没出现iPhone或富士康员工。我想当一些工作被取代时,总会有一些新工作岗位出现。”