2021年7月21日,智谱正式推出AI数据服务平台——完美数据大师(perfect Data Master,以下简称PDM)。PDM由清华大学计算机系和智谱团队通过两年的技术攻关开发完成,将同时引入众包标注机制和自能辅助标注功能,让数据完善智能,让智能产生更多数据,打造“数据采集-数据标注-标准数据集”的AI数据服务业务。
智谱作为一家融合了知识和数据的双轮驱动人工智能企业,将通过PDM实现数据和智能的闭环。一方面,PDM源源不断地高效产生大量数据,可以帮助人工智能模型变得更加精准;同时,智谱自身的人工智能技术也将反哺标注过程,提升标注效率。
智谱副总裁、数据部总监李欣谚表示,随着AI产业的蓬勃发展,各类AI技术逐步从实验室走向实际应用场景,AI技术企业对于相关的数据服务也提出了更高的标准与要求。AI数据服务商除了需要建立全面成熟的质量管理和团队协作体系外,本身也必须具备深厚的技术积累,才能够更加深刻的理解行业需要,基于业务场景提供更加精细化、定制化的数据服务,助力AI技术企业与行业发展。
开发团队表示,PDM将开放标注员注册:任何人在通过培训后,都能在平台上简单、快速地完成数据标注任务,并领取酬劳;而基于智能调控和评价机制,PDM平台能够根据标注人员的正确率和擅长领域,自动、合理地分配任务。
智谱作为孵化自清华计算机知识工程研究室的企业,其数据团队不仅将多年来积累的数据标注经验沉淀在了PDM平台上,全面提升了人员培训、规模化生产、数据安全等业务管理能力;同时,平台也依托全球最大的“悟道”超大规模AI模型,以标注算法为核心,实现了对于数据标注的效率、精度的提升以及基于弱监督学习的算法优化。
未来,智谱希望在行业内打造从“数据采集”到“数据交易”的完整业务闭环,构建链接“算法公司”与“数据生产”两端的业务生态,建立面向全球的AI数据交易(众包)平台,面对不同类型、规模、性质、领域的AI企业,灵活、快速地支撑其数据生产管理和算法模型优化,成为AI数据服务的行业引领者。