图数据库作为存储和分析之间关系的系统,因其高性能、轻量级等优势,越来越受到业界关注,特别是在大数据处理方面,更是优势明显,被广泛应用于反欺诈、推荐引擎和知识图谱等多个场景。近日,清华大学人工智能研究院、清华-中国工程院知识智能联合研究中心和智谱AI联合发布了《人工智能之图数据库》报告。报告围绕图数据库的基本概念、技术发展、产业应用、人才概况和热点趋势这五大方面进行深入挖掘。
图数据库是基于图模型,使用图结构进行语义操作的数据库。相比于关系型数据库,图数据库在处理数据关系时更为直观和高效。例如,在反医保欺诈的应用中,图数据库通过直接跳转访问,查询时间通常比关系数据库快2到3个数量级。
社交网络天然具备图数据结构,图数据库可以很好地为企业的创新社交网络应用做出贡献。有报道称,某黑客团体利用在社交网络工具推特(Twitter)上发推文(Tweets)的方式操作美国2016年的大选。图数据库成为回答这些问题的有力工具。
2000年之后,随着社交网络等真实大图数据的迅猛增长和相关应用需求的推动,越来越多的学者将目光放在图数据库的理论及应用研究当中,图数据的相关研究工作重新成为热点。《人工智能之图数据库》报告依托清华大学唐杰教授自主研发的“科技情报大数据挖掘与服务系统平台”(简称AMiner),以及第三方机构研报、媒体报道等公开资料,对于图数据库领域的人才概况和热点趋势进行了详尽的分析。
该报告参考h-index、发表论文数、论文被引频次等指标,对学者信息进行筛选,比较和分析了图数据库领域人才在全球和国内的分布概况,技术领先国家、机构信息,领域的技术研究发展趋势,学者画像,人才迁徙和专利趋势等。美国的论文数量和人才数量位于全球第一,遥遥领先于排位第二的中国,随后为德国、英国、法国等欧洲国家。
根据图数据库的关键词,从AMiner数据库中查找数据生成趋势图,可以看出查询语言的研究热度一直位居图数据库领域的首位。学者画像的特色在于除了提供专家学者如姓名、单位、地址、联系方式、个人简介、教育经历等个人基本信息之外,还利用团队多年的命名排歧相关技术基础,建立了较为完全的学者—论文映射关系,分析挖掘学者学术评价、研究兴趣发展趋势分析、学者合作者关系网络等信息。