在生活被智能手机和电脑游戏占领的时代,猜字谜这项有趣的中国传统民间文化逐渐从人们的视野中消失。现在,在除了元宵节之外的日子,人们已很难有机会体验猜字谜游戏的乐趣。
元宵节前夕,微软亚洲研究院在已有的微软对联平台上推出了一个新功能——微软猜字谜。当用户输入谜面后,系统会自动分析谜面,迅速给出谜底。更有趣的是,这款系统还可以为用户自动生成谜面。当用户输入谜底(单个字)后,系统可自动生成若干谜面供用户选择。
字谜是中国文化独有的内容,是以一个或几个汉字为谜底的谜语。这种谜语的编写或是利用了汉字的造字规律,或是利用了汉字形、音、义某一方面的特点,既有趣味,又有知识内涵。根据谜面的不同,字谜可分为:字形谜、字义谜、典故谜等多个类别。由于中国字义谜和典故谜的构成更为复杂,此次微软亚洲研究院推出的计算机自动猜字谜系统主要针对字形谜,即谜面是根据谜底(一个字)的字形而设计的。
这款字谜系统是微软亚洲研究院自然语言计算组历时四个月开发而成的。研究人员首先进行了大量的数据挖掘工作,从中挑选出字形谜。而后建模,用统计机器学习的方法对模型进行训练,得到一个能将各类自然语言描述转化为特定偏旁部首的优化模型。最后,将得出的各类偏旁部首映射到有可能的字,即谜底。在这款字谜系统的页面中,我们不仅在输入字形谜的谜面后可以看到最佳答案,而且还可以看到“推理”的过程。
自然语言计算组负责人,微软亚洲研究院首席研究员周明博士是机器翻译和自然语言处理等领域的专家,曾主导了微软对联系统的开发。他表示:“猜字谜是在微软对联系统之后,我们对人工智能的又一个有意义的尝试。这些创新集中体现了NLP 2.0的战略思想,即对基于互联网的平台,对大数据进行搜集、利用统计机器学习方法自动学习建立智能模型、然后快速上线获得用户反馈,从而把用户引入到创新的过程之中。
猜字谜系统的水平也会不断提升。”
当然,推出这款基于字形谜的计算机自动猜字谜系统仅仅是个开始,微软亚洲研究院的研究员们还将继续深入研究,推出包括更多类型的字谜系统,并扩展到字谜之外的其他类型的谜语。