性别预测还能这么玩?告诉我你的姓名就够了!

作者: 学术君

来源: 学术头条

发布日期: 2019-08-24

AMiner最新发布的性别预测工具,通过姓名即可预测性别,利用了三种性别推断方法和一个投票模型进行预测。

近日,AMiner发布了最新版性别预测,只要登录以下网址(或者点击下方的阅读原文):https://www.aminer.cn/gender 在Name一栏中,输入你的姓名,注意是英文噢,点击提交,答案就在下方!至于准不准呢?我们说了不算,等你来回答!今天,越来越多的深度学习应用已进入到我们的世界。性别预测,对AI来说已不是一件难事。

除了最为普遍的人脸识别,透过人脸判断身份、性别,AI还可以通过你的一个微笑,甚至是你的一只手,就能够自动分辨出性别。而今天,我们要说的是,只要告知你的姓名,就能预测你的性别。

那么,我们究竟是如何推断你的性别呢?在这个性别测试系统中,我们主要利用了以下三种性别推断方法,并提出了一个投票模型,将其结果纳入最终预测。

Face Recognition(FR)使用姓名和隶属关系信息作为查询词,将第一张返回的图片提取为用户肖像。通过使用Face++提供的用于人脸识别的API,我们可以轻松获取人脸的性别信息。FR对应界面中的“Face Recognizer”项。Facebook Generated Name List(FGNL)是在[Tang,2011]中提出的,并作为[Gu,2016]第3.c节中的基线之一引入。

基本上,它从Facebook上收集了一个带有相应性别值的常用名列表。如果用户名与列表中的任何条目匹配,FGNL将返回Gender值;否则,返回“未知”。FGNL对应界面中的“Name Classifier”项。Web Based Gender Predictor(WebGP)代表有监督信息抽取框架,如[Gu,2016]的“方法”部分所示。

简而言之,我们在谷歌等搜索引擎中自动构造有效的查询,以获取可能包含目标用户性别信息的相关片段。WebGP对应于界面中的“Google”项。

Vote Model(Final)是按照“一人一票”的原则将所有这些方法的推论结果进行整合,最终选择投票数较多的性别价值。这种投票模型的直觉是很自然的,因为每一种方法都擅长预测具有某些特性的用户,但也有一定的限制。

例如,FGNL是西方国家中最常见的名字,具有明显的性别偏见(例如,“Nancy”通常是女孩的名字),因此对于列出的名字非常精确。然而,它的召回受到名单覆盖范围的限制,很难与韩国和日本等国家的外国名字相匹配。因此,最直接的解决方案是训练另一个分类器,该分类器从每个方法中获取预测结果,为其学习“权重”或“可信度”,并给出“加权”预测。在这里,我们将其简化为投票模型,这意味着我们平等地信任每种方法。

实验表明,该投票模型在提高整体绩效方面效果良好。

我们为性别推断提供了开放的API,与支持此应用程序的API相同。您可以通过GET请求轻松地访问它,并获得JSON编码的快速响应。GET请求应如下所示:https://innovaapi.aminer.cn/tools/v1/predict/gender?

name=jie%20tang&org=tsinghua 以JSON编码来响应,并且包括每种方法的推理和概率。举个例子:欢迎大家试用,如果您有任何问题或建议,可以留言给我们!学术头条已建立微信交流群,想进群的同学请加学术君微信:AMiner308,记得备注:名字+单位/学校噢!

UUID: 7a3d123d-7289-4894-a434-19ef70b2e3d1

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/学术头条公众号-pdf2txt/学术头条2019年/2019-08-24_性别预测还能这么玩?告诉我你的姓名就够了!.txt

是否为广告: 否

处理费用: 0.0036 元