《江户川柯南失踪事件》开头说什么语言?

作者: 蠕动者

来源: 果壳网

发布日期: 2015-06-10

文章讨论了《江户川柯南失踪事件》开头1分钟所说的语言是否为虚构语言的问题,通过分析“CIA”的发音、音节构成方式、语序和重复的词,作者倾向于认为这是一种虚构的语言。

问题:《江户川柯南失踪事件》最开头1分钟说的是什么语言?是虚构的语言吗?有人说英语,有人说法语,有人说印度语,也有人说是意大利语……英语和法语应该可以排除。总之到现在没有统一结论。难道真的是虚构的语言吗?虽然剧情后文有解释最开头对话的人是“阿拉善国(又译阿拉森国)政府高官”,但是这个国名肯定是虚构的,不能提供信息。

先说结论,我个人倾向认为是虚构的语言。下面是一些不是太充分的、但可以互相支持的理由:一,“CIA”的发音。视频中的男人是用英语字母的名称来读“CIA”的。对使用拉丁字母的、英语以外的大语言(比如德西法意之类)有一定了解的人应该都知道,英语字母的名称总的说来是异端。具体到这三个字母里,尤其A、I(/e/、/a/)是元音大推移后的产物。

我们再把上帝视角升高一点。

在全世界的语言里,使用拉丁字母(包括扩展拉丁字母)的语言占绝大多数;但这绝大多数里的绝大多数都是和拉丁语甚至是印欧语系没半毛钱的关系、在近代才开始使用拉丁字母的边缘、非主流语言,它们使用拉丁字母主要是因为英法西德等使用拉丁字母语言的强势,包括但不限于我国的一些少数民族语言如壮语、非洲的大部分原住民语言比如埃维语(Ewe language)、美洲的大部分原住民语言比如瓜拉尼语(Guarani language)、大洋洲的大部分原住民语言比如夏威夷语。

因此这些近代才开始使用拉丁字母的语言对字母,尤其是元音字母的命名都不会受什么元音大推移的影响,元音字母在实际应用中代表什么音,就叫什么名字。

具体到A这个字母呢,根据民族语(Ethnologue)的统计,当今世界现存7102种语言,这里面任何语言的音系都有开央不圆唇元音/ä/或相似元音,比如开前不圆唇元音/a/或开后不圆唇元音/ɑ/——或者可以简单理解为就是法西德的A的音——所以这些语言的字母A的名称一定是和法西德的A相似而和英语的A不同的。而I呢,并不是所有语言都有/i/或相似元音,但总的说来也是广泛存在的。

全世界音系第二简单(哎呀感觉好不严谨呀,但是实在忘了音系最简单的语言是哪个了)的皮拉罕语(Pirahã language)只有三个元音,其中都有/i/。

但是视频里这个人却是使用英语发音来读“CIA”的,这说明以下两个结论有一个是对的:1,他在说英语;2,他在说一种不使用拉丁字母的语言,所以才使用当今世界最牛逼的使用拉丁字母的语言来读拉丁字母。就好像我们说汉语的人也使用当今世界最牛逼的使用拉丁字母的语言来读拉丁字母一样。

现在我们使用排除法。我觉着结论1应该不是正确的吧,对吧。既然1不正确,那就只能是2了。既然2正确,那么世界上大部分语言(尤其是边缘、非主流语言)就已经排除了。

二,视频中的语言的音节构成方式。这个语言的音节构成和日语有点像,都是一个辅音+一个元音(“单独一个元音构成音节”这种情况应该任何语言都有吧,所以这里不再讨论了),连续辅音(或者说CVC式的音节;因为分析对象只有一个而且比较简单,所以暂且把这两种情况视为一种)似乎是没有的,声调似乎也是没有的。

这两个条件同时具备的语言在当今世界的大语言里是比较少见的。怎么个少见法呢,我没办法笼统地说,只能零碎地举一些反例。欧洲、近东、中亚的大语言,如印欧语系、闪含语系、高加索语系、阿尔泰语系、乌拉尔语系之类的语言,大部分有连续辅音。

汉藏语系总的说来一个辅音+一个元音构成音节的语言比较多,但这些语言都是声调语言;汉藏语系里的非声调语言又多保留了连续辅音;这在藏语的安多方言(无声调,但有复辅音)和卫藏方言(一个辅音+一个元音,但有声调)里体现得非常明显。非洲和美洲原住民语言大多有声调。我能想到的同时具备这两个条件的大语言只有南岛语系的语言,但南岛语系的语言不符合我在第一条里得出的结论。

当然,我举的反例很有限,更多的语言的音节构成方式我并不了解。

三,语序。因为几乎听不懂,所以这是个孤例。具体说来,就是视频的第一句话(“据说CIA已经有所行动了”)里,说话的人把主语“CIA”放在了最后。用主谓宾三个要素来排列,有六种可能的语序;而使用主语在最后的语序(VOS或OVS)的语言,根据Russell Tomlin在80年代的统计,只占世界语言总数的4%。当然,不排除视频里的语言是一种格比较强大的语言,所以语序相对自由。反正我也说了这是孤例嘛。

四,重复的词。我能听出重复的词只有两个:一个是矮个男人的“据说CIA已经有所行动了”以及“俗话说有钱能使鬼推磨”两句话的第一个词,大约发音是aki;另一个是高个男人表示同意的时候说的词,大约发音是aidu。我大概查了一下这两个词。复活节岛的拉帕努伊语(属于南岛语系)有个词agi,大概意思是“我知道什么什么(后面必须跟着‘我知道’的东西)”,似乎和字幕意思相吻合。

而芬兰语的aito,形容词,表示“真的”,似乎也和字幕意思相吻合。或者脑洞再开大一点,会不会就是英语的I do来的呢?如果视频语言是虚构语言,可能是多种语言拼凑起来的。但光两个词也不能说明太多问题。

不过综合以上四条信息,还是可以发现,前三条信息就能排除掉当今世界上的绝大多数语言,因此这个语言真实存在的可能性很小。当然,以上只是我的猜测;如果官方出来说了,这个语言不是虚构的,确实是某个使用人数只有几百的真·小语种,那我也没办法,毕竟当今世界现存的语言有7102种,我也不可能一个一个去对吧。

————————6月9日更新

刚发现马来语的字母的名称基本是按英语字母名称来的。

不过马来语对比了一下,视频中语言也不是马来语。以此类推,其他一些英国前殖民地的使用拉丁字母的原住民语言的字母名称就也有可能和英语类似了。这样一来就有点可怕了,因为作为英国前殖民地的巴布亚新几内亚(实际英占时间只有1888-1906,具体范围是总面积一半以上的南部土地,剩余部分是德占;1906年英属新几内亚转交给澳大利亚;1914年澳大利亚占领今巴布亚新几内亚全境,直到1975年巴布亚新几内亚独立。

所以总的说来它的原住民接触得最多的非原住民语言显然还是英语)有851种语言,超过世界语言总数11%。而且这些语言都没有自己发展出文字,如果他们要使用文字,肯定首先考虑拉丁字母,给字母命名,肯定优先参考英语;如果他们至今没用文字,要读拉丁字母肯定还是优先参考英语。

也就是说我原答案的第一个理由得出来的结论,排除掉的语言不应该有那么多。但是我的答案并不是一个严格的推理,我自己的主观猜测占了大半;排除掉的语言也没办法量化。所以我还是持原来的观点。

UUID: 6c2782a8-bd03-4786-87ce-f653b41b5aff

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/果壳公众号-pdf2txt/2015/2015-06-10_《江户川柯南失踪事件》开头说什么语言?真相只有一个!.txt

是否为广告: 否

处理费用: 0.0063 元