电脑里的乱码火星文到底什么来头?它们的故事很悲伤

作者: 美图君

来源: 把科学带回家

发布日期: 2019-02-17

本文讲述了19世纪初切罗基族北美印第安人Sequoya为族人创造书写文字的故事,以及随后因印第安人迁移法被迫迁移,导致语言文化流失的悲剧。文章还介绍了联合国设立土著语言国际年的背景,强调了语言消失对文明的影响。此外,文章展示了多种濒危语言的书写系统,呼吁人们关注和保存这些即将消失的语言文化。

19世纪初,一个叫做Sequoya的切罗基族北美印第安人为他的人民创造出了书写文字。因此切罗基族成为美洲原住民中首先拥有书写文字的一支。仅仅花了10年时间,Sequoya的同胞就从文盲成为了文明人。但不幸的是,1830年的印第安人迁移法通过,切罗基族被迫从佐治亚和北卡罗来纳州的家乡搬离。他们的出版物也被扣押,他们不再能学习自己的语言,而必须在白人设立的学校里学习欧洲语言。

这种悲伤的故事一直在地球上上演。因此在2016年,联合国大会宣布,2019年,也就是今年成为2019土著语言国际年。设立土著语言国际年的目标是为了让人们关注世界上正在消失的语言。实际上,当大会召开的时候,据估计全球6700种语言正面临消失的命运。一门语言消失会带来什么,相信你我都心知肚明。就比如,汉语消失的话,中国几千年的文明也将随之湮没。光是想想就让人毛骨悚然。

可是,因为汉语是母语的关系,我们才会觉得事关重大。对于那些我们听都没听说过的语言来说,它们的消逝会给你带来同样强烈的触动吗?那些文字承载的历史和文明的消亡,能让不说这些语言的人意识到损失的量级吗?它们中的不少文字,已经成为你我眼中的“乱码火星文”了。

六年多来,一些心中怀着对少数派的敬意的人类开始为即将消亡的文字建档,将地球上已经少有人说,甚至都已经没有什么人认识的文字中的金句、谚语和诗歌收集起来,雕刻成“墓碑”式的数字影像。这个名叫濒危语言项目图集的项目的发起人Tim Brookes表示,“我的目标是搜集那些原住民或少数族裔的文字,保存他们的历史、身份,还有存在感。”

我们一起来看看,这些少数派的,或是即将逝去的语言有多美。云南省北部纳西族使用的东巴文,东巴文是表音和表意文字,有2223个单字,是世界上极少数依旧活着的象形文字,被誉为文字的“活化石”,可能比甲骨文更原始。2003年,东巴古籍被联合国教科文组织列入世界记忆名录。

这是彝文(四川南部彝族人的文字),据考证发源于唐朝,是一种表意文字。彝文都是由点、横、弧、竖线构成的,保存至今的最古老的彝文可以追溯到1485年。目前还有4百万-5百万彝族人在说彝文。彝文有1840个字,不过不同地区有不同的书写方式,并不统一。

日本的悉昙文字,悉昙文字在公元600-1200年借助佛教繁荣发展,它来自印度南部,后来跟随梵文的传播,通过丝绸之路来到了中国,后来传播到了日本。但是目前,只有在日本真言宗和天台宗的寺庙等少数社群里还会教授和使用悉昙文字。

Afaka语的“保护我们的饮用水”,Afaka语是美洲苏里南语言的一支,创立于1910年。

Mandombe语是撒哈拉以南非洲的原住民的语言,这是世界上唯一一种形如分形中的龙形曲线的书写体系。

菲律宾库利坦语是属于菲律宾吕宋岛的邦板牙语的书写体系。在菲律宾被西班牙殖民后,库利坦语被拉丁字母取代。

欧及布威语是加拿大原住民欧及布威族的语言,这个词的意思是“欧及布威语”。实际上,这种书写体系是英国移民James Evans根据当地原住民的语言习惯发明的。2010年时只剩9万人还在使用欧及布威语。

菲律宾的古老文字——贝贝因语的“母语”一词。贝贝因语曾是菲律宾少数民族他加祿人的语言,在菲律宾被西班牙殖民后逐渐被拉丁字母取代。

贝贝因语的世界人权宣言。

印度尼西亚巴厘岛的巴厘语的“谢谢”。目前大约有3百万人在使用巴厘语。

巴厘语的世界人权宣言。

西非书面语里的“母语”一词。西非书面语是1949年创立的西非曼德语族的字母体系。N'Ko在曼德语族语言中意味着“我说”。目前西非书面语的使用者主要分布在几内亚、科特迪瓦、马里等地。

居住在非洲赞比亚、刚果、安哥拉、扎伊尔的Tchokwe人的LuSona符号系统,这幅图里的文字的意思是“一个男人和两个女人的房子”。LuSona是一种表意文字,记录的是谚语、传说、游戏等知识,历史可追溯到公元前6世纪。

孟加拉少数民族的锡尔赫特语中的“母语”一词,锡尔赫特语的使用者为1100万(2007年)。

孟加拉语、缅甸和孟加拉的少数民族的马勒玛语、查克玛语、巴金姆语中的“母语”一词。全球马勒玛人为18万(2013年),查克玛人为33万(2007年),巴金姆人为5万(2007年)。

马勒玛语中的“风暴”一词。

藏语的“大慈大悲”。根据1990年的统计,有120万人说藏语。

非洲加纳的Adinkra语中的“知古鉴今”一词。Adinkra语常被绘制在陶器,或是编制在织物上,内容一般是格言或者抽象概念,具有很强的装饰性。

亚述新亚拉姆语的世界人权宣言。亚述新亚拉姆语主要是伊拉克、叙利亚、土耳其等地的亚述人在使用,根据2014年的统计,以亚述新亚拉姆语为母语的人口为23万。

苗语的世界人权宣言。苗语在中国云南、越南、老挝、泰国等地有使用者。2009年苗语的使用者统计数字是370万。

曼底安语的世界人权宣言。目前只有在伊朗和伊拉克等少数地区还有人会说曼底安语,以其为母语的人数在2006年时只剩5500人。

撒马利亚语的世界人权宣言。撒马利亚人是以色列人的一个旁支。撒马利亚人一度只剩4户人家。目前撒马利亚语在语言学上已属“休眠”状态,只存在于文献中。

藏语书法“万事皆有因果”。

印度尼西亚的布吉语。根据2000年的统计,有5百万人说布吉语。

加拿大安大略省原住民的Moose Cree语的“我们的语言”。根据2007年的统计,说Moose Cree语的人只剩3000人。

格拉哥里语中的“词语”一词。格拉哥里字母是现存最古老的斯拉夫语言,是在公元9世纪由东罗马帝国著名传教士西里尔与美多德创造的。直到18世纪末,格拉哥里语依旧是克罗地亚等地的统治性语言,到了19世纪才逐渐消亡。2007年波兰游戏公司发行的角色扮演游戏《巫师》中就使用了格拉哥里语。

印度尼西亚的望加锡语。望加锡语是印度尼西亚南苏拉威西省的望加锡人的语言,2000年时有210万使用者。

越南、柬埔寨等国少数民族使用的占语,这个词的意思是“爱”。根据2009年联合国统计部门的数字,有20万人使用占语。

泰国北部的兰纳语,或者叫北部泰语。兰纳是泰国历史上一个曾经控制泰北地区的王国。目前有6百万人使用兰纳语。

北恩德贝勒语,北恩德贝勒语属于非洲津巴布韦的班图语支,使用人数是150万人(2012年)。有没有康定斯基画作的即视感?

女书是湖南江永女书专用的汉语方言音节表音文字。女书作品书写在布面手写本(婚嫁礼物)、扇面、布帕、纸片上。有的绣在帕子上,叫“绣字”。湖南江永的妇女有唱歌堂的习惯,常常聚在一起,一边做女红,一边唱读、传授女书。最后一位女书自然传人阳焕宜已于2004年去世。

这是用汉喃文写的《金云翘传》(一部在18-19世纪间成书的越南古典文学作品)中的一段。

它的翻译是:生年不满百,才命两相妨;沧桑多变幻,触目事堪伤。彼啬私丰,原无足异;红颜天妒,事亦寻常。汉喃指的是15-19世纪时越南传统的文字系统,是汉字和越南本民族文字的喃字的混合。但是在1920年,法国天主教传教士为越南创造了越南文字母,它取代了汉喃并沿用至今。现在越南的年轻人里已经没有什么人认识汉喃了,而它却被许多中国人视为乱码。

最后一行是“汉字文化圈”在汉喃里的写法。那么,汉喃有多少个字符呢?根据越南政府发布的喃字字符集TCVN 5773:1993和后来的修订版TCVN 6909:2001,汉喃共有9299个字符,其中一半为越南特有的字符。它们后来被收录到了中日韩统一表意文字扩展区B中,其中的一些就是你在word里面看到的那些“火星文乱码”了。

UUID: a74ff96f-99db-4a6e-aef0-7b8167296b3a

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/把科学带回家公众号-pdf2txt/2019-2020/2019-02-17_电脑里的乱码火星文到底什么来头?它们的故事很悲伤科学美图.txt

是否为广告: 否

处理费用: 0.0088 元