我国博士学位论文被引状况计量分析

作者: 杨奕虹, 甘大广, 林霄剑, 武夷山

来源: 武夷山科学网博客

发布日期: 2015-02-03

本文采用文献计量方法,统计分析了我国45万篇博士学位论文的被引状况,得出我国博士学位论文不到40%被引用,主要被硕士论文引用,医学博士论文被引比例最低等结论。

摘要:本文采用文献计量方法,统计分析了我国45万篇博士学位论文的被引状况,全面了解我国博士学位论文的学术影响力。

通过研究,得出以下结论:我国的博士学位论文不到40%被引用,其中将近50%是被硕士作者引用;博士学位论文在答辩通过后的第3年被引次数最高;“医学”博士学位论文在各学科门类中“被引论文”百分比最低,仅为16.77%,“篇均被引次数”也是最低,仅为0.33次;40%的高校的博士论文被引,科研院所的博士论文不足25%被引;通过设立“5年被引频次”、“5年影响因子”、“即年指标”、“他引率”、“H指数”等7个指标,衡量我国培养博士人数在平均值以上的77所高校的博士论文被引情况,有7所高校在7个指标中进入了5项指标的前20:吉林大学、华中科技大学、浙江大学、复旦大学、天津大学、华东师范大学和大连理工大学。

引言采用文献计量学方法去估计论文的学术影响力,一般来说都是以期刊论文为研究对象,而较少采用博士学位论文为统计数据源。博士学位论文是攻读博士学位的研究生在提出申请授予博士学位时提供评审用的学术论文。可以说博士学位论文是博士生借助了培养单位的资源优势和博士导师的科研优势,通过至少三年的认真学习和潜心研究,最终提交的核心成果。

该成果是博士在本学科领域提出的有独创性的见解,具有前瞻性的研究,不仅仅展现了博士生的科研能力,也部分反映了博士导师及其培养机构的科研水平。整体而言,博士学位论文具有一定的学术价值。为了了解我国博士学位论文的学术影响力,本文参考科技期刊的评价方式,采用文献计量方法,统计分析我国博士学位论文被引状况,探索其分布规律,以便为人们更好地利用博士学位论文的学术价值提供一些启示。

1、数据与规范

1.1、数据来源为了全面了解我国博士学位论文被引状况,我们采用了北京万方软件股份有限公司元数据仓储中的《中国博士学位论文数据库》、《中国期刊论文引文数据库》和《中国学位论文引文数据库》为统计源。

截至2014年1月30日,《中国博士学位论文数据库》收录2012年及以前的中国博士学位论文为454684篇(因2013年的博士论文还来不及被引,本文不予考察),授予博士的时间范围为1980年到2012年,共涉及366个博士培养单位;《中国期刊论文引文数据库》包括国内8000余种学术期刊引文共1.25亿条,涉及时间范围是2000-2013年;《中国学位论文引文数据库》包括国内832家硕博士培养单位产生的硕博士论文的引文共1.105亿条,涉及时间范围是2000-2013年。

1.2、数据规范化处理

《中国博士学位论文数据库》涉及学位的授予时间是1980年到2012年,时间跨度为32年,其间某些学位授予单位有更名或合并的现象。本文利用北京万方软件股份有限公司建立的《机构多层级词表》对数据库中的学位授予单位进行了规范,例如:“北京医科大学”一律规范为“北京大学”,“北京广播学院”一律规范为“中国传媒大学”,而不问其何时合并或更名。

1.3、《中国博士学位论文数据库》数据完整性校验根据2005年—2013年各年的《中国统计年鉴》,2004年—2012年中国博士毕业的总人数为370009。

《中国博士学位论文数据库》2004——2012年博士论文总量为333197篇,可见该数据库对博士论文的收齐率为90.05%;将统计年鉴所反映的博士所属学科分布情况与数据库收录博士论文学科分布进行对比,可以看出:二者基本一致,因此可以认为,对《中国博士学位论文数据库》所收录论文进行分析近乎全样本分析,统计结果不会有太大的偏差。

1.4、中国博士学位论文被引数据集的建立

若一篇博士学位论文至少被期刊论文或其他博硕士学位论文引用过一次,就称该篇论文为“被引论文”。以《中国博士学位论文数据库》中454684篇博士论文标题、作者姓名和学位授予单位作为检索项,分别在《中国期刊论文引文数据库》和《中国学位论文引文数据库》进行检索,得到每篇博士学位论文被期刊论文或博硕士学位论文的引用数量,两库检索结果合并处理后得到《中国博士学位论文被引数据集》。

2、结果与分析

2.1、中国博士学位论文整体被引状况454684篇博士论文中,有171967篇“被引论文”,占总数的37.82%,总被引次数为989350次,篇均被引次数为2.18。上述总被引量中,被硕士论文引用467148次,占总被引的47.22%,被期刊论文引用333434次,占总被引的33.70%,被博士论文引用188768次,占总被引的19.08%。可见,博士学位论文主要是被硕士学位论文引用。

曾有作者计算过,我国科技期刊论文的“篇均被引次数”为9.29。如果将这个数值作为科技期刊论文“篇均被引次数”的参考值,那么我国博士论文“篇均被引次数”与科技期刊“篇均被引次数”相比,差距较大。

2.2、各年博士学位论文数及被引状况

分别将“博士论文总量”、“被引论文数量”、“被引论文占比”、“被引总次数”和“篇均被引次数”5个指标按博士授予年进行统计排序,得到博士论文总量及四个被引指标按博士授予年统计的排序。从表中可以看出,虽然2003年、2004年产生的博士论文总量排名为第9、第10,但这些博士论文的篇均被引次数却是第1、第2名,篇均被引次数达到4.44、4.39,均超出平均值2.18的两倍。

我们估计,2003年、2004年篇均被引次数之所以名列前茅,可能是因为北京万方数据股份有限公司和中国学术期刊(光盘版)电子杂志社都是在2002年分别推出了《中国学位论文全文数据库》和《中国优秀博硕士学位论文全文数据库》,随后开始在各大高校提供网络镜像服务,为博士论文的推广使用提供了便利的条件。

在本文中,用CX表示论文答辩通过后第X年的被引次数,例如:C0表示论文答辩通过当年的被引次数,C1表示论文答辩通过后第1年的被引次数,依此类推。博士论文答辩通过后第X年被引用的状况见表中。

2.3、各学科门类博士学位论文被引状况

根据“博士论文总量”、“被引论文数量”和“被引总次数”可以计算出“被引论文占比”和“篇均被引次数”,并按博士论文所属的学科门类进行统计,得到《中国博士学位论文数据集》被引论文的学科分布。从表中可以看出,“教育学”被引论文百分比最高,为53.39%,篇均被引次数最高,为5.56次;“医学”被引论文百分比最低,仅占16.77%,篇均被引次数最低,仅为0.33次。

2.4、高校与科研机构授予的博士学位论文被引状况对比分析博士学位授予单位分两大类:高校和科研院所。454684篇博士学位论文中,高校的博士论文有394865篇,占86.84%,科研院所的博士论文有59819篇,占13.16%。

分别统计出高校与科研院所的“博士论文总量”、“被引论文数量”和“被引总次数”,则可以计算出“被引论文占比”和“篇均被引次数”,并按学位授予单位类型及学科门类进行被引论文状况统计。

从表中可以看出:高校产生的博士论文中,“被引论文占比”为39.87%,“篇均被引次数”为2.33次;科研院所产生的博士论文中,“被引论文占比”为24.32%,“篇均被引次数”为1.18次,从总体上看,两项指标,前者均高于后者。

2.5、著名高校博士学位论文被引状况

为了全面掌握各高校被引状况,我们借鉴期刊评价的方法,引入“5年博士论文数”、“5年论文被引频次”、“5年影响因子”、“即年指标”、“他引率”和“H指数”等7项计量指标,来全面描述一个大学的博士论文。这些指标说明如下:

(1)5年博士论文数:一个机构在2007——2011年授予的博士论文总篇数;(2)5年论文的被引频次:一个机构在2007年——2011年授予的博士论文在2012年被引用的次数;(3)5年影响因子:5年被引频次/5年博士论文数,即以上第二项除以第一项;(4)即年指标:表征一个机构的博士学位论文在当年被引用的情况。在本文中选取2012年的博士论文在2012年被引的次数。

3、结论与讨论

3.1、我国博士学位论文中仅有不到40%被引用,引用这些博士论文的论文中47%是硕士论文,34%是期刊论文,19%是博士论文。也就是说博士论文主要被硕士学位论文作者所引用。我们估计,博士论文总体被引率低的主要原因之一是:它们属于灰色文献,其获取不如期刊论文方便,很多学者尚不习惯利用这一文献源。

3.2、从本项研究的数据来看,博士学位论文在答辩通过后的第3年被引次数最高;论文答辩通过10年后,各年“被引次数”累计达到96.38%,因此可以认为,博士论文的被引时间范围是10年左右,其被引的高峰年为授予学位后的第3年。

3.3、“教育学”被引论文百分比最高,为53.39%,“篇均被引次数”也最高,为5.56次;“医学”被引论文百分比最低,为16.77%,“篇均被引次数”也最低,仅为0.33次。我们简单分析一下“教育学”和“医学”相关指标领先和垫底的主要原因。

3.4、高校产生的博士论文有40%被引,科研院所的博士论文不足25%被引;高校在“教育学”、“军事学”、和“工学”三个学科比科研院所同类学科更受关注,“教育学”尤为突出;科研院所在“艺术学”、“文学”两个学科比高校的同类学科更受关注,尤其是“艺术学”比较突出。

3.5、用我们的7个计量指标来全面衡量,某些最著名的大学并不占优势,而吉林大学、华中科技大学、浙江大学、复旦大学、天津大学、华东师范大学和大连理工大学在其中5个指标均进入前20榜单。从这个侧面来看,高校的博士生名额分配显然还有优化的余地。

UUID: d05ce4f5-8a1a-46cd-80ba-febdea99c3e9

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/中科院之声公众号-pdf2txt/2015/中科院之声_2015-02-03_博士学位论文同行也看?.txt

是否为广告: 否

处理费用: 0.0229 元