文章摘要:
无标题文档
收稿日期:1999-10-28
作者简介:赵良英(1963-),女,河北任丘人,馆员,主要研究方向为科技情报学、文献计量学。
《水利学报》是我国水利学科方面最具权威的学术期刊,它基本上反映了当今我国水利学科领域学术研究的情况。因此,研究《水利学报》论文作者的著述特征,对研究水利科学研究队伍的情况及科学论文生产规律有积极意义。《水利学报》从1980年复刊到1999年20年间共出版了228期,刊登了1530名作者(第一作者)的2470篇学术论文(总量为2476篇,其中有6篇为集体作者).为研究......
无标题文档
收稿日期:1999-10-28
作者简介:赵良英(1963-),女,河北任丘人,馆员,主要研究方向为科技情报学、文献计量学。
《水利学报》是我国水利学科方面最具权威的学术期刊,它基本上反映了当今我国水利学科领域学术研究的情况。因此,研究《水利学报》论文作者的著述特征,对研究水利科学研究队伍的情况及科学论文生产规律有积极意义。《水利学报》从1980年复刊到1999年20年间共出版了228期,刊登了1530名作者(第一作者)的2470篇学术论文(总量为2476篇,其中有6篇为集体作者).为研究水利科技人才的著述特征,下面对《水利学报》的论文作者进行统计研究。
1 署名作者发文情况
表1 署名作者发文情况
|
| x论文数/篇 |
yx作者 数/人 |
比例(%) |
发文量/篇 |
比例(%) |
|
| 1 |
1080 |
70.59 |
1080 |
43.72 |
| 2 |
238 |
15.56 |
476 |
19.27 |
| 3 |
107 |
6.99 |
321 |
13.00 |
| 4 |
44 |
2.88 |
176 |
7.13 |
| 5 |
28 |
1.83 |
140 |
5.67 |
| 6 |
13 |
0.85 |
78 |
3.16 |
| 7 |
8 |
0.52 |
56 |
2.27 |
| 8 |
4 |
0.26 |
32 |
1.30 |
| 9 |
2 |
0.13 |
18 |
0.73 |
| 10 |
2 |
0.13 |
20 |
0.81 |
| 11 |
1 |
0.07 |
11 |
0.45 |
| 17 |
2 |
0.13 |
34 |
1.38 |
| 28 |
1 |
0.07 |
28 |
1.13 |
| 合计 |
1530 |
100 |
2470 |
100 |
|
《水利学报》在1980 1999年间发表了1530名署名作者(第一作者)的文章,其中单个作者发文量为1080篇,占论文总数的43.72%.两人以上多个作者的发文量为1390篇,集体作者6篇。不同发文量作者数见表1.表1反映了署名第一作者的发文量情况,从中可以看出发文量在1~2篇的作者人数占作者总数的86.15%,有70.59%的人在第一署名作者中只出现过一次,发文量在三篇以上的作者人数占作者总数的13.85%,其论文占署名作者论文总数的37%.
2 活跃作者群的分布
所谓作者群的分布是指在某一刊物发表的论文较多、影响较大的作者集合。活跃作者群的作者也称为核心作者。我们对该刊20年间论文作者的发文量进行了统计分析,按照普赖斯教授的理论,发表论文数为N篇以上的科学家为杰出科学家,计算公式如下:
式中:ηmax为发表论文最多的作者所发表的论文数,从而得到该刊的核心作者发表论文数量为
N=0.749(28)1/2=0.759*5.2915≈4 |
|
于是,我们可把该刊活跃作者的发文量确定为4篇以上,由统计结果得出该刊的核心作者数为106人,他们占该刊20年作者总数的6.94%,他们发表的论文数为593篇占论文总数的23.95%.发表论文数8篇以上的有12名。
3《水利学报》论文作者的洛特卡(Lotka)分布
在一个特定的学科和技术领域,定量地研究作者与其文献量的关系,宏观地反映科学成果的生产规律,已渐是广有兴趣的课题。其中洛特卡定律便是一个日臻完善的有效工具之一,60年前洛特卡在美国颇具影响的学术刊物(华盛顿科学院杂志》上发表了题为《科学生产率的频率分布》[1]的论文,他研究了化学和物理学领域中作者数量与论文数量的关系,得出了:作者数量与论文数量的关系遵循一个平方反比定律的结论。即在论文数x与作者的频率f(yx)(yx)是发表x篇论文的作者数)之间,可用一般公式f(yx)=c/x2(c是常数)表示。根据这个公式,由于级数∑1/x2收敛于π2/6,且f(yx)表示写x篇论文的作者出现的频率,显然有∑f(yx)=1,因此c=6/π2=0.6079.即与一篇论文的人数占总作者数的60.79%;写二篇论文的作者人数是写一篇论文人数的1/4;写三篇论文的作者人数是写一篇论文人数的1/9……,写了x篇论文的作者的人数是写一篇论文作者人数的1/x2。由于Lotka的研究第一次揭示了作者与文献量的统计规律,因此被后人称为Lotka定律[1]。
在此之后,Lotka又著文指出:写x篇论文的作者数yx与每一个作者所写论文数x成反比关系,即:
式中:w为论文总数,因为f(yx)=yx/w 所以,
n与c是对应特定学科领域的两个待定常数。在前面的Lotka定律中,n=2,c=0.6079,后来Vlachy的工作证明,一般n大于等于1.2小于等于3.5,最大可达4.8[4]。对于化学和物理学来说,n=2可能是合理的,而对于其它学科未必如此,n和c这两个常数受到学科本身特点所制约。
Lotka定律的理论和实际价值在于创造性地揭示了科学论文作者与文献量之间的数量关系,当代情报学研究中有关科学家生产率的计量理论,都是以Lotka定律为基础的。在情报科学中,论述这种作者与文献量的关系服从Lotka定律(分布),颇受人们重视[1,3]。为了研究水利科技人才的著述特征,给出《水利学报》论文作者的Lotka分布,需要估算指数n,计算常数c,还要进行K-S检验。
3.1 参数n的最小二乘估计 根据式(1)得
根据式(3)可得n的最小二乘估计公式为[8]
n=(∑lnx)(∑lnyx)-N∑(lnxlnyx)/N[∑(lnx)2]-(∑lnx)2 |
(4) |
式中:N为被观察数据对数量。
为计算方便,我们根据式(4)利用表1的数据建立表2.
根据式(4),利用表2的数据,经计算得n的最小二乘估计为
n=23.6676×32.3561-13×36.1425/13×52.5304-23.66762=2.4111. |
|
3.2 参数c的估计和洛特卡分布 对参数c的估计除可以用最小二乘法之外,还有其他方法。其中一种是1985年美国情报学家Pao M L教授在数学家的协助下,提出指数不为2时的逼近c值的估计公式:

|
(5) |
式中:当n=2时,c=0.6079,当n≠2时,误差可以忽略不计。
将n=2.4111,代入式(5)中,得c=0.7251.因此可以得到结论:《水利学报》的论文与作者的洛特卡分布:
3.3 利用Kolmogorov Smornov(柯尔莫洛夫 斯米尔洛夫)检验进行拟合良好性检定 为了判明作者和论文的实际分布与理论分布的一致性,还应进行统计检验,最终要验证实测数据是否真正符合洛特卡分布。一般采用非参数检验,这里采用K-S检验,K-S检验的基本思想是观察数值的累积频率分布与理论值的累积频率分布之间的差异,选取最大的差值记为Dmax,若Dmax大于临界值,则认为理论和实际有显著差异;若Dmax小于临界值,则不能认为理论与实际有显著差异。
根据f(yx)=0.7251/x2.4111计算的作者理论累积频率与根据表1计算的实际累积频率列于表3:
表2 n值计算用表
|
| x |
yx |
lnx |
lnyx |
lnxlnyx |
(lnx)2 |
|
| 1 |
1080 |
0.0000 |
6.9847 |
0.0000 |
0.0000 |
| 2 |
238 |
0.6931 |
5.4723 |
3.7929 |
0.4804 |
| 3 |
107 |
1.0986 |
4.6728 |
5.1335 |
1.2069 |
| 4 |
44 |
1.3863 |
3.7842 |
5.2460 |
1.9218 |
| 5 |
28 |
1.6094 |
4.3322 |
5.3628 |
2.5902 |
| 6 |
13 |
1.7918 |
2.5649 |
4.5958 |
3.2105 |
| 8 |
4 |
2.7094 |
1.3863 |
2.8827 |
4.3239 |
| 9 |
2 |
2.1972 |
0.6931 |
1.5229 |
4.8277 |
| 10 |
2 |
2.3026 |
0.6931 |
1.5959 |
5.3020 |
| 11 |
1 |
2.3979 |
0.0000 |
0.0000 |
5.7499 |
| 12 |
2 |
2.3822 |
0.6931 |
1.9637 |
8.0270 |
| 17 |
2 |
2.3822 |
0.6931 |
1.9637 |
8.0270 |
| 28 |
1 |
3.322 |
0.0000 |
0.0000 |
11.1036 |
| ∑ |
1530 |
23.6676 |
32.3561 |
36.1425 |
52.5304 |
|
表3 作者理论累积频率与实际累积频率
|
| x(论文数) |
yx(作者数) |
作者的实际积累频率 |
作者的理论积累频率 |
差值 |
|
| 1 |
1080 |
0.7059 |
0.7251 |
0.0185 |
| 2 |
238 |
0.8614 |
0.8614 |
0.0000 |
| 3 |
107 |
0.9314 |
0.9127 |
0.0187 |
| 4 |
44 |
0.9601 |
0.9383 |
0.0218 |
| 5 |
28 |
0.9784 |
0.9533 |
0.0251 |
| 6 |
13 |
0.9869 |
0.9629 |
0.0240 |
| 7 |
8 |
0.9922 |
0.9695 |
0.0227 |
| 8 |
4 |
0.9948 |
0.9743 |
0.0205 |
| 9 |
2 |
0.9961 |
0.9779 |
0.0182 |
| 10 |
2 |
0.9974 |
0.9807 |
0.0167 |
| 11 |
1 |
0.9980 |
0.9829 |
0.0151 |
| 17 |
2 |
0.9993 |
0.9837 |
0.0156 |
| 28 |
1 |
1.0000 |
0.9639 |
0.0161 |
|
从表3可以看出Dmax=0.0251*,当显著水平a=0.01时,临界值为:
因此Dmax=0.0251<D临=0.042,这样就有把握认为《水利学报》论文作者分布服从洛特卡分布f(yx)=0.7251/x2.4111。
4 结论分析
(1)某一学科领域内科学工作者的生产率的规律是一种自然发展的规律,一个领域里的权威刊物中作者数和论文数是否服从洛特卡分布,一方面说明该学科的发展符合一般科学发展的规律,另一方面也表明了这些刊物办的是否具有科学性,是刊物办的是否成功的一个重要标志。
前面的统计分析表明,《水利学报》的论文数、作者数服从洛特卡分布f(yx)=0.7251/x2.4111,足以说明水利学科的发展符合一般科学发展的规律。
(2)本文中的n=2.4111,c=0.7251与经典洛特卡定律的n=2,c=0.6079比较稍大,根据n和c的参数意义,这是由统计的时间较短造成的。这也反映了水利学科方面成果的论文撰写的单位时间较长,而且随着科学技术的发展,科学研究的复杂性也日益增加,难以在短期内个人发表更多数量的论文(不排除作者同时在其他刊物发表论文的情况,仅统计第一作者对该数据也有一定影响).另外,参加科学研究的队伍也在不断扩大,所以n和c有增大的趋势,这是符合现代科学发展的趋势的。
(3)《水利学报》不仅有一支庞大的作者队伍,而且具有一部分稳定的权威作者,该刊的核心作者的发文量为4篇,较其他刊物[9,10]高,而且在水利学科方面学术水平造诣较深,发文量在5篇以上的高产作者61人,约占总数的4%,说明该学科在我国发展较为成熟,有一批学术水平较高的学术带头人。但核心作者的发文量占论文总数的23.95%,比普赖斯教授提出的50%左右要小,这可能是由于仅统计第一作者造成的。
参 考 文 献:
[1] 严怡民。情报学概论[M]。武汉:武汉大学出版社,1983.
[2] Pao M L. Lotka's Law[J]: A testing Procedure. Information Processing & Management, 1985,21(4):305-324.
[3] 文武商。有关洛特卡定律的几个问题[J]。情报科学,1985,3(6):16-22.
[4] 王崇德。期刊作者的量化研究[J]。情报科学,1998,16(5):369-373,380.
[5] 王崇德。我国情报科学论文作者的洛特卡分布[J]。情报学报,1987,6(6):190-197.
[6] 刘维东。洛特卡定律和普莱斯定律的验证[J]。情报学报,1987,6(2):91-97.
[7] 杨风兰,孙隽。谈谈我国水利科学研究的现状[J]。水利学报,1995,(8):1-10.
[8] 韩於羹。应用数理统计[M]。北京:北京航空航天大学出版社,1989.3.
[9] 雷心田,等。对核心期刊《岩土工程学报》论文及作者的研究[J]。岩土工程学报,1992,14(4):83-90.
[10] 赵红,赵良英。对测绘学报论文及作者的统计分析[J]。测绘学报,1998,27(3):274-281.
相关文章:
收藏文章:
|