“海龟”比“土鳖”跑得更快吗?——针对中国一流法学院师资学术表现的一个计量研究
张巍
【全文】
引言
自改革开放政策实施以来,中国曾一度中断的海外留学现象重新恢复,数以万计的莘莘学子奔赴世界各地求学。而近年来,伴随国内经济的高速发展,以及工资待遇的提高,每年又有众多学子学成归国。在时下的流行语汇中,这些归国学子被称为“海龟”,与之相对,那些未曾出国接受教育者则成为了“土鳖”。
在法学界,出国留学潮的复苏大约可追溯到1980年代初期,如今活跃在国内法学界的知名学者,如上海交通大学法学院院长季卫东、清华大学教授王亚新等或许都可算作这一辈法学留学生的先驱。而经过10年之后,大约在1990年代早期,法学界的“海龟”逐步出现,如北京大学法学院院长朱苏力大概就是最早的“海龟”之一。如今,在中国一流法学院的师资队伍中,“海龟”已经占据了一定的比例,成为法学教育与法学研究的重要力量。[1] 也许是出于对国外法学教育质量的谦逊地推崇,在相当一个时期内,不少国内法学院都在工资或职称等方面给予“海龟”更为优越的待遇。优越的待遇似乎默认了优秀的学术表现,然而,至今为止尚未有定量的实证研究考察比较法学院中“海龟”与“土鳖”的学术表现,本文旨在对此作一个尝试性的研究,以供学界参考、批评。
一、数据与方法
数据
本文选取了国内4所一流法学院截至2008年底的全部全职教师作为研究样本,[2] 这4所法学院是:北京大学法学院、清华大学法学院、复旦大学法学院与上海交通大学法学院。这4所法学院所在的高校无疑是中国最负盛名的大学,而这些法学院本身在中国也可属于第一梯队。作为评判其教研质量与影响力的一项参考,根据教育部2009年度的学科评估,在全国600余所法学院中,他们分别位列第3、6、14和10名。[3] 除了名誉与实力之外,选取这4所高校的另一因素是其地处北京和上海这两个中国最大的城市,同时也是对“海龟”最具吸引力的城市,其师资队伍中的“海龟”比例较高,从而为统计比较提供了较为适当的条件。最后,选取这4所高校也是因为笔者对他们较为熟悉,更易于采集到有关教师基本信息的数据。对这4所高校的选取,一个可能的质疑是:就本文研究的主要问题而言,其师资的学术表现是否具有代表性。由于这一样本的抽取并非基于随机因素,因此,这种质疑总能具有一定的说服力。然而,如果我们假定这4所学校选任师资——无论“海龟”还是“土鳖”——所采用的学术标准与其他国内一流法学院的标准没有实质区别,我们就可以不必过分担心样本的代表性问题。而目前似乎尚无明显证据足以推翻此种假定。
有关教师基本情况的数据主要从各法学院的官方网页采集,网页没有显示的,通过各校内部人员了解采集,另有部分数据来自Google搜索的结果。样本中的每位教师均被赋予一个身份代号。本文所谓的“海龟”(或“海外学位获得者”)仅指从中国以外的国家取得正式的博士层次的学位者。[4] 此项标准的一个局部例外是:从日本的大学获得博士修了学历但未获得正式博士学位者也被包含在“海龟”之中,其原因在于日本授予博士学位的特殊传统。[5] 这一界定标准将仅从国外获得硕士学位——特别是一年制的LL.M.学位者,以及访问学者排除在“海龟”之外,总体说来,这些短期项目提供的学术训练与正式的博士层次项目有不小的差别。
有关论文信息的数据来自清华大学建设的中文期刊网(CNKI)。从中文期刊网的数据库中,笔者收集了各位教师于1998至2007这10年间发表的所有论文——除后述类别的文章外——的相关信息。这些除外的类别是:译文、访谈、演讲、座谈会发言、会议综述及人物回忆。中文期刊网自动计算每篇论文被4个数据库中的文章引用的总次数,这4个数据库分别是:中文期刊全文数据库、中国博士论文数据库、中国优秀硕士论文数据库与全国重要会议论文数据库。除引用总数外,笔者还自行计算出每篇论文的自引次数,[6] 以及出现在中国博士论文数据库和中国优秀硕士论文数据库中的学生引用数。[7] 从总引用数中减去自引次数及学生引用数得出每篇论文的净引用数。为削减所谓“影响性数据点”(influential data point)[8] 的作用,此项研究以净引用数的平方根作为最终的回归因变量(regressand)。以次标准,笔者总共收集到了3717篇论文的信息,在样本包含的232位教师中,有20位教师没有任何论文信息被包含于中文期刊网中,约占样本教师总数的8.62%。对于论文专业领域的划分主要依据论文的标题、摘要及关键词判定。不可否认,在将某篇论文归入20个专业领域之中时,笔者的判断尺度多少会有一定的主观性。
本文未采用南京大学建设的中国社会科学引文索引(CSSCI)收集相关信息,其直接原因是笔者所在的学校未定购CSSCI数据库。这两个数据库的一个主要区别是:CSSCI包含的引用文献(并非被引文献)数量更少、来源期刊被认为质量更高。[9] 同时,CSSCI总体收录的被引文献数目较少,且仅显示被引数不为零的文献的信息。此外,CSSCI中的被引文献包含书籍,而CNKI则仅含论文。基于两个数据库的上述异同,笔者认为:就此项研究的主要目的与实施方法而言,CNKI或许是更好的选择。首先,CSSCI较少的被引文献数,以及排除零引用文献的做法可能导致更多的数据缺失(missing data points)。假如某教师发表了3篇论文,但均未被引用过,则CNKI将报告这3篇文章的信息并显示其被引数为0,而从CSSCI中我们将看不到这3篇文章的信息,因而不得不将此教师当作一个缺失数据,而缺失数据比例的升高会削弱计量研究的可信度。其次,CSSCI的被引次数包含了书籍的被引次数,从学术品性上说,书籍与论文可能具有显著差别,尤其是教材,它们可能被密集引用,而其学术原创性通常较低。尽管有以上这两项考虑,然而,两个数据库在引用文献质量上的差别仍有可能对本文的研究结论产生影响——虽然笔者想不出有什么特别的理由足以令“海龟”们的论文系统性地倾向于被低质量的文献饮用,或者相反。因此,本文的研究结论有待利用CSSCI数据所作的类似研究的进一步证实。
有关数据库的最后一个问题是,CNKI每天都在更新数据,其包含的中文期刊种类也在不断扩大。因此,对某篇论文而言,在数据收集过程的起始阶段获得的引用数会略小于在这个为期2个月的过程的结尾阶段进行再次收集时获得的引用数。不过,这一情况似乎不足以对研究结论产生重大影响。为考察这一引用数的变化情况,笔者从教师样本中随机抽取了10%的子样本,对该子样本所含教师的各篇论文进行了两次引用数采集,第一次采集的时间是2009年4月10日至12日,第二次的采集时间是2009年6月5日至7日,其间隔长度与原先数据收集过程的长度基本一致。这一抽样检测的结果包含于本文附录之中。
2.方法
本文将各位教师发表的论文被引用的次数作为衡量其学术表现的指标,[10] 通过两个加权最小平方(weighted least square)回归模型对数据进行分析。第一个模型是直接的多元回归法(multivariable regression),第二个模型是基于经调整之样本数据的二步回归法。
本文的数据评估方法主要依据Ayres与Vars提出的“机会回归”(opportunity regression)理论。[11] 假如我们控制那些影响论文被引用的机会,却与论文质量没有关联性的变量,我们至少在理论上可以通过比较回归的误差值(residuals from regression)来评判论文质量的优劣。在第一个模型中,笔者直接以这些变量作为回归自变量(regressor)进行数据分析。影响被引用机会的首要因素是论文的年龄,也就是从论文发表至今的时间跨度。为控制论文的年龄,回归模型中加入了论文年龄及论文年龄之平方这两个变量。论文年龄以年为单位,具体而言,就是2008减去论文发表之年份。
另一项可能对论文的被引用机会产生影响的因素是其所属的专业领域。不难想象,由于所属领域的不同,论文的被引次数可能出现明显差异。例如,假使商法方面的论文数量大大超过法制史方面的论文数量,则商法论文就更有可能被引用到。[12]为控制这一因素,笔者用了20项虚拟变量(dummy variable)来代表20个目前中国法学界主要的专业领域。
或许出于后述的某些历史原因,海外学位获得者作为一个群体,其年龄普遍较国内学位获得者为大,而获得学位的时间则较晚。[13] 基于此种特点,笔者加入了教师年龄(2008减去出生年份)与获得学位年份这两项变量作为控制变量,以免因这种区别而导致统计结果的偏差(bias)。
直接多元回归模型以各人论文总数之倒数作为权重,由此,每位教师无论其论文数多少,在回归模型中具有的影响力都相等。最后,由于每篇论文的信息均构成一个观察项(observation),考虑到各观察项之间可能存在的异方差性(heteroscedasticity)和不独立性(interdependence), 笔者通过各教师的身份代号对观察项进行了编组,以此为基础测定标准误差(standard error)。
为进一步排除“海龟”与“土鳖”在年龄与取得学位年份方面的差异可能对分析结论产生的影响,此项研究还运用了一个二步回归模型,该模型依据在个人特征与论文特征特定的前提下,“海龟”被包含进样本的概率,对样本数据作出调整。作为第一步,笔者控制论文年龄(及论文年龄之平方)、教师年龄、获得学位年份以及专业领域,借助最大似然估计(maximum likelihood)logit 模型,测算出上述概率(以phat变量表示)。在第二步中,笔者以“海外/国内”(国内=0)虚拟变量为自变量,对论文净引用数的平方根进行加权回归分析。对“海龟”而言,其权重就是各人论文总数之倒数;对“土鳖”而言,其权重则是样本包含“海龟”之概率与包含“土鳖”之概率的比(即phat/(1-phat))乘以各人论文总数之倒数。与前述直接多元回归模型一样,在此,观察项也被按照身份代号加以编组,据以测定标准误差。
二、结果
1.直接多元回归
直接多元回归模型显示:若以论文引用数为标准,则“海龟”与“土鳖”的平均学术表现没有实质差异。表1是相关的回归结果。
表1:直接多元回归之结果
回归因变量:sqcita |
回归系数(coefficient) |
稳健标准误差(robust standard error) |
t |
p |
95%置信区间(confidence interval) |
hg |
0.1407661 |
0.2125634 |
0.66 |
0.509 |
[-0.2783005, 0.5598327] |
aage |
0.6442917 |
0.0724941 |
8.89 |
0.000 |
|