其二,对质量评查的结果的应用要慎重。质量评查所产生的数据有相当的客观性,但也要注意多种因素对数据的影响,以及生成的数据在反映审判态势和问题上受到的限制。首先,无论如何设置指标体系,都存在一定的局限性。而且审判的复杂性,各种因素对审判的影响,不一定都能从数字上反映。例如,二审改判发回重审率的升降,被认为是衡量一审质量的关键指标之一,但有时上级法院审判组的调换,不同的把关标准,会影响这一比率;又如,骨干法官常常担当疑难案件审理,其外显的效率指标和效果指标可能低于普通法官;再如结案率与审限方面的指标,不一定能够反映实践中大量刑事案件“隐性超期”的现实情况。[15]此外,因为审判指标的评价作用,人为影响这些指标的情况在实践中也不罕见。应当说,质量评查数据结果的这种局限,有经验的审判管理者都能认识到。因此,将质量评查的数据作为掌握审判动态、发现突出问题的资料是必要而有益的。但问题在于,在法院系统行政化的评比机制之下,这些数据可能被用于对法院或法官进行评比考核的依据,而一旦如此,常常难以避免评价上的简单化和失准,有时会使法院和法官为评比的要求扭曲审判行为,甚至人为地影响数据生成。[16]
(五)适当把握审判绩效考核的方法与限度
审判绩效考核有比较法上的参照物,不过这在不同国家和地区处理方式不同。主要区别是,在科层化的司法行政体制之下,如大陆法系国家和地区,绩效考核比较重要;而在非科层化的体制下,如美国,绩效评鉴只供法院管理者参考,只对法官起某种督促作用,而不与法官升迁和惩戒挂钩。[17]
对中国这种强科层化的司法行政体制,大陆法系国家和地区的做法显然更具有可参照性。在大陆法系国家和地区,法官是公务员或特殊公务员,其考核属于公务人员考核制度的一部分。其具体做法,一是考核指标上,既有量也有质。如我国台湾地区过去曾参照国外做法,订有“法院法官办案成绩考查实施要点”,确定考查项目包括:结案件数、结案速度、当事人折服率、办案维持率及调解成立率等五项。德国萨克森邦的法官考核办法,将考核项目分为9项:专业知识、理解能力、口语表达能力、文字表达能力、处理能力、待人接物、沟通技巧、贯彻能力及吃苦耐劳。对法官分别考核后加总成绩,评定为极为适任、非常适任、相当适任、适任、不太适任、不适任等6个档次。二是考核主体与方法多元化。考核主体主要有行政首长为主及法官考评委合议两种类型。前者成本较低,而且因为院长等行政首长地位比较超脱,不具有“竞争者”身份,可以避免“同僚评鉴”产生的一些微妙情结。尤其是在行政权强大的德国、日本等国,法院行政首长成为主要考评主体。而考评方法,可能采取书面审查、平时观察、指标审核、法庭现场观察等多种方式。美国法院管理中的法官评鉴,从上世纪70年代后,纳人了“消费者”的观点,考察礼民、便民及民众信赖等;同时使用外部评价,如参考对律师、陪审员、当事人的外部调查。有的法院将评鉴工作交给退休法官组成的委员会进行。三是具有轻积极评鉴、重消极评鉴的发展趋向。由于数量、速度、维持率、上诉率等指标虽然具有清晰量化、便于评价的功能,但难免受到过于粗糙的质疑,而且引导作用较大,可能扭曲法官的行为。因此一般来说,这些考核指标,只适宜于在与平均值有明显差距时,作为负面评断的依据,而不宜作为正面评价的重要依据。因此,我国台湾地区的“法院法官办案成绩考查实施要点”已于1997年废除,而且合理放宽法官管考制度,同时大幅提升法官待遇。从德国看,各邦司法部也只是将未结案件过多等指标,作为将法院报核的总评等次向下调整的重要依据。不过,这种轻积极评鉴、重消极评鉴的做法,也受到某些法律人和学者的批评,认为这种防弊心理下的改革有其合理性,但长此以往会助长“平头主义”,乃至“平庸主义”,不能促使法官力求精进。[18]然而,在域外各国和地区,法官考核不能损害法官独立,这是基本的原则。在具体把握上,则要求考核的方法与限度应有适当把握。由行政主导的考核,如果过于强势,就容易推演至以长官意志介入案件审理,损害法官独立。