二、实验运用于司法领域的方法论基础
实验起源于自然科学研究领域,因此天然带有自然科学方法论的烙印,而当其被引入包括法学在内的社会科学各个领域之后,又兼容了社会科学研究的思维特点。
(一)为什么要做实验
从事学术研究的人在进行研究时非常重视事例的选择和分析,事例的获取最初是通过观察,但仅仅通过观察不一定能得到所需事例,简单列举现成事例又不能确保结论的可靠。因此研究者渐渐不再满足于通过被动地观察外界所提供的事例来探究因果联系,而想到通过实验来变换条件人为地制造一些事例,并对事例作进一步的研究,从中发现规律。如何变换条件人为制造事例呢?实验应运而生,其遵循的原理是控制和比较。如果想研究某个因素与某个结果之间的因果关系,可以通过控制其他因素不变,只改变这个因素大小的方式,来确定这个因素对结果影响。“控制”就是对实验环境,外部刺激的强度、类型,实验对象的人数、规模、结构进行人为的设计和掌控,以符合实验目的。“比较”就是将实验对象的不同状态进行对比,从中发现区别和联系。19世纪英国哲学家J. S.密尔(近代又译为穆勒)提出“密尔五法”(穆勒五法){8}作为归纳法的重要内容,也为实验活动中的“比较”提供了基本的逻辑准则。基于控制和比较的原理,有社会学家将实验定义为“修正一个情境下的某种事物,然后将其结果与未做任何修正的情境下所得的结果做比较”。{9}
司法领域实验中的假说验证类实验和制度改良类实验都遵循受控比较的原理,但在实现形式上有所不同。假说验证类实验严格遵循实验的基本要求和条件,而制度改良类实验则更复杂一些。由于具有较强的探索创新性质,在实验过程中往往缺少严格的条件控制,而常常通过与新制度实施之前状态的比较或实验过程中的反复自我调试来实现。从本质上说,其是通过在实践中不断试错、对比和调试来追求制度运行的最佳效果。这种逻辑可以用波普尔的“试错理论”来概括。波氏反对自培根开始的古典归纳主义和逻辑实证主义,提倡“试错法(trial and error) ” ,认为科学的发展是由不断提出试探性的猜想,并通过反驳和证伪不断排除猜想中的错误而实现的。“试错法”不是单纯的否定,而是要通过证伪去达到暂时的“确认”。{10}由于制度创新类实验不是追求理论解释的客观性,而是新制度效果的验证,因此不重谨慎严密的条件控制,而重积极探索式的“试错”,因此与典型的研究类实验具有一定的差异,缺乏某些实验的基本特征。但总体而言,受控比较仍然是两类实验得以实行的理论基础。
(二)实验怎么做
实验的具体操作离不开三对基本要素:①自变量与因变量。所谓“变量”,是指变化着的事物,能对其他某物的具体状态施加影响,或者是被后者影响,蕴含着对程度或者差异度的看法。{11}自变量是实验中的刺激因素,因变量是由自变量所引起的状态。实验的目的就是考察自变量对因变量的影响。实验与纯理论研究的一个重要不同就是“转概念为变量”,这样做是为了用一种可观察的形式把概念表达出来,使之包含对程度或差异的某种看法。{12}②前测与后测。在实施实验刺激以前对实验对象(实验组和控制组)进行的测量称为前测,而在实施实验刺激后对他们的测量称作后测。③实验组与控制组。为了更加精确地观察实验对象的变化,实验还常常将受试者分为实验组与控制组,这两个组是随机选派的。实验组是指在实验中被施以刺激的受试者;控制组是指在实验中没有被施以刺激的受试者,但是在其他方面则和实验组一样。{13}从理论上说,由于实验组与控制组的无关变量的影响是相等的,故实验组与控制组两者之差异可认定为是来自实验变量的效果,这样对比而得出的实验结果是可信的。
简单地说,一个典型的实验过程是:设计一个实验组,先测量在没有受到A(自变量)的影响之前B(因变量)的情况(前测),然后施加实验刺激A并保持其他条件完全相同,再对受A影响后的B进行测量(后测)。为了结果精确起见,将实验组的前后测情况与没有接受刺激的控制组进行比较。最后通过比较前后两次测量的结果是否存在差异来判定A和B之间是否存在因果关系。如果前后两次情况发生变化,则能够初步认为A是导致B变化的原因,即A→B。这是典型模式,实际上三对实验基本要素在实验设计中根据实验目的和设计繁简的不同可能体现为不同的组合形式。{14}
(三)实验效果如何评价
实验的效果以实验效度来评价,实验效度指实验方法能达到实验目的的程度,包括内部效度和外部效度。实验具有内在效度是指从实验结论能够准确反映实验本身的可能性。内部效度决定了两个变量的因果关系是否能够被合适地表现出来,这主要体现在:原因(自变量)在时间上的发生顺序先于结果(因变量);原因(自变量)与结果(因变量)存在关联性;在实验观察中没有似是而非的其他解释(其他可变因素)。{15}在任何时候,只要实验以外的因素影响了因变量,就会造成内在无效度。美国学者坎贝尔和斯坦利曾列出社会学实验设计的内在无效度的12种来源,包括历史事件、成熟、测验、测量工具、统计回归、选择偏好、实验死亡率、因果时序、实验处理中的传播与模仿、补偿、补偿性竞争、自暴自弃。{16}具有外在效度指的是实验结果概化到“现实”世界的可能性,也就是普适性程度。较高的外部效度就是指可以类推到实验的目标群体,可以类推到与实验类似的其他群体,实验环境、选择、测量工具、构想效度等因素都会影响实验的外部效度。{17}