人事(HR)决策都属于重大决策。比如选拔,如何从多个合格的候选人中找到最合适的人选对企业的发展至关重要。对于个人来说,是否被选中关乎着薪水,机会乃至整个的职业生涯的成败。这类有深远影响同时又充满不确定性的决策被称为高赌注(high-stake)决策。

高质量的决策需要准确有效的信息。人事决策常用各种心理测量工具,其中人格测量工具种类繁多,鱼龙混杂。选择、使用和解读可靠的心理测量工具对人事领域的从业人员来说极具挑战性。因此,正确理解和评估心理测量工具对他们的工作有直接的帮助。对于管理层来说,这些知识也能帮助他们理解人事部门的工作,更好地为企业的战略服务。

人格测验的目的是精确定位个体在某个特质上的相对位置。比如外向性格和销售有正相关,那么就应该选拔最为外向的候选人。人格测验的目的就是比较不同的人在心理特质维度上的相对位置。

古人缺少精确的心理测量工具,习惯于把人进行简单分类。比如,古希腊是最早有纪录的对人格进行系统分类的文明。2400多年前,医学之父希波克拉底(Hippocrates)总结说:脾气秉性是由体液的颜色决定的,进而提出了胆汁质,多血质等四个分类。这个分类是前科学的,基于直观观察,缺少实证的基础,分类也很粗糙。但是,因为这种分类听起来很有道理,直到现在依然流行,比如某娱乐明星把胆汁换成了色彩就有了“自创”的色彩心理学,颇可以迷惑一些人。

“色彩心理学”固然迷惑了很多人,类似的分类标准也五花八门,诸如星相,血型,九型人格,MBTI乃至生辰八字等都有很大市场。很多人事领域的从业人员缺乏严格的认识论和研究方法的训练,在面对这些工具的时候往往眼花缭乱,选择了比较差的甚至是错误的工具来做为专业选拔的依据。

那么如何分辨这些测量工具的优劣呢?哪些适合用来做为选拔的工具呢?

要回答这些问题:

一、首先要理解什么是理论。

二、理解理论和测量之间的关系。然后才能够理解评价测验的核心问题:信度和效度。

首先,什么是理论。理论一词听起来高大上,其实并不难理解,事实上,理论很简单,很泛,在生活中无处不在,是每个人的每个决策和行为背后的原因(虽然大部分人多数情况下并未意识到)。所谓理论,其实就是对事物之间的关系。最简单的理论就是一件事物影响另外一个事物。比如:很多人婚配要查生辰八字,其背后的理论就是出生时辰会影响人的命运;择“吉日”开张背后也有理论,就是开张的时辰决定以后的运势。

任何对相关关系的描述都是理论,但是并不是所有的理论都是正确的。人们用理论来指导行为,好的理论能提高决策的质量,增加的成功的可能性。错误的理论则能引入歧途,降低决策效率甚至带来危害。那么如何判断理论的好坏呢?

好的理论必须满足两个充分条件:

首先、好的理论必须以客观事实为基础,有些理论是基于可观测的事实,有些理论是基于凭空想象,大部分理论都是二者的结合。因此,分清什么是事实,什么是想象对于进一步理解理论至关重要。

其次、理论必须对所描述的关系给出客观合理的解释。很多理论其实并不给出解释,比如星相,血型等,这种理论近乎神秘主义,完全不必相信。

除了满足这两个充分条件,好的理论还要满足一个必要条件-可证伪(Falsifiability)。有些理论永远能自圆其说,事后能解释所有现象,不能被证伪,比如“心诚则灵”,这样的理论不是好的理论。

可证伪性是一个非常复杂的问题,需要非常深入细致的讨论。限于篇幅和中心,我只简单解释一下。

一、可证伪性这个词有一定的误导性

其实科学研究的根本是假设检验,其逻辑如下:任何理论都先假设它是错误的,其对立面是正确的。如果证据证伪了对立理论的假设,这样我们才有信心认为这个理论是正确的可能性是比较大的。但是因为归纳法的根本缺陷,我们是无法真正证实一个理论是否正确的。因此,证伪是我们能找到的认识理论的最好办法,但并不是终极办法。只有理解了这个逻辑,才能真正理解理论以及科学的本质。

二、大家都听说过“实践是检验真理的唯一标准”

实际上,更确切的表达是:“证据是检验理论的唯一标准”。简单来说,所有能够证实或者证伪某个理论的客观事实都是证据。但是并不是所有的证据都是等同的。最弱的证据来自于案例,最强的证据来自于精心设计的随机大样本双盲实验。

测量工具的目的之一就是为理论提供证据,应用这些工具来解决实际问题,比如选拔,是测量工具的另一个用途。

评价一个测量工具的优劣要回答三个问题:

一、该测量工具是否基于有效的理论?

二、该测量工具是否可靠(信度)?

三、该测量工具是否有效(效度)?

如果目的是用来检验理论,那么对这三个问题的要求都不需要很高,但是如果应用在高赌注决策中,如选拔,那么对这三个问题的要求都要很高,否则犯错的几率就会非常高。

首先、任何测量工具背后都有自己的理论,对理论语焉不详或者解释不清楚的都可以忽略。这样的理论即使不是骗人,也没有达到可以提供有效信息的程度。测量工具要复合理论中对相应概念的定义,该定义需要明确的内涵(什么是)和外延(什么不是),并且说明如何在这个维度上对个体进行比较。

信度和效度是现代心理测量学(Psychometrics)[3]的核心概念。现代测量学认为测验分数包含三个部分,真分数(根据理论测验想要测量的内容)、系统误差(不是根据理论要测量的但是因为测量工具的局限所附带测量的内容)和随机误差。比如让同事评价一个人是否外向,他的真实外向分数是7(真分数),他为人乐观让人误以为外向(+2分,系统误差),这个同事今天早上刚刚和老婆吵架(-3分),于是最终得到的分数就是6(7+2-3)。

信度是一切测量工具的根本,没有信度就没有效度,信度是效度的上限。所谓信度,简单来说就是测量工具的一致性。比如尺子是测量身高的工具,信度高的尺子不管是今天测还是明天测,不管是在中国还是在美国,不管是你来测还是我来,结果都应该是一样的。如果测出来的结果差异太大,这尺子就要扔掉,因为信度太差。

评价一个测量工具的信度有三个主要办法:

一、隔一段时间再次测量,比较两次测量之间的相关联程度;

二、用不同的工具测量同一个概念,然后比较它们之间的关联程度;

三、用统计方法考察量表的内部一致性。

效度是考察测量工具的第二个关键指标。简单来说,效度就是该工具测量出来的东西是否有效,能否预测理论上能够预测的结果。要想达到一定的效度,测量工具必须达到一定的信度,信度低的工具,每次测量的结果都不同,怎么能准确预测任何东西。

和选拔关系最大的评价测量工具等的效度的方法是看该工具是否预测主要的工作绩效指标,换句话说就是是否有用。很多迷信MBTI的人辩解说我不管什么信度效度,反正对我来说是对的,我就相信。这是对测量工具乃至整个实证过程的误解,偶然的准确并不能证明一个测量工具可靠,只是偶然误差在说话而已。

下图列举了三个测量工具的例子,工具一和三的信度是一样的,因为随机误差的比率是一样的,但是一的效度高于三,因为真分数的比率更大。如果单纯是为了论证理论,那么一和三都可以考虑,心理学家可以通过统计工具在一定程度上剔除系统误差和随机误差的杂音来探讨真分数的影响。但是对于管理和决策实践来说,必须使用信度和效度都很高的测量工具。

简单总结一下,选择测量工具归根结底需要回答三个问题:

一、该测量工具的理论是否可靠;

二、该测量工具的信度如何;

三、该测量工具的效度如何。

下面用这三个问题简单讨论一下几个常用的人格测量工具:星座,MBTI和大五人格。

星座的理论可靠么?科学家的结论是不可靠,出生的日期决定了一个人的性格缺乏客观合理的解释和实证支持。星座测量的信度应该是非常高的,随机误差来自于人为度错误,比如记错了生日等。除了坊间传说以外,并没有系统的证据证明星座和性格之间有什么相关。

MBTI是很多人事从业人员的宠儿,虽然早已被学术界所抛弃,本人和沃顿商学院的亚当.格兰特(Adam Grant)分别写了科普文章指出MBTI的不足。MBTI的理论最初源自卡尔.荣格(Karl Jung)的临床观察,理论有客观基础。但是和很多描述性的研究一样,该理论对这四个维度的作用机制仍然语焉不详。但这几乎是所有人格理论的共同弱点。对MBTI的批评更多来自该测验的低信度和效度。

目前最好的人格理论是大五人格,大五人格同样起源于对人格描述的分类,但是目前对他的神经和基因机制都在进一步探索,属于人格理论中得到客观事实支持最多的理论。大五人格的测量工具很多,有些达到了相当高的信度水平,可以满足人事决策的需要。大五人格和工作绩效之间的关系也有很强的证据[5],因此效度也有证据支持。

另外,虽然大五人格可能是目前最可靠的人格测量工具,但是过分相信大五人格测验仍然是危险的。以尺子为例,用它来测量身高的误差是很小的,用数字来说可以轻松达到0.99甚至更高,因此可以信任。而人格测量工具的信度则极少能达到0.90。因此,必须明白大五人格测验的结果可以参考,但不能迷信。

人事决策和很多其它管理决策一样,是一个复杂的过程,缺少明确的判断标准。因此,提供人事从业人员对测量工具的本质的了解,可以提供决策的质量。

(下载iPhone或Android应用“经理人分享”,一个只为职业精英人群提供优质知识服务的分享平台。不做单纯的资讯推送,致力于成为你的私人智库。)

作者:王崇巍
来源:微信公众号:蜜蜂派