人才测评过程中经常会出现许多因素影响信度。考虑不周,防范不够,就会使一个测验的信度由于某一因素而造成假相关,这就要重新评估测验结果的信度,或者要选择、转换成其他测验。这些因素主要有如下方面:
1.样本团体的性质
相关系数要受到团体分数分布的影响。如果所取样团体的分数 分布范围较小,非常同质,则所得的相关系数必然很低:但如果研究 的团体非常异质,则二者之间必然具有较高的相关。因而,同质团体 得分比较接近,分数分布范围小,则信度较低:异质团体反之。在受 到条件限制的情况下,一般就只能以部分较同质的团体来求得信度。 假如建立测验信度的团体较为异质,就容易造成假性高相关。另外, 取样团体的平均能力水平差异和个别差异均影响人才测评信度。这种差异很难用一般的统计公式来预测或评估,只能通过对各种年龄及能力水平的团体的检验来确定。
因而在选择测验时,要注意取样团体的变 异性和能力水平,建立信度系数的团体与所要测评团体是否一致等问题;要分别对非常同质的团体建立标准化样本,同时考虑年龄、性 别、级别、职业和相似性等因素,并在人才测评手册上注明其信度系数,以便人才素质测评使用者在比较各个测验的信度时选择符合所测团体性质的信度系数及测验。
2.测验的长度
测验长度指测验题目的数量。一般测验越长,则信度越高,因 为,A J验越长就越能使试题或内容的取样恰当;测验较长,就不容易猜测,使人才测评结果比较可靠。一般来说,短测验最好不采用,只有在时间或条件限制而不得不采用时方可用之。这时最好的办法是实行分测验策略多次施测,以增加结果的可靠性。如果使用成套的测验, 而各分测验的题目不多,又没有足够的信度材料,这时也就只好用总分来解释测量结果了。
3.测验的难度
测验难度与信度并不一一对应,但彼此还是关系紧密。当测验分数分布范围缩小时,测验的信度就必然降低。当测验容易时,就会使所得分数都集中在高分端,出现天花板效应;如果题目太难,得分就会集中在低分端,出现地板效应。如果难度水平只适合于中等能力水平的被测者,那么对于较高水平和较低水平的被测者都可能较易或较难,使得分数分布范围缩小,信度水平降低。这三种情形都会大大影响测量结果,使之变得不可靠。很明显,只有当人才测评的难度水平可以使测验分数分布范围最大时,测验的信度才可能最高。而这样的水平一般是被测者平均分数为总分的一半,且分数分布范围是零分至满分。只有所编制的测验能够符合上述的理想难度水准,才 能使被测者全体的得分范围趋于最大,进而提高测量结果的可靠性。
- 上一篇:人才测评测量信度的五种类型
- 下一篇:人才测评的测量效度