|
计算机化考试的研究和发展 |
|
T 的主要内涵。
2 计算机自适应考试的原理 2.1 题库的建设(construction of Item Pool) 题目的编制、筛选、组合成题库是进行CAT测试的首要步骤。题库并非是一些项目的简单集合,而是一种有机的组合。题库的最重要的特征是其中的项目不仅是测验题目,而且都有必要的参数,而这些参数指标必须满足一定的条件、符合一定的模式。项目是用来反映被试特性的,一个项目的质量直接影响到它对被试能力特性的反应质量。一个项目的性质往往是由项目的参数来进行刻划的。从认知心理学的观点来看,给予被试一个刺激(项目),被试通过加工(以其能力为中介)做出一定的反应,IRT在已建立起的项目参数、答对概率、被试能力之间的关系模型基础之上,通过外显的、可测的被试的答题反应测量出被试的能力特性因此参数估计决定了测验准确性的基础。在IRT理论中,项目的参数有:(1)鉴别力(discriminative powder index);(2)难度(difficulty index);(3)猜测系数(guessing index)。采用不同的参数,就构成了能力与参数间不同的数学模型。常用的数学模型有:单参数模型、双参数模型和三参数模型等。 (1)单参数模型 单参数模型是指项目难度与被试能力之间的关系数学模型。有单参数常态钟型模型、单参数对数模型以及Rasch 模型。其中以Rasch 模型影响最大。 Rasch模型为一种随机概率模型,数学公式的表达为:
其中为能力估计值,b 为项目难度。 (2)双参数模型。如双参数对数模型:
其中 a 为鉴别力指数。 (3)三参数模型。如三参数对数模型
其中c 为猜测系数。 IRT 的模型不下二十余种,如何选择恰当的模型进行参数估计是题库选题的关键。不同的模型具有不同的特点,适合于不同条件下的使用。就以上提及的三种模型而言:单参数模型比较简单,使用较为方便,但它对项目参数性质的要求较为苛刻,如在采用Rasch模式时,必须满足难度指数介于0.85和1.25之间,并且猜测系数很小等诸多条件,否则宜采用其他模式;双参数模型要求项目的猜测系数较小;三参数模型虽然具有涵盖较多项目信息的优点,但亦给参数估计带来更为复杂的工作。因此,虽然关于模型选择标准现在尚无定论,不过,可以从命题方式、记分方式、参数性质、样本人数、模型的强健性、假设的满足与否等方面得到一些选题的依据。
上一页 [1] [2] 上一个医学论文: 声调的脑机能偏侧化研究 下一个医学论文: 个性与工作绩效关系研究的新进展
|
|
|
|
|
|
|