教育與心理測量理論是數(shù)學概念的集合,它形式化和澄清了關于構建和使用測驗的某些問題,然后提供了反映這些問題的方法。測驗理論的兩個分支是經(jīng)典測驗理論(CTT)和現(xiàn)代測驗理論。CTT中的分析單位通常是一個人對一組題目的反應的總分。項目反應理論(IRT)被認為是幾種現(xiàn)代測驗理論方法之一,顧名思義,分析的單位是單個題目反應。雖然CTT方法易于使用,計算效率高,但CTT有幾個局限性,包括測驗水平方法和分數(shù)依賴于測驗題目和樣本等。IRT可以對題目和人的潛在特質(zhì)提供更豐富和全面的估計。IRT以更大的數(shù)學計算量,更大樣本量的要求和更強假設的需要為代價,減輕了CTT的一些局限性。然而,隨著計算能力和編程的進步,許多領域的人們發(fā)現(xiàn)使用IRT的優(yōu)勢超過了數(shù)學和計算的復雜性。IRT通過模型化的題目參數(shù)估計題目特征,這允許在題目水平(二分或多分評分)和測驗水平計算期望分數(shù)?紤]到特定的題目特征以及人對每個題目的反應,人的潛在特質(zhì)或能力得分也被估計。理論上,IRT能夠獨立于對題目做出反應的特定樣本來估計題目參數(shù),并且獨立于所反應的特定題目集來估計個人的潛在能力。IRT的這種參數(shù)不變性在IRT的許多應用中(如題目功能差異和題庫建設)是必不可少的。
第1章教育與心理測量的基本概念和理論
1.pan style="font-family:宋體">教育與心理測量的基本概念·
1.2教育與心理測量的特點
1.3教育與心理測量的量尺
1.4主要的教育與心理測驗分類
參考文獻
第2章CTT概述
2.pan style="font-family:宋體">真分數(shù)理論
2.2測量的信度
2.3測量的效度
2.4題目類型與性能
2.5常模參照測驗與標準參照測驗
參考文獻
第3章 從CTT到IRT
3.1CTT的局限及IRT的發(fā)展
3.2IRT的基本假設
3.3題目特征曲線模型
3.4IRT題目參數(shù)估計
3.5測驗特征曲線
3.6估計被試能力
3.7信息函數(shù)
3.8測驗校準
3.9多維項目反應理論(MIRT)入門
參考文獻
第4章多分評分IRT
4.pan style="font-family:宋體">等級反應模型
4.2 Muraki評定量表模型
4.3稱名反應模型
4.4分部評分模型
4.5廣義分部評分模型
4.6 Andrich 評定量表模型
4.7連續(xù)區(qū)間模型
4.8模型比較
4.9多分評分題目的信息量
4.pan style="font-family:宋體">模型選擇·
4.pan style="font-family:宋體">多分評分模型的擬合優(yōu)度
參考文獻
第5章測驗等值
5.pan style="font-family:宋體">測驗等值的概念及條件
5.2均值等值·
5.3線性等值·
5.4等百分位等值法
5.5IRT等值
5.6無錨題測驗等值設計方法
5.7等值誤差
參考文獻
第6章能差異
6.pan style="font-family:宋體">能差異相關概念
6.2性、有效性和DIF
6.3_ Logistic 回歸
6.4標準化
6.5 Mantel-Haenszel程序
6.6 Mantel檢驗
6.7 HWpan style="font-family:宋體">和HW3
6.8 IRT檢驗 DIF
6.9 Lord'sx2
6.pan style="font-family:宋體">多分評分的DIF
6.11CFA框架下的DIF,與IRT術語聯(lián)系起來
參考文獻
第7章 MIRT
7.1 MIRT概述
7.2MIRT模型
7.3MIRT題目和能的統(tǒng)計描述
7.4題目和個人參數(shù)的估計
7.5測驗數(shù)據(jù)的結構分析
7.6將參數(shù)估計轉換到的坐標系
7.7鏈接和量尺化
參考文獻
第8章計算機化自適應測驗
8.pan style="font-family:宋體">計算機化自適應測驗概述
8.2CAT程序的成分·
8.3CAT在多維情況中的推廣
8.4 MIRT CAT的發(fā)展方向
參考文獻