Findings from an empirical vertical scaling study with BILOG-MG
Yükleniyor...
Tarih
2014
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Bu çalışmada, Madde Tepki Kuramına (MTK) dayalı iki dikey ölçekleme yöntemi (sabitlemeye dayalı kestirim ve eşzamanlı kestirim) karşılaştırılmıştır. Sonuçlar, özellikle çapa madde sayısının az olduğu durumlarda, eşzamanlı kestirimin daya iyi sonuçlar verdiğini göstermektedir. Ancak, 3 parametreli MTK modeli kullanılarak öğrenci yeterliklerinin “expected a posteriori” (EAP) yöntemiyle kestirildiği durumlarda dikey ölçeklenmiş değerlerde bozulma görülmektedir. Genel olarak bu çalışmanın sonuçları, sınıf seviyeleri arasındaki gelişimin takip edilmesi amacıyla yürütülebilecek geniş ölçekli test uygulamalarında, 2 veya 3 parametreli MTK modellerine dayalı eşzamanlı kestirimin makul bir seçenek olabileceğini göstermektedir.
This study compared two procedures for the vertical scaling in the Item Response Theory (IRT) context: fixed estimation, and simultaneous estimation. The results favored the simultaneous estimation procedure to the fixed estimation procedure, especially when there were few anchor items. However, the results also revealed that using expected a posteriori estimates (EAP) of ability scores in 3-parameter IRT model may have a deteriorating effect on the vertically scaled test results through the simultaneous estimation procedure. Overall, the results of this empirical study showed that in the large scale tests which aim to monitor the development across grade levels, the simultaneous estimation procedure with the 2-parameter or the 3-parameter IRT models would be a reasonable choice.
This study compared two procedures for the vertical scaling in the Item Response Theory (IRT) context: fixed estimation, and simultaneous estimation. The results favored the simultaneous estimation procedure to the fixed estimation procedure, especially when there were few anchor items. However, the results also revealed that using expected a posteriori estimates (EAP) of ability scores in 3-parameter IRT model may have a deteriorating effect on the vertically scaled test results through the simultaneous estimation procedure. Overall, the results of this empirical study showed that in the large scale tests which aim to monitor the development across grade levels, the simultaneous estimation procedure with the 2-parameter or the 3-parameter IRT models would be a reasonable choice.
Açıklama
Anahtar Kelimeler
Vertical Scaling, Item Response Theory, Bilog-MG, Simultaneous Estimation, Dikey Ölçekleme, Madde Tepki Kuramı, Bilog-MG, Eşzamanlı Kestirim
Kaynak
Eğitim ve Bilim
WoS Q Değeri
Q4
Scopus Q Değeri
Q3
Cilt
39
Sayı
172