Kayıp veri sorununun çözümünde kullanılan farklı yöntemlerin ölçeklerin geçerlik ve güvenirliği bağlamında karşılaştırılması
Yükleniyor...
Tarih
2015
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Bu araştırmanın amacı kayıp veri sorununun çözümünde kullanılan farklı yöntemlerin etkililiğini ölçeklerin geçerliği ve güvenirliği bağlamında karşılaştırmaktır. Bu amaçla, PISA 2012 Türkiye örneklemi ve "Matematik Çalışma Etiği" ölçeğinden yararlanılmıştır. Analizler için Türkiye örnekleminden rastgele 200 kişilik tam veri seti çekilmiştir. Tam veri setinden, tamamıyla rassal olarak kayıp (TROK) mekanizması altında, farklı oranlarda veri silme ve bu verileri farklı kayıp veri yöntemleriyle yeni tam veri setlerine dönüştürme işlemlerinden sonra geçerlik ve güvenirliğe ilişkin analizler gerçekleştirilmiştir. Kayıp veri içeren setlerin yeni tam veri setlerine dönüştürülmesinde seri ortalaması, yakın noktaların ortalaması, yakın noktaların medyanı, doğrusal değer kestirimi, noktanın doğrusal eğimi, liste bazında silme, beklenti maksimizasyonu, regresyon ataması ve çoklu atama kayıp veri yöntemleri kullanılmıştır. Yeni tam veri setlerinden geçerlik ve güvenirliğe ilişkin elde edilen değerleri karşılaştırarak yorumlamada tam veri setinden elde edilen değerler referans değerler olarak kullanılmıştır. Araştırma sonuçlarına göre liste bazında silme yöntemi için elde edilen değerler, genel olarak tam veri setinden elde edilen değerlere en az benzerlik gösteren değerler olmuştur. Yaklaşık değer atama yöntemleri için elde edilen değerler kayıp veri oranının düşük olduğu durumlarda genel olarak tam veri setinden elde edilen değerlere yakın veya aynı değerleri verirken, tüm kayıp veri oranları için tam veri setinden elde edilen değerlere en yakın değer veren yöntemler çoklu atama, beklenti maksimizasyonu ve regresyon ataması yöntemleri olmuştur.
The purpose of this research is to compare the effectiveness of various methods used in solving missing data problems in the context of validity and reliability of the scales. For this purpose PISA 2012 Turkey sample and "Math Work Ethics" scale was used. For the analysis, complete data set of 200 persons were chosen from the Turkey sample at random. After the process of data deletion at different rates from complete data set and transforming them into new complete data sets, under missing completely at random (MCAR) mechanism, analysis of validity and reliability were realized. During the phase of transforming missing data set into new complete data sets, series mean, mean of nearby points, median of nearby points, linear interpolation, linear trend at point, listwise deletion, expectation maximization, regression imputation and multiple imputation methods were used. The values obtained from the complete data set were used as reference values in interpreting the values by comparing the values of validity and reliability at the new complete data sets. The research results reveal that the values obtained for the listwise deletion at different rates of missing data are the values with the least similarity to the ones generally obtained from the complete data set. While the values obtained for the approximate value imputation methods resulted in proximal or same values as the ones generally obtained from the complete data set in cases where the missing data rate is low multiple imputation, expectation maximization and regression imputation methods resulted in close proximal values at all missing data rates as the ones obtained from the complete data set.
The purpose of this research is to compare the effectiveness of various methods used in solving missing data problems in the context of validity and reliability of the scales. For this purpose PISA 2012 Turkey sample and "Math Work Ethics" scale was used. For the analysis, complete data set of 200 persons were chosen from the Turkey sample at random. After the process of data deletion at different rates from complete data set and transforming them into new complete data sets, under missing completely at random (MCAR) mechanism, analysis of validity and reliability were realized. During the phase of transforming missing data set into new complete data sets, series mean, mean of nearby points, median of nearby points, linear interpolation, linear trend at point, listwise deletion, expectation maximization, regression imputation and multiple imputation methods were used. The values obtained from the complete data set were used as reference values in interpreting the values by comparing the values of validity and reliability at the new complete data sets. The research results reveal that the values obtained for the listwise deletion at different rates of missing data are the values with the least similarity to the ones generally obtained from the complete data set. While the values obtained for the approximate value imputation methods resulted in proximal or same values as the ones generally obtained from the complete data set in cases where the missing data rate is low multiple imputation, expectation maximization and regression imputation methods resulted in close proximal values at all missing data rates as the ones obtained from the complete data set.
Açıklama
Anahtar Kelimeler
Kayıp Veri, Geçerlik, Güvenirlik, Missing Data, Validity, Reliability
Kaynak
Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi
WoS Q Değeri
Scopus Q Değeri
Cilt
6
Sayı
2