İstatistik İşini Abarttık Mı?

Sınıflama, sıralama, eşit aralıklı ve eşit oranlı ölçek türlerini incelediğimizde, eğitimde yaptığımız ölçmelerin sıralama ölçeği düzeyinde olduğunu görürüz. Peki neden sıralama ölçeği? Aşağıda üç öğrencinin bir fizik testinden aldıkları puanlar var:

Ali: 90
Mete: 80
Ayşe: 70

Üç öğrenci arasında 10’ar puanlık fark bulunuyor. Eğer bu ölçme sonuçları eşit aralıklı bir ölçekle elde edilmiş olsaydı şu yorumda bulunabilirdik: Ali ve Mete’nin fizik dersindeki bilgisi arasındaki fark ile Mete ve Ayşe’nin fizik dersi bilgisi arasındaki fark eşittir. Lakin böyle bir yorumda bulunamıyoruz. Hatta aynı puanı alan iki öğrenci için bile bu iki öğrencinin fizik dersindeki bilgileri eşittir diyemiyoruz. Öyleyse, elde ettiğimiz ölçmeler sıralama ölçeği düzeyinin üstüne çıkamıyor.

Ölçek, ölçme işlemi sonunda elde edilen sayı kümesinin matematiksel özellikleridir (Baykul, 2000). Dolayısıyla elde ettiğimiz ölçme sonuçları üzerinde yapabileceğimiz işlemler sıralama ölçeğinin bize izin verdiğinden öteye geçmemelidir.

Crocker ve Algina (1986), kitaplarının Test Geliştirmede Ölçekleme Yaklaşımları başlıklı bölümünde, tutum ölçeklerinde sıklıkla kullanılan Likert yanıtlama yapısının da sıralama ölçeği düzeyinde olduğunu ifade etmiş (hiç katılmıyorum ve katılmıuyorum arasındaki fark ile tamamen katılıyorum ve katılıyorum arasındaki fark eşit midir?), bu noktada geliştiricinin ölçeğini eşit aralıklı ölçek düzeyindeymiş gibi varsayarak toplam puan aldığını belirtmiştir. Bu varsayımda bulunmak, geliştiricinin ölçeğine ait psikometrik özellikleri belirleyebilmesi bakımından kaçınılmazdır.

Ölçme aracımızın ne kadar iyi olduğunu belirleyebilmek için böyle bir varsayımda bulunuyor ve matematiksel işlemler yapmaya başlıyoruz. Yaptıklarımızdan en masumu ise toplam puan almak. Zorunluluktan geçerlilik ve güvenilirlik de hesaplıyoruz ve bunları yapmak için de -miş gibi varsayıyoruz.

Ve biz varsaydıkça, işin ucunu kaçırıyoruz sanki. Elimizdeki ölçme sonuçları izin vermediği halde -zorunluluktan- bazı işlemleri yapabilmek adına istatistikten yüz buluyoruz. Lakin zaman geçtikçe astarını da istiyormuşuz gibi geliyor bana. t-testi, ANOVA, regresyon, faktör analizi… Yapısal eşitlik modellemesi derken; her yeni çıkan, her yeni duyduğumuz istatistiksel tekniği kendi araçlarımıza uygulamaya çalışıyoruz ve bu işin sonu yok.

Ne kadar ekmek, o kadar köfte sözü ne güzel söylenmiş. Elimizde ekmek yokken, 1-2 köfte alıp ağzımıza atıyoruz, tamam. Ama tüm mangalı sahiplenmeye çalışmak bana yanlış geliyor.

İşin doğrusu bu konuda kafam karışık…

Okuma yapmalı…

Kaynaklar

Baykul, Y. (2000). Eğitimde ve Psikolojide Ölçme: Klasik Test Teorisi ve Uygulaması. ÖSYM Yayınları: Ankara.

Crocker, L., Algina, J. (1986). Introduction to Classical & Modern Test Theory. Holt, Rinehart and Winston Inc: Orlando, Florida.

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Time limit is exhausted. Please reload CAPTCHA.