Eğitmenler ve İşe Alım Uzmanları için
Bilimsel Test ve Sınav Hazırlama Rehberi
TEST VE SINAV HAZIRLAMA REHBERİ

Aşağıdaki içerikler, bilimsel yöntemlerle test ve sınav hazırlama konusunda bilgilendirme amaçlı hazırlanmıştır.

Sorularınız için bizimle iletişime geçebilirsiniz:
E-posta: [email protected]
PBX: +90 212 318 80 99


Test Ve Alt Test Puanları Analizi Ve Geçerlik

Testin geçerliğinin tahmini için, test veya alt test puanlarının ilgili ölçüt ölçüleri ile korelasyonlarından yararlanılır. Bir test veya alt test puanı ve onunla ilgili, yani onun ölçütü niteliği gösteren ölçüt ölçüsü arasındaki korelasyon yüksek ise söz konusu test veya alt test puanının, bu durumda uyum geçerliği yüksek demektir. Test veya alt test puanı da, ölçüt ölçüsünün gösterdiği niteliği ölçebilmektedir. Test veya alt test puanı ve aynı niteliği gösteren ölçüt ölçüsü arasındaki korelasyon düşükse test veya alt test puanı, ölçüt ölçüsünün geçerli bir ölçü olması koşulu ile, istenilen niteliği iyi ölçmemektedir. Test veya alt test, bu korelasyonun düşüklüğü ölçüsünde yetersiz kalmaktadır.

Uygulanan testin geçerliğini tahmin ederken, değişkenlik analizi yönteminden de yararlanılabilinir. Cevaplayıcılar, değişik nitelikleri, daha doğrusu ilgili ölçüt ölçüleri bakımından gruplanabilir. Bundan sonra, test veya alt test puanlarındaki değişkenliğin ne kadarının, bu gruplar arası farklardan gelmiş olabileceği değişkenlik analizi ile saptanabilir. Böylece oluşturulan gruplar arası farklardan gelen değişkenliğinde toplam değişkenliğe oranı, yani onun toplam değişkenlik içindeki payı, bir geçerlik tahmini verebilir. (Yüzde olarak bu pay, matematiksel olarak, iki değişken arasındaki korelasyonun karesine eşdeğerdir). Değişkenlik analizi ile geçerlik tahmininde, birden fazla ölçüt ölçüsü de dikkate alınabilir; bu son durumda, gerekirse çok yönlü sınıflama analizinden (classification analysis) yararlanılabilir.

Hazırlanan bir test denendikten ve deneme sonuçları analiz edildikten sonra bu testin geliştirilmesi gerekip gerekmediği ve geliştirilecekse bu amaçla neler yapılabileceği ana çizgileriyle belirlenebilir. Örneğin, örneklem değerlerinden (istatistiklerden) yararlanarak standart sapmanın, ortalamaya oranı alınabilir. Bu oran test puanlarında yeterli sayılabilecek derecede bir değişkenlik olup olmadığını gösterir. Eğer bu oran, 0,20’nin çok altında ve sıfıra yakınsa, puanlarda yeterli sayılabilecek derecede değişkenlik yok demektir. Bu oran 0,20’nin çok üstünde ise kendi içlerinden bir evrenden gelemeyecek derecede farklılaşan bir kitle ile karşı karşıya bulunulmakta olabilir. Özellikle bu oranın beklenenden daha küçük olması önemli bir uyarıdır. Böyle bir durumla karşılaşıldığında, bunun nedenlerine inmeye çalışılır. Bu amaçla, aritmetik ortalamanın ilgili test veya alt testten alınabilecek en yüksek puana (birer puanlık sorulardan oluşan test veya alt testlerde toplam soru sayısına) oranı hesaplanabilir. Bu oranın 0,50’den çok uzaklarda, yani ya bire ya da sıfıra yakın olup olmadığına bakılır. Böyle bir durum varsa bu, değişik anlamlara gelebilir. Bu oranın bire yaklaşması, testteki soruların örneklemdeki kişiler için genellikle çok kolay geldiğini, başka bir deyişle soruların çok kolay olmaları yüzünden kişiler arasındaki farkları ortaya koyamadığını gösterir. Bu durum, bölmeleri olmayan bir metrelik çıta ile insanların boylarını “ölçüp” bunlardan hemen hemen hepsinin “uzun boylu” olduğunu söylemeye benzer. Bu oranın sıfıra yaklaşması ise testteki soruların örneklemdeki kişiler için genellikle çok zor geldiğini, başka bir deyişle soruların, çok zor olmaları yüzünden kişiler arasındaki farkları ortaya koyamadığını gösterir. Bu son durum da, bölmeleri olmayan, iki metrelik bir çıta ile insanların boylarını ölçüp bunlardan hemen hemen hepsinin “kısa boylu” olduğunu söylemeye benzer. Yukarıdaki durumların ikisinde de boylar iyi ölçülememekte, yani boy farkları varsa bunlar, ölçülere yansıtılamamaktadır.

Yukarıda sözü edilen incelemelerde, puanlarda yeterli derecede bir değişkenlik görülse bile bu kadarı yeterli değildir. Bu değişkenliğin hangi kaynaklardan gelmekte olduğu da önemlidir. Bu değişkenliğin önemli bir bölümü ölçülmek istenen nitelikteki farklardan gelmiyorsa, değişkenliğin yeterli düzeyde olması bir işe yaramaz.

Test veya alt testlerin geçerlik tahminleri düşükse, puanlardaki değişkenliğin kişiler arasındaki, ölçülmek istenen nitelik farklarından gelmediği anlaşılır. Böyle bir durumda, değişkenliğe başka kaynaklar katkıda bulunmaktadır. Bir test, hem puanlara yeterli derecede değişkenlik yansıtabiliyor, hem de bu değişkenliği büyük ölçüde ölçülmek istenen nitelikteki farklara dayandırabiliyorsa iyi bir test olabilir.

Geçerlik tahminleri düşükse, madde düzeyinde bazı geliştirmelere girişilmesi gerekir. Böyle çalışmalarla maddelerin ayırıcı güçlerinin artırılması çalışır. Maddelerin ayırıcı güçleri artırılırsa, ileride görüleceği gibi, böyle maddelerden oluşan bir test veya alt testin geçerliği de yükselir. Geçerliğin yükselmesiyle, puanlardaki değişkenliğin, ölçülmek istenen özellik farklarından gelen bölümü artar. Yani bu farklar, daha çok ölçülmek istenen nitelik farklarından gelir.

Bir test, denenen biçimiyle yeterli güvenirlik ve geçerlikte bulunsa bile böyle bir test üzerindeki çalışmalar bitmez. Hazırlanan testin, daha az sayıda soru ile de aynı nitelikleri gösterip göstermeyeceğine bakılır. Çünkü olanaklar ölçüsünde az sayıda madde (soru) ile istenen güvenirlik ve geçerlikte ölçüler (puanlar) veren test en iyi testtir (Özçelik, Ölçme ve Değerlendirme, 2016, s. 200-203).

Test Ve Alt Test Puanları Analizi Ve Geçerlik

QuizCV online test ve sınavlar hazırlayabileceğiniz, sınavları dağıtabileceğiniz ve detaylı sonuç raporlarına ulaşabileceğiniz online sınav sistemidir. Online test platformunun sunduğu kullanımı kolay ve güçlü sınav hazırlama editörü sayesinde kolayca sınav ve testler hazırlayabilirsiniz.
PBX: +90 212 318 8099
İstanbul, Türkiye