IQ testlerinin yüzyıllık tarihi, bilim, eğitim, askeri gereklilikler ve etik tartışmalarla şekillendi. Bu yazıda, Binet’in ilk testinden günümüzün adaptif bilgisayar testlerine uzanan yolu inceliyoruz.
1905: Binet-Simon Ölçeği
Fransız hükümeti, okula yeni başlayan çocuklar arasında öğrenme güçlüğü çekenleri belirlemek istedi. Psikolog Alfred Binet ve öğrencisi Theodore Simon, 30 sorudan oluşan bir değerlendirme ölçeği geliştirdi. Test, bellek, dikkat, problem çözme gibi farklı zihinsel görevleri içeriyordu.
1916: Stanford-Binet Revizyonu
Amerikalı psikolog Lewis Terman, Binet-Simon’ı Amerikan nüfusuna uyarladı ve “Stanford-Binet Zeka Ölçeği” adıyla yayımladı. Bu revizyon, IQ skorunu ilk kez geniş kullanıma soktu ve eğitim politikalarını derinden etkiledi.
1917: Army Alpha ve Beta Testleri
Birinci Dünya Savaşı sırasında ABD ordusu, milyonlarca askeri hızla değerlendirmek için grup testleri geliştirdi. Army Alpha (okuryazarlar için) ve Army Beta (okuryazar olmayanlar için) testleri, IQ ölçümünün kitlesel kullanımının başlangıcı oldu.
1939: Wechsler Ölçekleri
David Wechsler, tek bir IQ skoru yerine farklı bilişsel alanların ayrı ayrı ölçüldüğü Wechsler-Bellevue Zeka Ölçeği’ni tanıttı. Bu yaklaşım, günümüz WAIS (yetişkin) ve WISC (çocuk) testlerinin temelini oluşturur.
1960-80: Raven Matrisleri
John Raven, kültürden bağımsız (culture-fair) bir test tasarladı: Progressive Matrices. Görsel desenler üzerinden akıcı zekayı ölçen bu test, dil bariyeri olmadan uygulanabilir ve hâlâ araştırmalarda altın standart sayılır.
1980-2000: IRT ve Madde Tepki Kuramı
Klasik test teorisinin sınırlamaları, Madde Tepki Kuramı’nın (Item Response Theory – IRT) yükselişine yol açtı. IRT, her soruyu ayrı ayrı zorluğu, ayırt ediciliği ve tahmin parametreleri üzerinden modelleyerek daha hassas ölçüm sağlar.
2000’ler: Bilgisayar Destekli Adaptif Testler (CAT)
IRT, bilgisayar kullanımıyla birleşince “adaptif test” doğdu. Verdiğiniz her yanıta göre sistem bir sonraki sorunun zorluğunu ayarlar. Böylece 20 soruda bile geleneksel 60 soruluk testlere yakın doğruluk elde edilir.
Günümüz ve IQTestium
IQTestium, 2PL IRT modeli ve adaptif soru seçimi kullanarak modern psikometri prensiplerini uygular. Sonuçlar, güven aralığı (SEM) ile birlikte sunulur; yani tek bir sayı değil, istatistiksel olarak gerçek değerin hangi aralıkta yattığı gösterilir.