- İki türlüdür
- Doğrudan (başka bir özelliğe ihtiyaç duymadan): masa boyu cetvelle, öğrencilerin boyu, Ahmet’in kardeş sayısı
- Dolaylı (başka bir özelliğe ihtiyaç duyarak):
- Göstergeyle: zeka tutum ile, sıcaklık termometre ile, dersin geçme notu,
- Türetilmiş: vize*0.3*2+final*0,4
- Ölçme
- Niceliği betimleme
- Nesnellik
- Ölçme süreci
- Gözlem > ölçüm > sembolle ifade
- Ölçme nitelikleri
- Güvenirlik
- Hatalardan arınık. Gerçek puanlara yakın.
- Duyarlı, tutarlı, kararlı
- Sistematik hatalar güvenirliği kestirilemez yapar.
- Ne derece duyarlı
- Her uygulamada yakın değerler çıkar
- Gerçeği yansıtır
- Zamana karşı dirençlidir.
- Tesadüfî hata güvenirliği düşürür
- Etkilendiği faktörler
- Ölçme aracı
- Ölçmenin uygulandığı kişi
- Ölçmeyi yapan kişi
- Ölçme koşulları
- Soru sayısı
- Soruların ayırt edici gücü
- Standart hata
- Geçerlik katsayısı
- Seçenek sayısı artarsa güvenirlik artar.
- Geçerlilik
- Amaca hizmet etmesi. Ölçmek istenen değişkeni ölçüp ölçmediği
- Hatasızdır
- Güvenirlik geçerlik için ön şarttır.
- Kullanışlık
- Uygulanabilirlik. Maliyet, süre, beceri uygun mu?
- Güvenirlik
- Ölçüm: Ahmet Matematik’ten 5 puan aldı. [5 puan]
- Ölçme hatası:
- Gerçek değer ile ölçme sonucu bulunan değer arasındaki fark
- Hata miktarının ölçme işlemindeki birimin yarısıolduğu varsayılır.
- Gözlenen puan = gerçek puan + hata
- Ölçme kuralı: ne kadar şeye ne kadar puan verilecek
- Ölçüt
- Değerlendirme dayanağıdır.
- Hangi puanı alanlar başarılı sayılacak.
- Sıfır:
- Doğal sıfır
- Gerçek yokluk
- Tanımlanmış sıfır
- Fizikten sıfır almak, oda sıcaklığı 23 derece…
- Doğal sıfır
- Birim:
- Birim küçültülerek hata miktarı düşürülebilir.
- Adet, kilo, km, ton, saat, lira
- Doğal birim, tanımlanmış birim.
- Ölçme hata türleri
- Sabit hatalar
- Ölçümden ölçüme değişmez. [Terazinin 100 gr fazla ölçmesi.]
- Geçerliliği doğrudan düşürür
- Güvenirliği doğrudan etkilemez
- Sistematik hatalar.
- Terazinin 1 kg da 100 gr, 2 kg da 200 gr, 3 kg da 300 gr fazla ölçmesi,
- Yazısı güzel olana, dilbilgisine uyana ekstra puan.
- Geçerliliği doğrudan düşürür
- Güvenirliği doğrudan etkilemez
- Tesadüfî hatalar
- Geçerliliği doğrudan etkilemez
- Güvenirliği doğrudan düşürür.
- Sabit hatalar
- Ölçek dört çeşittir
- Sınıflama ölçeği
- Nesneleri sınıf, tip veya kategorilere göre ayırmadır.
- Benzerlik ya da ayrılık Kız-erkek, kısa-uzun, koltuk numarası verme
- Simetriklik: A=B ise B=A
- Geçişlilik: A=B, B=C ise A=C
- Geçti, kaldı, takdir, teşekkür.
- Sıralama ölçeği
- Sahip olunan özellik miktarına göre
- Futbolda puan cetveli
- Geçişlik: A>B, B>C ise A>C
- Asimetriklik: A>B ise B>A değildir.
- Eşit aralıklı ölçek
- Hava 18 derece,
- Sınavdan 60 almak
- Tarih
- Başlangıç noktası izafi sıfırdır.
- Bir ölçüm diğerinin iki katı olamaz.
- Eşit Oranlı ölçek
- Bir noktaya göre oranlı sıralanış.
- Birimler arasındaki miktar birbirine eşit.
- Her türlü istatistikî işlem yapılabilir. Sıralama, sınıflama, eşit aralıklı birimleme yapılabilir.
- 45 cm’lik nesne, 15 cm’lik nesnenin üç katıdır.
- En çok bilgi vermeden en az bilgi vermeye göre sıralama: Sınıflama > sıralama > eşit aralıklı > eşit oranlı
- Sınıflama ölçeği
- Ölçek türüne göre yapılan istatistikî işlemler
- Mod
- Tepe değer
- Medyan
- Ortanca. Büyüklük sırasında en ortadaki eleman.
- Ranj
- En düşük ile en yüksek arasındaki fark
- Standart sapma
- Ölçülen değerin ortalamadan sapması
- Mod
- Değerlendirme
- Ölçüm ve ölçüte dayanır
- Ölçme > ölçüm > ölçüt ile karşılaştırma > karara varma
- Öznel
- Yorumlama
- Sperman Brown
- Geçerlik ve güvenirlik için soru sayısı artırıldığında kullanışlık azalır. Böyle durumlarda Sperman Brown eşitlikleri kullanılır.
- Değerlendirme yaklaşımları
- Psikometrik yaklaşım
- Objektif, sonuç ağırlıklı
- İzlenimci yaklaşım
- Sübjektif, süreç ağırlıklı, üst düzey beceriler
- Uzlaştırıcı (Eklektik) yaklaşım
- Karma
- Psikometrik yaklaşım
- Ölçme ve değerlendirme yaklaşımları
- Çağdaş yaklaşımda kısa cevaplı cevaplandırma ve yazılı yoklama yoktur.
- Yazılı yoklamalarda da cevap kâğıdını baştan sona okuyup izlenime göre puan verme yoktur
- Geleneksel (klasik) yaklaşımlar:
- Ürün odaklı, sadece öğretmen aktif, geri bildirim nottur, öğrenciler rekabet içindedir, tanılayıcı, yargılayıcı
- Mutlak değerlendirme
- Teşekkür, takdir belgelerini ölçüt alma.
- Öğrencinin geçmesi için belirli bir notu ölçüt almak.
- Yasalara göre karar verme
- Bağıl değerlendirme
- Ölçüt, diğer bireylerden etkilenir. (Çan eğrisi)
- Bireyin başarısı grubun başarısıyla ilişkilidir.
- Grup değerlendirmesi / Bireysel öğrenme
- Tanımaya dönük (Diagonistik) [Seviye tespit sınavı] / İzlemeye dönük (formatif) [Vize] / düzey belirlemeye yönelik (Summatif) [Final]
- Tamamlayıcı (süreç temelli) değerlendirme yaklaşımları:
- Öğretmen ve öğrenci birlikte aktiftir, süreç ve ürün birlikte değerlendirilir, çok boyutlu ve değişik ürün ve performans örnekleri vardır, geliştirici ve yenileyicidir
- Performans değerlendirme
- Dünya, ay ve güneş hareketlerini gösteren bir modül hazırlama.
- Puanlaması zordur
- Portfolyo değerlendirme
- Puanlaması zordur
- Sonuçtan çok süreç önemlidir.
- Sınırlılıkları
- Rekabeti kaldırır
- Tüm öğrencilere aynı standartta hedefler konamaz
- Puanlama güvenirliği düşüktür.
- Öğrenciler ürünleri başkalarına hazırlatabilir.
- Soruları
- Öğrenci hangi yolu izledi?
- Yeteneklerini kullanabildi mi?
- İletişim becerilerini kullanabildi mi?
- Güçlüklere karşı ne yaptı?
- Öz ve akran değerlendirme
- Rubrik
- Belirli bir ölçüte bağlı kalarak ne düzeyde öğrenildiğini belirleyen not verme ve derecelendirme anahtarı.
- Değerlendirmeyi sadece öğretmen yapmaz.
- Yazılı yoklamaların puanlanmasında da kullanılır.
- Holistik
- Öğrenme sonucunu değerlendirme
- Analitik
- Öğrenme performansının her aşamasını değerlendirme
- Proje,
- Ödev
- Çeteleme (Kontrol Listesi)
- Dereceleme ölçekleri
- Pekiyi, iyi, orta, zayıf
- Mükemmellik farkını ortaya koyar
- Görüş ve gözlem formları
- Otantik değerlendirme
- Öğrencinin bilgi ve becerisini gerçek yaşam koşulları ile bağdaştırabilmesi ve yaşamsal sorunlarını çözme becerisine dayanır.
- Güvenirlik Katsayısı
- 0 ile 1 arasında değer alır
- 0,9+ mükemmel test. Güvenilirdir.
- 0,5- kötü test
- İki ölçüm arasındaki korelasyon ile hesaplanır.
- Güvenirlik katsayısının yüksek olması testin kesin olarak geçerli olduğu anlamına gelmez.
- n=[ri(1-rm)]/[rm(1-ri)]
- Güvenirliği 0,7 olan 10 soruluk testin güvenirliğini 0,85 yapmak için: n=[0,85(1-0,7)]/[0,7(1-0,85)]=2,42 olur. 2,42*soru sayısı=2,42*10=24,2 yani soru sayısı 25 olmalıdır.
- Güvenirliği 0,75 olan teste karışan hata miktarı 0,25’tir.
- 0 ile 1 arasında değer alır
- Test-Tekrar TestYöntemi (Kararlılık Katsayısı)
- Ölçme aracının hem hatalardan arınıklığı hem de zamana karşı direnci hesaplanır.
- Bir test aynı gruba farklı zamanlarda uygulanır
- Tutarlılık için 1-3 hafta, kararlılık için 3-6 hafta.
- Kararlılık katsayısını hesaplar.
- Paralel Testler Yöntemi (Tutarlılık Ve Eşdeğerlilik)
- Testi YarılamaYöntemi (İç Tutarlılık Katsayısı)
- Tek uygulamalıdır
- KR-20, KR-21 (İç tutarlılık)
- Her madde ayrı ayrı ele alınır, her bir madde aynı değişkeni ölçtüğüne dayanır, testin homojen ve tutarlı olduğu durumlarda kullanılır
- Tek uygulama
- Doğru cevaplanan maddelere 1 puan, yanlış ya da boşlar değerlendirilmiyor.
- Maddelerin birbiri ile tutarlılığı
- Doğru-yanlış (1-0) var ve güçlük indeksi biliniyorsa KR-20, doğru-yanlış (1-0) var güçlük indeksi bilinmiyorsa KR-21 kullanılır.
- Test heterojen ise KR-20, homojen ise KR-21 kullanılır.
- Güvenirlik belirlenmek isteniyorsa KR-20 kullanılır.
- Cronbach Alpha (İç tutarlılık)
- Dereceleme niteliğindekilerde kullanılır. 1-0 olmuyor fakat derecelendirme yapılabiliyorsa.
- Tutum ölçekleri, ilgi ve kişilik envanterleri, psikomotor beceri testlerinde kullanılır.
- 1, 2, 3, 4, 5 gibi çoklu puanlanan test maddelerinde kullanılır.
- Tek uygulama
- Maddelerin birbiri ile tutarlılığı
- Eşdeğer yarılar
- Testin iki parçası üzerinden
- Geçerlik
- Güvenilir olmadan geçerli olamaz.
- Geçerliğin artması güvenirliğin de artmasıdır.
- Bir ölçme aracının en önemli özelliği geçerliktir
- Güvenirliği 0,64 olan testin geçerliği en fazla kök(0,64)=0,8’dir.
- Belirtke tablosu kullanılması geçerliği artırır.
- Soru sayısının artması geçerliği artırır.
- Güvenilir olmadan geçerli olamaz.
- Geçerlik türleri
- Kapsam geçerliği
- Bir testin ölçülmek istenen davranışları ne derece kapsadığıdır. Yüksek olması konu alanının iyi bir şekilde örneklendiğini gösterir.
- Bir final sınavında hocanın öncelikli olarak kapsam geçerliğine dikkat etmesi gerekir.
- Mantıksal (rasyonel) yaklaşım
- Belirtke tablosuna uygunluk
- İstatistiksel yaklaşım
- Geçerliği yüksek olan ile hazırlanan testin korelâsyonu bakılır
- Ölçüt geçerliği
- Bilinenden hareketle bilinmeyen hakkında fikir yürütme
- Yordama geçerliği
- Önce sınav, sonra süreç ve karar.
- Öğrencinin eğitim programı sonundaki başarısı ile seçme amacı ile yapılan ölçme arasında korelâsyonun hesaplanması.
- Bir üst düzeyde başarılı öğrencilerin seçilmesi
- Ölçüt güvenilir ile yordama geçerliği artar
- Uygunluk (eş zaman) geçerliği
- Önce süreç, sonra puan ve karar
- Yapı geçerliği
- Doğrudan gözlemlenemeyen fakat davranışlarla ilişkilendirilenlerle ilgili
- Yaratıcılık, yetenek, zeka gibi teorik niteliğin ölçülmesinde vardır.
- Görünüş geçerliği
- Ölçme aracının değişkeni ne derece ölçülebilir göründüğü.
- Kapsam geçerliği
- Madde istatistikleri
- Madde istatistiklerinde ilk yapılması gereken işlem merkezi eğilim ölçülerinin bulunmasıdır.
- Madde güçlük indeksi Pj
- 0 zor, 1.00 kolay
- Zor, 0,00-0,39
- İdeali 0,29 – 0.50
- Orta, 0,40-0,60
- Kolay, 0,61-1,00 çok kolay
- Pj=doğru cevaplayan sayısı/toplam kişi
- Madde ayırıcılık gücü indeksi rjx
- -1.00 ile +1.00 arası değer alır.
- 0.20 – 0.39 kullanılabilir,
- 0.40+ ayırt edicilik gücü yüksek.
- Rjx=(üst grup doğru sayısı-alt grup doğru sayısı)/üst veya alt grup kişi sayısı
- Madde varyansı Sj2
- 0 ise tüm öğrenciler o soruyu doğru veya yanlış cevaplamıştır.
- İdeali 0,25’dir
Merkezi Değişim Ölçüleri (Dağılım-Yayılma Ölçüleri)
- Madde varyansı
- (Standart sapma)nın karesi=madde güçlüğü*(1-madde güçlüğü)
- 0,0 ile 0,25 arası değer alır.
- Standart sapma
- Kök(madde varyansı)
- Standart sapmanın büyük olması test güvenirliği ve ayırt edicilikbulunduğu anlamına gelir.
- Standart sapma ile standart hata doğru orantılıdır.
- Varyansın veya standart sapmanın az olması öğrenci puanlarını yakın olması ve ölçmenin iyi ayırma yapamadığını gösterir.
- Aritmetik ortalama – standart sapma farkı büyükse heterojen yapı (grup başarı düşük), küçükse homojen yapı vardır.
- Ranj büyüdükçe standart sapma da büyür.
- Doğru sayısı ile yanlış sayısı eşit ise standart sapma 0,5 olur.
- Standart sapma 0,5 ise orta güçlüktedir.
- 0,0 ile 0,5 arası değer alır.
- Bağıl değişkenlik katsayısı(V)= (standart sapma*100)/Aritmetik ortalama
- -19 homojen dağılım. (Sivri)
- 20-25 normal dağılım. (Normal)
- 26+ heterojen dağılım.(Basık)
- Madde güvenirlik indeksi
- Ayırıcılık indeksi * standart sapma
- -0,5 ile +0,5 arasında değerler alabilir.
- Korelâsyon
- İki dersin puanları arasında 0,85 gibi bir korelâsyon varsa bu dersler arasında sıkı bir ilişki var demektir.
- Standart hata
- Her bir öğrenciye düşen yaklaşık tesadüfî hata miktarı
- Sh=ÖShKök(1-r). Standart sapması 4 güvenirlik katsayısı 0,75 olan testin standart hatası Sh=4Kök(1-0,75)=2
- Düzeltilmiş puan
- Şans başarısından arındırılmış puan
- Değişim alanı
- Herhangi bir değişkenin alabileceği tüm değerlerin bulunduğu aralık
- Frekans dağılımı
- Bir sınıfın not dağılımına dair yorumlamaların yapıldığı dağılım
- Çeyrek sapma
- Dağılımın belirgin bir şekilde sola ya da sağa eğilimli olması hâlinde kullanılır
- Merkezi eğilim ölçüsü olarak medyan dikkate alınırsa çeyrek sapma kullanılır.
- İç tutarlılık katsayısı
- Test sorularının birbiri ile uyumlu olması.
- Her bir sorunun eşit ağırlığa sahip olması
- Normal dağılımeğrisi
- -1 & +1 %68,
- -2 & +2 % 95,
- -3 & +3 % 99
- Z puanı: (Öğrencinin Puanı - Aritmetik Ortalama) / Standart Sapma
- T puanı: 50+Z*10
- Korelâsyon
- Pozitif, negatif, ilişkisizlik
- Ölçme Araçları
- Çeldirici
- Çeldiricilerin güçlendirilmesi soruyu zorlaştırır.
- Çeldirici
ankakedisi KPSS’cilere başarılar diler.
