Eğitimde Ölçme ve Değerlendirme

  • İki türlüdür
    • Doğrudan (başka bir özelliğe ihtiyaç duymadan): masa boyu cetvelle, öğrencilerin boyu, Ahmet’in kardeş sayısı
    • Dolaylı (başka bir özelliğe ihtiyaç duyarak):
      • Göstergeyle: zeka tutum ile, sıcaklık termometre ile, dersin geçme notu,
      • Türetilmiş: vize*0.3*2+final*0,4
  • Ölçme
    • Niceliği betimleme
    • Nesnellik
    • Ölçme süreci
      • Gözlem > ölçüm > sembolle ifade
    • Ölçme nitelikleri
      • Güvenirlik
        • Hatalardan arınık. Gerçek puanlara yakın.
        • Duyarlı, tutarlı, kararlı
        • Sistematik hatalar güvenirliği kestirilemez yapar.
        • Ne derece duyarlı
        • Her uygulamada yakın değerler çıkar
        • Gerçeği yansıtır
        • Zamana karşı dirençlidir.
        • Tesadüfî hata güvenirliği düşürür
        • Etkilendiği faktörler
          • Ölçme aracı
          • Ölçmenin uygulandığı kişi
          • Ölçmeyi yapan kişi
          • Ölçme koşulları
          • Soru sayısı
          • Soruların ayırt edici gücü
          • Standart hata
          • Geçerlik katsayısı
          • Seçenek sayısı artarsa güvenirlik artar.
      • Geçerlilik
        • Amaca hizmet etmesi. Ölçmek istenen değişkeni ölçüp ölçmediği
        • Hatasızdır
        • Güvenirlik geçerlik için ön şarttır.
      • Kullanışlık
        • Uygulanabilirlik. Maliyet, süre, beceri uygun mu?
  • Ölçüm: Ahmet Matematik’ten 5 puan aldı. [5 puan]
  • Ölçme hatası:
    • Gerçek değer ile ölçme sonucu bulunan değer arasındaki fark
    • Hata miktarının ölçme işlemindeki birimin yarısıolduğu varsayılır.
      • Gözlenen puan = gerçek puan + hata
  • Ölçme kuralı: ne kadar şeye ne kadar puan verilecek
  • Ölçüt
    • Değerlendirme dayanağıdır.
    • Hangi puanı alanlar başarılı sayılacak.
  • Sıfır:
    • Doğal sıfır
      • Gerçek yokluk
    • Tanımlanmış sıfır
      • Fizikten sıfır almak, oda sıcaklığı 23 derece…
  • Birim:
    • Birim küçültülerek hata miktarı düşürülebilir.
    • Adet, kilo, km, ton, saat, lira
    • Doğal birim, tanımlanmış birim.
  • Ölçme hata türleri
    • Sabit hatalar
      • Ölçümden ölçüme değişmez. [Terazinin 100 gr fazla ölçmesi.]
      • Geçerliliği doğrudan düşürür
      • Güvenirliği doğrudan etkilemez
    • Sistematik hatalar.
      • Terazinin 1 kg da 100 gr, 2 kg da 200 gr, 3 kg da 300 gr fazla ölçmesi,
      • Yazısı güzel olana, dilbilgisine uyana ekstra puan.
      • Geçerliliği doğrudan düşürür
      • Güvenirliği doğrudan etkilemez
    • Tesadüfî hatalar
      • Geçerliliği doğrudan etkilemez
      • Güvenirliği doğrudan düşürür.
  • Ölçek dört çeşittir
    • Sınıflama ölçeği
      • Nesneleri sınıf, tip veya kategorilere göre ayırmadır.
      • Benzerlik ya da ayrılık Kız-erkek, kısa-uzun, koltuk numarası verme
      • Simetriklik: A=B ise B=A
      • Geçişlilik: A=B, B=C ise A=C
      • Geçti, kaldı, takdir, teşekkür.
    • Sıralama ölçeği
      • Sahip olunan özellik miktarına göre
      • Futbolda puan cetveli
      • Geçişlik: A>B, B>C ise A>C
      • Asimetriklik: A>B ise B>A değildir.
    • Eşit aralıklı ölçek
      • Hava 18 derece,
      • Sınavdan 60 almak
      • Tarih
      • Başlangıç noktası izafi sıfırdır.
      • Bir ölçüm diğerinin iki katı olamaz.
    • Eşit Oranlı ölçek
      • Bir noktaya göre oranlı sıralanış.
      • Birimler arasındaki miktar birbirine eşit.
      • Her türlü istatistikî işlem yapılabilir. Sıralama, sınıflama, eşit aralıklı birimleme yapılabilir.
      • 45 cm’lik nesne, 15 cm’lik nesnenin üç katıdır.
    • En çok bilgi vermeden en az bilgi vermeye göre sıralama: Sınıflama > sıralama > eşit aralıklı > eşit oranlı
  • Ölçek türüne göre yapılan istatistikî işlemler
    • Mod
      • Tepe değer
    • Medyan
      • Ortanca. Büyüklük sırasında en ortadaki eleman.
    • Ranj
      • En düşük ile en yüksek arasındaki fark
    • Standart sapma
      • Ölçülen değerin ortalamadan sapması
  • Değerlendirme
    • Ölçüm ve ölçüte dayanır
    • Ölçme > ölçüm > ölçüt ile karşılaştırma > karara varma
    • Öznel
    • Yorumlama
    • Sperman Brown
      • Geçerlik ve güvenirlik için soru sayısı artırıldığında kullanışlık azalır. Böyle durumlarda Sperman Brown eşitlikleri kullanılır.
  • Değerlendirme yaklaşımları
    • Psikometrik yaklaşım
      • Objektif, sonuç ağırlıklı
    • İzlenimci yaklaşım
      • Sübjektif, süreç ağırlıklı, üst düzey beceriler
    • Uzlaştırıcı (Eklektik) yaklaşım
      • Karma
  • Ölçme ve değerlendirme yaklaşımları
    • Çağdaş yaklaşımda kısa cevaplı cevaplandırma ve yazılı yoklama yoktur.
    • Yazılı yoklamalarda da cevap kâğıdını baştan sona okuyup izlenime göre puan verme yoktur
    • Geleneksel (klasik) yaklaşımlar:
      • Ürün odaklı, sadece öğretmen aktif, geri bildirim nottur, öğrenciler rekabet içindedir, tanılayıcı, yargılayıcı
      • Mutlak değerlendirme
        • Teşekkür, takdir belgelerini ölçüt alma.
        • Öğrencinin geçmesi için belirli bir notu ölçüt almak.
        • Yasalara göre karar verme
      • Bağıl değerlendirme
        • Ölçüt, diğer bireylerden etkilenir. (Çan eğrisi)
        • Bireyin başarısı grubun başarısıyla ilişkilidir.
      • Grup değerlendirmesi / Bireysel öğrenme
      • Tanımaya dönük (Diagonistik) [Seviye tespit sınavı] / İzlemeye dönük (formatif) [Vize] / düzey belirlemeye yönelik (Summatif) [Final]
    • Tamamlayıcı (süreç temelli) değerlendirme yaklaşımları:
      • Öğretmen ve öğrenci birlikte aktiftir, süreç ve ürün birlikte değerlendirilir, çok boyutlu ve değişik ürün ve performans örnekleri vardır, geliştirici ve yenileyicidir
      • Performans değerlendirme
        • Dünya, ay ve güneş hareketlerini gösteren bir modül hazırlama.
        • Puanlaması zordur
      • Portfolyo değerlendirme
        • Puanlaması zordur
        • Sonuçtan çok süreç önemlidir.
        • Sınırlılıkları
          • Rekabeti kaldırır
          • Tüm öğrencilere aynı standartta hedefler konamaz
          • Puanlama güvenirliği düşüktür.
          • Öğrenciler ürünleri başkalarına hazırlatabilir.
        • Soruları
          • Öğrenci hangi yolu izledi?
          • Yeteneklerini kullanabildi mi?
          • İletişim becerilerini kullanabildi mi?
          • Güçlüklere karşı ne yaptı?
      • Öz ve akran değerlendirme
      • Rubrik
        • Belirli bir ölçüte bağlı kalarak ne düzeyde öğrenildiğini belirleyen not verme ve derecelendirme anahtarı.
        • Değerlendirmeyi sadece öğretmen yapmaz.
        • Yazılı yoklamaların puanlanmasında da kullanılır.
        • Holistik
          • Öğrenme sonucunu değerlendirme
        • Analitik
          • Öğrenme performansının her aşamasını değerlendirme
      • Proje,
      • Ödev
      • Çeteleme (Kontrol Listesi)
      • Dereceleme ölçekleri
        • Pekiyi, iyi, orta, zayıf
        • Mükemmellik farkını ortaya koyar
      • Görüş ve gözlem formları
      • Otantik değerlendirme
        • Öğrencinin bilgi ve becerisini gerçek yaşam koşulları ile bağdaştırabilmesi ve yaşamsal sorunlarını çözme becerisine dayanır.
  • Güvenirlik Katsayısı
    • 0 ile 1 arasında değer alır
      • 0,9+ mükemmel test. Güvenilirdir.
      • 0,5- kötü test
    • İki ölçüm arasındaki korelasyon ile hesaplanır.
    • Güvenirlik katsayısının yüksek olması testin kesin olarak geçerli olduğu anlamına gelmez.
    • n=[ri(1-rm)]/[rm(1-ri)]
    • Güvenirliği 0,7 olan 10 soruluk testin güvenirliğini 0,85 yapmak için: n=[0,85(1-0,7)]/[0,7(1-0,85)]=2,42 olur. 2,42*soru sayısı=2,42*10=24,2 yani soru sayısı 25 olmalıdır.
    • Güvenirliği 0,75 olan teste karışan hata miktarı 0,25’tir.
  • Test-Tekrar TestYöntemi (Kararlılık Katsayısı)
    • Ölçme aracının hem hatalardan arınıklığı hem de zamana karşı direnci hesaplanır.
    • Bir test aynı gruba farklı zamanlarda uygulanır
      • Tutarlılık için 1-3 hafta, kararlılık için 3-6 hafta.
    • Kararlılık katsayısını hesaplar.
  • Paralel Testler Yöntemi (Tutarlılık Ve Eşdeğerlilik)
  • Testi YarılamaYöntemi (İç Tutarlılık Katsayısı)
    • Tek uygulamalıdır
  • KR-20, KR-21 (İç tutarlılık)
    • Her madde ayrı ayrı ele alınır, her bir madde aynı değişkeni ölçtüğüne dayanır, testin homojen ve tutarlı olduğu durumlarda kullanılır
    • Tek uygulama
    • Doğru cevaplanan maddelere 1 puan, yanlış ya da boşlar değerlendirilmiyor.
    • Maddelerin birbiri ile tutarlılığı
    • Doğru-yanlış (1-0) var ve güçlük indeksi biliniyorsa KR-20, doğru-yanlış (1-0) var güçlük indeksi bilinmiyorsa KR-21 kullanılır.
    • Test heterojen ise KR-20, homojen ise KR-21 kullanılır.
    • Güvenirlik belirlenmek isteniyorsa KR-20 kullanılır.
  • Cronbach Alpha (İç tutarlılık)
    • Dereceleme niteliğindekilerde kullanılır. 1-0 olmuyor fakat derecelendirme yapılabiliyorsa.
    • Tutum ölçekleri, ilgi ve kişilik envanterleri, psikomotor beceri testlerinde kullanılır.
    • 1, 2, 3, 4, 5 gibi çoklu puanlanan test maddelerinde kullanılır.
    • Tek uygulama
    • Maddelerin birbiri ile tutarlılığı
  • Eşdeğer yarılar
    • Testin iki parçası üzerinden
  • Geçerlik
    • Güvenilir olmadan geçerli olamaz.
      • Geçerliğin artması güvenirliğin de artmasıdır.
    • Bir ölçme aracının en önemli özelliği geçerliktir
    • Güvenirliği 0,64 olan testin geçerliği en fazla kök(0,64)=0,8’dir.
    • Belirtke tablosu kullanılması geçerliği artırır.
    • Soru sayısının artması geçerliği artırır.
  • Geçerlik türleri
    • Kapsam geçerliği
      • Bir testin ölçülmek istenen davranışları ne derece kapsadığıdır. Yüksek olması konu alanının iyi bir şekilde örneklendiğini gösterir.
      • Bir final sınavında hocanın öncelikli olarak kapsam geçerliğine dikkat etmesi gerekir.
      • Mantıksal (rasyonel) yaklaşım
        • Belirtke tablosuna uygunluk
      • İstatistiksel yaklaşım
        • Geçerliği yüksek olan ile hazırlanan testin korelâsyonu bakılır
    • Ölçüt geçerliği
      • Bilinenden hareketle bilinmeyen hakkında fikir yürütme
      • Yordama geçerliği
        • Önce sınav, sonra süreç ve karar.
        • Öğrencinin eğitim programı sonundaki başarısı ile seçme amacı ile yapılan ölçme arasında korelâsyonun hesaplanması.
        • Bir üst düzeyde başarılı öğrencilerin seçilmesi
        • Ölçüt güvenilir ile yordama geçerliği artar
    • Uygunluk (eş zaman) geçerliği
      • Önce süreç, sonra puan ve karar
    • Yapı geçerliği
      • Doğrudan gözlemlenemeyen fakat davranışlarla ilişkilendirilenlerle ilgili
      • Yaratıcılık, yetenek, zeka gibi teorik niteliğin ölçülmesinde vardır.
    • Görünüş geçerliği
      • Ölçme aracının değişkeni ne derece ölçülebilir göründüğü.
  • Madde istatistikleri
    • Madde istatistiklerinde ilk yapılması gereken işlem merkezi eğilim ölçülerinin bulunmasıdır.
    • Madde güçlük indeksi Pj
      • 0 zor, 1.00 kolay
      • Zor, 0,00-0,39
      • İdeali 0,29 – 0.50
      • Orta, 0,40-0,60
      • Kolay, 0,61-1,00 çok kolay
      • Pj=doğru cevaplayan sayısı/toplam kişi
    • Madde ayırıcılık gücü indeksi rjx
      • -1.00 ile +1.00 arası değer alır.
      • 0.20 – 0.39 kullanılabilir,
      • 0.40+ ayırt edicilik gücü yüksek.
      • Rjx=(üst grup doğru sayısı-alt grup doğru sayısı)/üst veya alt grup kişi sayısı
    • Madde varyansı Sj2
      • 0 ise tüm öğrenciler o soruyu doğru veya yanlış cevaplamıştır.
      • İdeali 0,25’dir

Merkezi Değişim Ölçüleri (Dağılım-Yayılma Ölçüleri)

  • Madde varyansı
    • (Standart sapma)nın karesi=madde güçlüğü*(1-madde güçlüğü)
    • 0,0 ile  0,25 arası değer alır.
  • Standart sapma
    • Kök(madde varyansı)
    • Standart sapmanın büyük olması test güvenirliği ve ayırt edicilikbulunduğu anlamına gelir.
      • Standart sapma ile standart hata doğru orantılıdır.
    • Varyansın veya standart sapmanın az olması öğrenci puanlarını yakın olması ve ölçmenin iyi ayırma yapamadığını gösterir.
    • Aritmetik ortalama – standart sapma farkı büyükse heterojen yapı (grup başarı düşük), küçükse homojen yapı vardır.
    • Ranj büyüdükçe standart sapma da büyür.
    • Doğru sayısı ile yanlış sayısı eşit ise standart sapma 0,5 olur.
      • Standart sapma 0,5 ise orta güçlüktedir.
    • 0,0 ile 0,5 arası değer alır.
  • Bağıl değişkenlik katsayısı(V)= (standart sapma*100)/Aritmetik ortalama
    • -19 homojen dağılım. (Sivri)
    • 20-25 normal dağılım. (Normal)
    • 26+ heterojen dağılım.(Basık)
  • Madde güvenirlik indeksi
    • Ayırıcılık indeksi * standart sapma
    • -0,5 ile +0,5 arasında değerler alabilir.
  • Korelâsyon
    • İki dersin puanları arasında 0,85 gibi bir korelâsyon varsa bu dersler arasında sıkı bir ilişki var demektir.
  • Standart hata
    • Her bir öğrenciye düşen yaklaşık tesadüfî hata miktarı
    • Sh=ÖShKök(1-r). Standart sapması 4 güvenirlik katsayısı 0,75 olan testin standart hatası Sh=4Kök(1-0,75)=2
  • Düzeltilmiş puan
    • Şans başarısından arındırılmış puan
  • Değişim alanı
    • Herhangi bir değişkenin alabileceği tüm değerlerin bulunduğu aralık
  • Frekans dağılımı
    • Bir sınıfın not dağılımına dair yorumlamaların yapıldığı dağılım
  • Çeyrek sapma
    • Dağılımın belirgin bir şekilde sola ya da sağa eğilimli olması hâlinde kullanılır
    • Merkezi eğilim ölçüsü olarak medyan dikkate alınırsa çeyrek sapma kullanılır.
  • İç tutarlılık katsayısı
    • Test sorularının birbiri ile uyumlu olması.
    • Her bir sorunun eşit ağırlığa sahip olması
  • Normal dağılımeğrisi
    • -1 & +1 %68,
    • -2 & +2 % 95,
    • -3 & +3 % 99
  • Z puanı: (Öğrencinin Puanı - Aritmetik Ortalama) / Standart Sapma
  • T puanı: 50+Z*10
  • Korelâsyon
    • Pozitif, negatif, ilişkisizlik
  • Ölçme Araçları
    • Çeldirici
      • Çeldiricilerin güçlendirilmesi soruyu zorlaştırır.


ankakedisi KPSS’cilere başarılar diler.

Yorum yapın

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Değiştir )

Twitter picture

You are commenting using your Twitter account. Log Out / Değiştir )

Facebook photo

You are commenting using your Facebook account. Log Out / Değiştir )

Connecting to %s