Sayısı özgürlük derecesi iki kategorik değişkenin bağımsızlığı için basit bir formülle verilir: (r - 1)(c - 1). Buraya r satır sayısı ve c içindeki sütun sayısı iki yönlü masa kategorik değişkenin değerlerinin Bu konu hakkında daha fazla bilgi edinmek ve bu formülün neden doğru sayıyı verdiğini anlamak için okumaya devam edin.
Arka fon
Birçok sürecin bir adımı hipotez testleri serbestlik derecelerinin belirlenmesidir. Bu sayı önemlidir çünkü olasılık dağılımları ki-kare dağılımı, derece sayısı gibi bir dağılım ailesini içeren özgürlük, hipotezimizde kullanmamız gereken ailenin kesin dağılımını saptar Ölçek.
Serbestlik derecesi, belirli bir durumda yapabileceğimiz serbest seçimlerin sayısını temsil eder. Özgürlük derecelerini belirlememizi gerektiren hipotez testlerinden biri, ki-kare iki kategorik değişken için bağımsızlık testi.
Bağımsızlık ve İki Yönlü Masa Testleri
Bağımsızlık için ki-kare testi, beklenmedik durum tablosu olarak da bilinen iki yönlü bir tablo oluşturmamızı gerektiriyor. Bu tablo türü
r satırlar ve c sütunları, r bir kategorik değişken ve c diğer kategorik değişkenin düzeyleri. Dolayısıyla, toplamları kaydettiğimiz satır ve sütunu saymazsak, toplam rc yönlü tablodaki hücreler.Bağımsızlık için ki-kare testi, kategorik değişkenler birbirinden bağımsızdır. Yukarıda belirttiğimiz gibi, r satırlar ve c tablodaki sütunlar bize (r - 1)(c - 1) serbestlik derecesi. Ancak bunun neden doğru serbestlik derecesi olduğu hemen belli olmayabilir.
Serbestlik Derecesi Sayısı
Nedenini görmek için (r - 1)(c - 1) doğru sayıdır, bu durumu daha ayrıntılı olarak inceleyeceğiz. Kategorik değişkenlerimizin her seviyesi için marjinal toplamları bildiğimizi varsayalım. Başka bir deyişle, her satır için toplamı ve her sütun için toplamı biliyoruz. İlk satır için, c tablonuzdaki sütunlar, yani c Hücreler. Bu hücrelerden biri hariç hepsinin değerlerini öğrendikten sonra, tüm hücrelerin toplamını bildiğimiz için, kalan hücrenin değerini belirlemek basit bir cebir problemidir. Masamızın bu hücrelerini dolduruyor olsaydık, c - 1 tanesi serbestçe, ancak daha sonra kalan hücre satırın toplamı tarafından belirlenir. Böylece c - İlk sıra için 1 serbestlik derecesi.
Bir sonraki satır için bu şekilde devam ediyoruz ve yine var c - 1 serbestlik derecesi. Bu işlem, sondan bir önceki satıra gelene kadar devam eder. Sonuncusu hariç satırların her biri katkıda bulunur c - Toplamda 1 serbestlik derecesi. Son satır hariç hepsine sahip olduğumuz zamana kadar, sütun toplamını bildiğimiz için son satırın tüm girişlerini belirleyebiliriz. Bu bize r - 1 sıralı c - Bunların her birinde 1 serbestlik derecesi, toplam (r - 1)(c - 1) serbestlik derecesi.
Misal
Bunu aşağıdaki örnekle görüyoruz. İki kategorik değişkenli iki yönlü bir tablonuz olduğunu varsayalım. Bir değişkenin üç seviyesi, diğerinin iki seviyesi vardır. Ayrıca, bu tablo için satır ve sütun toplamlarını bildiğimizi varsayalım:
Seviye A | Seviye B | Toplam | |
Seviye 1 | 100 | ||
Seviye 2 | 200 | ||
3. seviye | 300 | ||
Toplam | 200 | 400 | 600 |
Formül, (3-1) (2-1) = 2 serbestlik derecesi olduğunu tahmin ediyor. Bunu aşağıdaki gibi görüyoruz. Varsayalım ki sol üst hücreyi 80 rakamıyla dolduruyoruz. Bu, ilk giriş satırının tamamını otomatik olarak belirler:
Seviye A | Seviye B | Toplam | |
Seviye 1 | 80 | 20 | 100 |
Seviye 2 | 200 | ||
3. seviye | 300 | ||
Toplam | 200 | 400 | 600 |
Şimdi ikinci satırdaki ilk girişin 50 olduğunu bilersek, tablonun geri kalanı doldurulur, çünkü her satırın ve sütunun toplamını biliyoruz:
Seviye A | Seviye B | Toplam | |
Seviye 1 | 80 | 20 | 100 |
Seviye 2 | 50 | 150 | 200 |
3. seviye | 70 | 230 | 300 |
Toplam | 200 | 400 | 600 |
Tablo tamamen doldurulur, ancak biz sadece iki ücretsiz seçenek vardı. Bu değerler bilindikten sonra, tablonun geri kalanı tamamen belirlendi.
Tipik olarak neden bu kadar fazla serbestlik derecesi olduğunu bilmemize gerek olmasa da, gerçekten de serbestlik derecesi kavramını yeni bir duruma uyguladığımızı bilmek iyidir.