ki-kare uyum iyiliği testi karşılaştırmak için yararlı bir teorik model gözlemlenen verilere. Bu test daha genel ki-kare testinin bir türüdür. Matematik veya istatistikteki herhangi bir konuda olduğu gibi, ki-kare uyum iyiliği testinin bir örneği aracılığıyla neler olduğunu anlamak için bir örnek üzerinde çalışmak yararlı olabilir.
Standart bir paket sütlü çikolata M & Ms'yi düşünün. Altı farklı renk vardır: kırmızı, turuncu, sarı, yeşil, mavi ve kahverengi. Bu renklerin dağılımını merak ettiğimizi varsayalım ve altı rengin de eşit oranda meydana geldiğini sorun. Bu, bir uyum iyiliği testi ile cevaplanabilecek soru türüdür.
Ayar
Ayarı ve uyum iyiliği testinin neden uygun olduğunu not ederek başlıyoruz. Renk değişkenimiz kategoriktir. Bu değişkenin mümkün olan altı renge karşılık gelen altı seviyesi vardır. Saydığımız M & Ms'nin tüm M & Ms popülasyonundan basit bir rastgele örnek olacağını varsayacağız.
Sıfır ve Alternatif Hipotezler
sıfır ve alternatif hipotezler çünkü bizim uyum iyiliği testi popülasyon hakkında yaptığımız varsayımı yansıtmaktadır. Renklerin eşit oranlarda oluşup oluşmadığını test ettiğimiz için, sıfır hipotezimiz tüm renklerin aynı oranda oluşması olacaktır. Daha resmi olarak, eğer
p1 kırmızı şekerlerin nüfus oranı, p2 turuncu şekerlemelerin nüfus oranıdır ve bu nedenle sıfır hipotezi p1 = p2 =... = p6 = 1/6.Alternatif hipotez, nüfus oranlarından en az birinin 1/6'ya eşit olmamasıdır.
Fiili ve Beklenen Sayımlar
Gerçek sayımlar altı rengin her biri için şeker sayısıdır. Beklenen sayı, sıfır hipotezi doğru olsaydı ne bekleyeceğimize işaret eder. İzin vereceğiz n bizim örnek boyutu olabilir. Beklenen kırmızı şeker sayısı p1 n veya n/6. Aslında, bu örnek için, altı rengin her biri için beklenen şeker sayısı basitçe n zamanlar pbenveya n/6.
Uyum İyiliği için Ki-Kare İstatistiği
Şimdi belirli bir örnek için ki-kare istatistiğini hesaplayacağız. Aşağıdaki dağıtımla 600 M&M şekerinden oluşan basit bir rastgele örneğimiz olduğunu varsayalım:
- Şekerin 212'si mavidir.
- Şekerin 147'si turuncu.
- Şekerin 103'ü yeşildir.
- Şekerin 50'si kırmızıdır.
- Şekerler 46 sarı.
- Şekerin 42'si kahverengidir.
Sıfır hipotezi doğru olsaydı, bu renklerin her biri için beklenen sayılar (1/6) x 600 = 100 olurdu. Şimdi bunu ki-kare istatistiği hesaplamamızda kullanıyoruz.
İstatistiğimize katkıyı her bir renkten hesaplıyoruz. Her biri şu şekildedir (Gerçek - Beklenen)2/Expected.:
- Mavi için elimizde (212-100)2/100 = 125.44
- Portakal için (147-100)2/100 = 22.09
- Yeşil için elimizde (103-100)2/100 = 0.09
- Kırmızı için elimizde (50-100)2/100 = 25
- Sarı için elimizde (46-100)2/100 = 29.16
- Kahverengi için (42-100)2/100 = 33.64
Sonra tüm bu katkıları topladık ve ki-kare istatistiğimizin 125,44 + 22,09 + 0,09 + 25 +29,16 + 33,64 = 235,42 olduğunu tespit ettik.
Özgürlük derecesi
Sayısı özgürlük derecesi uyum iyiliği testi, değişkenimizin seviyelerinin sayısından sadece bir tanesidir. Altı renk olduğu için 6 - 1 = 5 serbestlik derecemiz var.
Ki-kare Tablosu ve P-Değeri
Hesapladığımız 235.42 ki-kare istatistiği beş serbestlik derecesine sahip bir ki-kare dağılımındaki belirli bir yere karşılık gelir. Şimdi bir p-değerisıfır hipotezinin doğru olduğunu varsayarak, en az 235,42 kadar aşırı bir test istatistiği elde etme olasılığını belirlemek.
Microsoft’un Excel'i bu hesaplama için kullanılabilir. Beş serbestlik dereceli test istatistiğimizin p değeri 7,29 x 10-49. Bu son derece küçük bir p-değeridir.
Karar kuralı
Sıfır hipotezinin p değerinin büyüklüğüne göre reddedilip reddedilmeyeceğine karar veririz. Çok küçük bir p değerine sahip olduğumuzdan, sıfır hipotezini reddediyoruz. M & Ms'nin altı farklı renk arasında eşit olarak dağıtılmadığı sonucuna vardık. Belirli bir rengin popülasyon oranı için bir güven aralığını belirlemek için bir takip analizi kullanılabilir.