Popülasyon varyansı, bir veri kümesinin nasıl yayılacağına dair bir gösterge verir. Ne yazık ki, bu popülasyon parametresinin tam olarak ne olduğunu bilmek imkansızdır. Bilgi eksikliğimizi telafi etmek için, çıkarımsal istatistiklerden bir başlık kullanıyoruz. güvenilirlik aralığı. Bir popülasyon varyansı için güven aralığının nasıl hesaplanacağına ilişkin bir örnek göreceğiz.
Güven Aralığı Formülü
(1 - α) formülü popülasyon varyansı hakkında güven aralığı. Aşağıdaki eşitsizlik dizesi ile verilir:
[ (n - 1)s2] / B < σ2 < [ (n - 1)s2] / bir.
Buraya n örnek boyutu, s2 örnek varyansıdır. Numara bir ki-kare dağılımının n Eğrinin altındaki alanın α / 2'sinin tam olarak solunda olduğu -1 serbestlik derecesi bir. Benzer şekilde, sayı B aynı ki-kare dağılımının noktası, sağdaki eğrinin altındaki alanın tam olarak α / 2'sidir. B.
Hazırlıklar
10 değer içeren bir veri kümesiyle başlıyoruz. Bu veri değerleri kümesi basit bir rastgele örnekle elde edilmiştir:
97, 75, 124, 106, 120, 131, 94, 97,96, 102
Aykırı değerlerin olmadığını göstermek için bazı keşifsel veri analizine ihtiyaç duyulacaktır. Bir gövde ve yaprak grafiği bu verilerin muhtemelen normal olarak dağıtılmış bir dağıtımdan kaynaklandığını görüyoruz. Bu, nüfus varyansı için% 95 güven aralığı bulmaya devam edebileceğimiz anlamına gelir.
Örnek Varyans
Nüfus varyansını örnek varyans ile tahmin etmeliyiz. s2. Böylece bu istatistiği hesaplayarak başlıyoruz. Aslında biz kare sapmaların toplamı ortalamadan. Ancak, bu toplamı bölmek yerine n onu böleriz n - 1.
Örneklem ortalamasının 104.2 olduğunu bulduk. Bunu kullanarak, aşağıdakiler tarafından verilen ortalamadan kare sapmaların toplamına sahibiz:
(97 – 104.2)2 + (75 – 104.3)2 +... + (96 – 104.2)2 + (102 – 104.2)2 = 2495.6
277 örnek varyansını elde etmek için bu toplamı 10 - 1 = 9'a böleriz.
Ki-Kare Dağılımı
Şimdi ki-kare dağıtımımıza dönüyoruz. 10 veri değerine sahip olduğumuz için 9 özgürlük derecesi. Dağıtımımızın% 95'ini ortalamak istediğimizden, her iki kuyrukta da% 2,5'e ihtiyacımız var. Ki-kare bir tabloya veya yazılıma başvuruyoruz ve 2.7004 ve 19.023 tablo değerlerinin dağıtım alanının% 95'ini kapsadığını görüyoruz. Bu sayılar bir ve B, sırasıyla.
Artık ihtiyacımız olan her şeye sahibiz ve güven aralığımızı oluşturmaya hazırız. Sol uç nokta için formül [(n - 1)s2] / B. Bu, sol uç noktamızın:
(9 x 277) /19.023 = 133
Sağ uç nokta değiştirilerek bulunur B ile bir:
(9 x 277) /2.7004 = 923
Dolayısıyla, nüfus varyansının 133 ila 923 arasında olduğundan% 95 eminiz.
Nüfus standart sapması
Elbette, standart sapma varyansın kare kökü olduğundan, bu yöntem popülasyon standart sapması için bir güven aralığı oluşturmak için kullanılabilir. Tek yapmamız gereken uç noktaların kare köklerini almak. Sonuç% 95'lik bir güven aralığıdır. standart sapma.