Güvenilirlik aralığı bir parçası çıkarımsal istatistik. Bu konunun arkasındaki temel fikir, bilinmeyen bir nüfusun değerini tahmin etmektir parametre istatistiksel bir örnek kullanarak. Sadece bir parametrenin değerini tahmin etmekle kalmaz, aynı zamanda ilgili iki parametre arasındaki farkı tahmin etmek için yöntemlerimizi de uyarlayabiliriz. Örneğin, belirli bir yasayı destekleyen erkek ABD'li oy kullanan nüfusun, kadın oy veren nüfusa oranındaki farkı bulmak isteyebiliriz.
İki nüfus oranının farkı için bir güven aralığı oluşturarak bu tür bir hesaplamanın nasıl yapılacağını göreceğiz. Bu süreçte bu hesaplamanın arkasındaki teoriyi inceleyeceğiz. Nasıl inşa ettiğimizde bazı benzerlikler göreceğiz tek bir nüfus oranı için güven aralığı yanı sıra iki popülasyonun farkı için güven aralığı.
Genel konular
Kullanacağımız belirli formüle bakmadan önce, bu tür bir güven aralığının uyduğu genel çerçeveyi ele alalım. Bakacağımız güven aralığının türü aşağıdaki formülle verilmiştir:
Hatanın +/- Kenar Boşluğunu Tahmini
Pek çok güven aralığı bu türdendir. Hesaplamamız gereken iki sayı var. Bu değerlerden ilki, parametrenin tahminidir. İkinci değer, hata payıdır. Bu hata payı bir tahmininiz olduğu gerçeğini açıklar. Güven aralığı bize bilinmeyen parametremiz için bir dizi olası değer sağlar.
Koşullar
Herhangi bir hesaplama yapmadan önce tüm koşulların yerine getirildiğinden emin olmalıyız. İki nüfus oranının farkı için bir güven aralığı bulmak için aşağıdakilerin sağlandığından emin olmamız gerekir:
- İki tane var basit rastgele örnekler büyük popülasyonlardan. Burada "büyük", popülasyonun numunenin boyutundan en az 20 kat daha büyük olduğu anlamına gelir. Örnek boyutları ile gösterilir n1 ve n2.
- Bireylerimiz birbirlerinden bağımsız olarak seçildi.
- Örneklerimizin her birinde en az on başarı ve on başarısızlık vardır.
Listedeki son öğe tatmin olmazsa, bunun bir yolu olabilir. Değiştirebiliriz artı dört güven aralığı inşaat ve elde sağlam sonuçlar. İlerledikçe, yukarıdaki koşulların hepsinin karşılandığını varsayıyoruz.
Örnekler ve Nüfus Oranları
Şimdi güven aralığımızı oluşturmaya hazırız. Nüfus oranlarımız arasındaki farkın tahmini ile başlıyoruz. Bu nüfus oranlarının her ikisi de örnek bir oranla tahmin edilmektedir. Bu örnek oranları, her bir numunedeki başarıların sayısını bölerek ve sonra ilgili örneklem büyüklüğüne bölerek bulunan istatistiklerdir.
İlk nüfus oranı şu şekilde gösterilir: p1. Örneklemimizde bu popülasyondan elde edilen başarı sayısı k1, sonra örnek bir oranımız var k1 / n1.
Bu istatistiği p̂ ile belirtiyoruz.1. Bu sembolü "p1-hat "çünkü p sembolüne benziyor1 üstüne bir şapka ile.
Benzer şekilde ikinci popülasyonumuzdan örnek bir oran hesaplayabiliriz. Bu popülasyondan gelen parametre p2. Örneklemimizde bu popülasyondan elde edilen başarı sayısı k2, ve bizim örnek oranı p̂2 = k2 / n2.
Bu iki istatistik güven aralığımızın ilk kısmı haline geldi. Tahmini p1 p̂1. Tahmini p2 p̂2. Yani farkın tahmini p1 - p2 p̂1 - p̂2.
Örnek Oran Farkının Örnekleme Dağılımı
Daha sonra, hata payı için formülü elde etmeliyiz. Bunu yapmak için önce örnekleme dağılımı of p̂1 . Bu başarı olasılığı olan bir binom dağılımı p1 ve n1 denemeler. Bu dağılımın ortalaması orantıdır. p1. Bu tip rastgele değişkenin standart sapması, p1 (1 - p1 )/n1.
Örneklem dağılımı p̂2 p̂'ninkine benzer1 . Tüm endeksleri 1'den 2'ye değiştirin ve p ortalaması ile binom dağılımına sahibiz.2 ve varyansı p2 (1 - p2 )/n2.
Şimdi p̂ örnekleme dağılımını belirlemek için matematiksel istatistiklerden birkaç sonuca ihtiyacımız var.1 - p̂2. Bu dağılımın ortalaması p1 - p2. Varyansların bir araya gelmesi nedeniyle, örnekleme dağılımının varyansının p1 (1 - p1 )/n1 + p2 (1 - p2 )/n2. Dağılımın standart sapması, bu formülün kare köküdür.
Yapmamız gereken birkaç ayar var. Birincisi, p̂'nin standart sapması için formül1 - p̂2 bilinmeyen parametrelerini kullanır p1 ve p2. Elbette bu değerleri gerçekten bilseydik, ilginç bir istatistiksel sorun olmazdı. Arasındaki farkı tahmin etmemiz gerekmezdi p1 ve p2.. Bunun yerine, kesin farkı hesaplayabiliriz.
Bu sorun, standart sapma yerine standart hata hesaplanarak giderilebilir. Tek yapmamız gereken nüfus oranlarını örnek oranlarıyla değiştirmek. Standart hatalar, parametreler yerine istatistiklere göre hesaplanır. Standart bir hata faydalıdır çünkü standart sapmayı etkili bir şekilde tahmin eder. Bunun bizim için anlamı, artık parametrelerin değerini bilmemize gerek olmamasıdır p1 ve p2. .Bu örnek oranlar bilindiği için, standart hata aşağıdaki ifadenin kare kökü tarafından verilir:
p1 (1 - p̂1 )/n1 + p̂2 (1 - p̂2 )/n2.
Ele almamız gereken ikinci madde, örnekleme dağılımımızın özel biçimidir. P̂ örnekleme dağılımına yaklaşmak için normal bir dağılım kullanabileceğimiz ortaya çıktı.1 - p̂2. Bunun nedeni biraz tekniktir, ancak bir sonraki paragrafta açıklanmaktadır.
Her ikisi de p̂1 ve P2 binom örnekleme dağılımına sahiptir. Bu binom dağılımlarının her biri, normal bir dağılım ile oldukça iyi bir şekilde tahmin edilebilir. Böylece p̂1 - p̂2 rastgele bir değişkendir. İki rasgele değişkenin doğrusal bir kombinasyonu olarak oluşturulur. Bunların her biri normal bir dağılım ile yaklaşmaktadır. Bu nedenle p̂ örnekleme dağılımı1 - p̂2 ayrıca normal olarak dağıtılır.
Güven Aralığı Formülü
Artık güven aralığımızı oluşturmak için ihtiyacımız olan her şeye sahibiz. Tahmin (p̂1 - p̂2) ve hata payı z * [s1 (1 - p̂1 )/n1 + p̂2 (1 - p̂2 )/n2.]0.5. Girdiğimiz değer z * güven düzeyine göre belirlenir C. İçin yaygın olarak kullanılan değerler z * % 90 güven için 1,645 ve% 95 güven için 1,96'dır. İçin bu değerler z * standart normal dağılımın tam olarak C dağılım yüzdesi arasında -z * ve Z *.
Aşağıdaki formül, iki nüfus oranının farkı için bize bir güven aralığı vermektedir:
(s1 - p̂2) +/- z * [s1 (1 - p̂1 )/n1 + p̂2 (1 - p̂2 )/n2.]0.5