İstatistiksel örnekleme istatistiklerde oldukça sık kullanılır. Bu süreçte, bir nüfus hakkında bir şeyler belirlemeyi hedefliyoruz. Popülasyonlar tipik olarak büyük boyutlu olduğu için, önceden belirlenmiş bir boyuta sahip popülasyonun bir alt kümesini seçerek istatistiksel bir örnek oluştururuz. Örneği inceleyerek popülasyon hakkında bir şeyler belirlemek için çıkarımsal istatistikler kullanabiliriz.
İstatistiksel bir boyut örneği n tek bir grup içerir n popülasyondan rastgele seçilen bireyler veya özneler. İstatistiksel örnek kavramıyla yakından ilgili bir örnekleme dağılımıdır.
Örnekleme Dağılımlarının Kökeni
Birden fazla örnek oluşturduğumuzda örnekleme dağılımı gerçekleşir basit rastgele örnek belirli bir popülasyondan aynı büyüklükte. Bu numunelerin birbirinden bağımsız olduğu düşünülmektedir. Dolayısıyla, bir birey bir numunede ise, alınan bir sonraki numunede olma olasılığı aynıdır.
Her örnek için belirli bir istatistik hesaplıyoruz. Bu bir örnek olabilir anlamına gelmek, bir örnek sapması veya bir örnek oranı. Bir istatistik elimizdeki örneğe bağlı olduğundan, her bir örnek genellikle ilgili istatistik için farklı bir değer üretecektir. Üretilen değerlerin aralığı bize örnekleme dağılımımızı veren şeydir.
Ortalamalar için Örnekleme Dağılımı
Bir örnek olarak, ortalama için örnekleme dağılımını ele alacağız. Bir popülasyonun ortalaması tipik olarak bilinmeyen bir parametredir. 100 büyüklüğünde bir örnek seçersek, bu örneğin ortalaması, tüm değerleri bir araya getirip daha sonra toplam veri noktası sayısına, bu durumda 100'e bölünerek kolayca hesaplanır. 100 büyüklüğündeki bir numune bize ortalama 50 verebilir. Böyle bir başka örneğin ortalaması 49 olabilir. Bir başka 51 ve bir başka örnek ortalama 50.5 olabilir.
Bu numune araçlarının dağılımı bize bir örnekleme dağılımı vermektedir. Yukarıda yaptığımız gibi sadece dörtten fazla örnek aracı düşünmek isteriz. Birkaç örnekleme aracıyla, örnekleme dağılımının şekli hakkında iyi bir fikrimiz olurdu.
Neden Önemsiyoruz?
Örnekleme Dağılımları oldukça soyut ve teorik görünebilir. Ancak, bunları kullanmanın bazı önemli sonuçları vardır. Ana avantajlardan biri, istatistiklerde bulunan değişkenliği ortadan kaldırmamızdır.
Örneğin, ortalama μ ve standart σ sapması olan bir popülasyonla başladığımızı varsayalım. Standart sapma bize dağılımın ne kadar yayıldığına dair bir ölçüm verir. Bunu, basit rastgele boyut örnekleri oluşturarak elde edilen bir örnekleme dağılımı ile karşılaştıracağız. n. Ortalamanın örnekleme dağılımı hala ortalama μ olacaktır, ancak standart sapma farklıdır. Bir örnekleme dağılımı için standart sapma σ / √ olur n.
Böylece aşağıdakiler var
- Örneklem büyüklüğü 4, standart sapma σ / 2 olan örnekleme dağılımına sahip olmamızı sağlar.
- 9 örneklem büyüklüğü standart σ / 3 sapma ile örnekleme dağılımına sahip olmamızı sağlar.
- 25 örnek büyüklüğü, standart sapma σ / 5 olan bir örnekleme dağılımına sahip olmamızı sağlar.
- 100 örnek büyüklüğü, standart sapma σ / 10 ile örnekleme dağılımına sahip olmamızı sağlar.
Uygulamada
İstatistik pratiğinde nadiren örnekleme dağılımları oluştururuz. Bunun yerine, basit bir rastgele boyut örneğinden türetilen istatistikleri ele alıyoruz n sanki karşılık gelen örnekleme dağılımı boyunca bir nokta gibi. Bu, neden nispeten büyük örnek boyutlarına sahip olmak istediğimizi tekrar vurgular. Örneklem büyüklüğü ne kadar büyük olursa, istatistiğimizde elde edeceğimiz daha az değişiklik olur.
Merkez ve yayılma dışında, örnekleme dağılımımızın şekli hakkında hiçbir şey söyleyemediğimizi unutmayın. Bazı oldukça geniş koşullar altında, Merkezi Limit Teoremi bize örnekleme dağılımının şekli hakkında inanılmaz bir şey söylemek için uygulanabilir.