Yedekli veya Yedeksiz Örnekleme

İstatistiksel örnekleme birkaç farklı yolla yapılabilir. Kullandığımız örnekleme yönteminin türüne ek olarak, rastgele seçtiğimiz bir kişiye özel olarak ne olduğu ile ilgili başka bir soru daha vardır. Örnekleme yapılırken ortaya çıkan bu soru, "Bir kişiyi seçtikten ve üzerinde çalıştığımız nitelik ölçümünü kaydettikten sonra, bireyle ne yapacağız?"

İki seçenek vardır:

  • Bireyi örneklediğimiz havuza geri koyabiliriz.
  • Bireyi değiştirmemeyi seçebiliriz.

Bunların iki farklı duruma yol açtığını kolayca görebiliriz. İlk seçenekte, değiştirme yaprakları bireyin ikinci kez rastgele seçilmesi olasılığını açar. İkinci seçenek için, değiştirmeden çalışıyorsak, aynı kişiyi iki kez seçmek imkansızdır. Bu farkın, bu örneklerle ilgili olasılıkların hesaplanmasını etkileyeceğini göreceğiz.

Olasılıklar Üzerine Etkisi

Değiştirmeyi nasıl ele aldığımızı görmek için olasılıkların hesaplanmasını etkiler, aşağıdaki örnek soruyu göz önünde bulundurun. Bir asdan iki as çizme olasılığı nedir standart kart destesi?

Bu soru belirsiz. İlk kartı çektiğimizde ne olur? Onu güverteye geri koyar mıyız yoksa dışarıda mı bırakırız?

instagram viewer

Değiştirme ile olasılığı hesaplamakla başlıyoruz. Toplamda dört as ve 52 kart vardır, bu yüzden bir as çizim olasılığı 4/52'dir. Bu kartı değiştirip tekrar çekersek, olasılık tekrar 4/52 olur. Bu olaylar bağımsızdır, bu nedenle (4/52) x (4/52) = 1/169 veya yaklaşık% 0.592 olasılıklarını çarparız.

Şimdi, kartları değiştirmemiz dışında bunu aynı durumla karşılaştıracağız. İlk çekilişte asın çizilme olasılığı hala 4/52'dir. İkinci kart için, bir asın zaten çizildiğini varsayıyoruz. Şimdi koşullu bir olasılık hesaplamalıyız. Başka bir deyişle, ilk kartın da bir as olduğu göz önüne alındığında, ikinci bir as çizme olasılığının ne olduğunu bilmemiz gerekir.

Şu anda toplam 51 karttan üç as kaldı. Yani bir as çizdikten sonra ikinci bir asın şartlı olasılığı 3/51'dir. Yedek olmadan iki as çizme olasılığı (4/52) x (3/51) = 1/221 veya yaklaşık% 0.425'dir.

Doğrudan yukarıdaki problemden, değiştirme ile yapmayı seçtiğimiz şeyin olasılıkların değerlerini etkilediğini görüyoruz. Bu değerleri önemli ölçüde değiştirebilir.

Nüfus Boyutları

Değiştirilen veya değiştirilmeden örneklemenin herhangi bir olasılığı önemli ölçüde değiştirmediği bazı durumlar vardır. 50.000 nüfusa sahip bir şehirden rasgele iki kişi seçtiğimizi varsayalım, bunların 30.000'i kadın.

Değiştirme ile örneklersek, ilk seçimde bir dişi seçme olasılığı 30000/50000 =% 60 ile verilir. Bir dişinin ikinci seçimdeki olasılığı hala% 60'tır. Her iki kişinin de kadın olma olasılığı 0.6 x 0.6 = 0.36'dır.

Değiştirmeden örnek alırsak, ilk olasılık etkilenmez. İkinci olasılık şimdi% 60'a çok yakın olan 29999/49999 = 0.5999919998... Her ikisinin de kadın olma olasılığı 0.6 x 0.5999919998 = 0.359995'tir.

Olasılıklar teknik olarak farklıdır, ancak neredeyse ayırt edilemeyecek kadar yakındırlar. Bu nedenle, değiştirmeden örnek alsak da, her bireyin seçimini, örnekteki diğer bireylerden bağımsızmış gibi ele alıyoruz.

Diğer uygulamalar

Değiştirmeli veya değiştirmeden numune almayı düşünmemiz gereken başka durumlar da vardır. Bunun bir örneği önyükleme. Bu istatistiksel teknik, bir yeniden örnekleme tekniği başlığı altında yer almaktadır.

Bootstrapping'de, bir popülasyonun istatistiksel bir örneğiyle başlıyoruz. Daha sonra bootstrap örneklerini hesaplamak için bilgisayar yazılımı kullanıyoruz. Başka bir deyişle, bilgisayar ilk örnekten değiştirilerek yeniden örneklenir.