Bootstrapping, yeniden örneklemenin daha geniş başlığı altında yer alan istatistiksel bir tekniktir. Bu teknik nispeten basit bir prosedür içerir, ancak birçok kez tekrarlanır ve bilgisayar hesaplamalarına büyük ölçüde bağımlıdır. Önyükleme, bir popülasyon parametresini tahmin etmek için güven aralıkları dışında bir yöntem sağlar. Bootstrapping çok fazla sihir gibi çalışıyor. İlginç adını nasıl elde ettiğini görmek için okumaya devam edin.
Önyüklemenin Açıklaması
Bir hedef çıkarımsal istatistik popülasyonun bir parametresinin değerini belirlemektir. Bunu doğrudan ölçmek genellikle çok pahalı veya hatta imkansızdır. Yani kullanıyoruz istatistiksel örnekleme. Bir popülasyonu örnekliyoruz, bu örneğin bir istatistikini ölçüyor ve daha sonra bu istatistiği karşılık gelen parametre nüfusun.
Örneğin, bir çikolata fabrikasında, şeker çubuklarının belirli bir anlamına gelmek ağırlık. Üretilen her şeker çubuğunu tartmak mümkün değildir, bu nedenle rastgele 100 şeker çubuğu seçmek için örnekleme tekniklerini kullanıyoruz. Bu 100 şekerleme çubuğunun ortalamasını hesaplıyoruz ve popülasyon ortalamasının, örneğimizin ortalamasının ne olduğu bir hata payı içinde olduğunu söylüyoruz.
Birkaç ay sonra daha büyük bir doğrulukla veya daha az hata payı - üretim hattını örneklediğimiz gün ortalama şeker çubuğu ağırlığının ne olduğu. Bugünün şeker çubuklarını da kullanamayız birçok değişken resme girdiler (farklı süt grupları, şeker ve kakao çekirdekleri, farklı atmosfer koşulları, hattaki farklı çalışanlar, vb.). Merak ettiğimiz günden beri sahip olduğumuz tek şey 100 ağırlık. O zamana kadar bir zaman makinesi olmadan, ilk hata payının umabileceğimiz en iyisi olduğu görülüyor.
Neyse ki, önyükleme tekniği. Bu durumda, rastgele yedek ile örnek bilinen 100 ağırlıktan. Sonra buna bootstrap örneği diyoruz. Değiştirmeye izin verdiğimiz için, bu bootstrap örneği büyük olasılıkla ilk örneğimizle aynı değildir. Bazı veri noktaları çoğaltılabilir ve ilk 100'den gelen veri noktaları bir önyükleme örneğinde atlanabilir. Bir bilgisayar yardımı ile nispeten kısa sürede binlerce bootstrap örneği oluşturulabilir.
Bir örnek
Belirtildiği gibi, gerçekten bootstrap tekniklerini kullanmak için bir bilgisayar kullanmamız gerekiyor. Aşağıdaki sayısal örnek, sürecin nasıl çalıştığını göstermeye yardımcı olacaktır. Örnek 2, 4, 5, 6, 6 ile başlarsak, aşağıdakilerin tümü olası önyükleme örnekleri olur:
- 2 ,5, 5, 6, 6
- 4, 5, 6, 6, 6
- 2, 2, 4, 5, 5
- 2, 2, 2, 4, 6
- 2, 2, 2, 2, 2
- 4,6, 6, 6, 6
Tekniğin Tarihçesi
Bootstrap teknikleri istatistik alanında nispeten yenidir. İlk kullanım 1979'da Bradley Efron tarafından yayınlandı. Hesaplama gücü arttıkça ve daha ucuz hale geldikçe, bootstrap teknikleri daha yaygın hale geldi.
Neden Önyükleme?
“Bootstrapping” adı, “Bootstraps tarafından kaldırılması” ifadesinden gelir. Bu mantıksız ve imkansız bir şeye işaret eder. Mümkün olduğunca çok deneyin, botlarınızdaki deri parçalarını çekerek kendinizi havaya kaldıramazsınız.
Önyükleme tekniklerini doğrulayan bazı matematiksel teoriler vardır. Ancak, bootstrapping kullanımı imkansızı yapıyormuş gibi hissediyor. Her ne kadar aynı örneği tekrar tekrar kullanarak bir nüfus istatistiği tahmininde iyileşme sağlayabileceğiniz görülmese de, bootstrapping aslında bunu yapabilir.