İstatistikte Sağlamlık Nedir?

İçinde İstatistik, sağlam veya sağlamlık terimi, bir çalışmanın başarmayı umduğu istatistiksel analizin spesifik koşullarına göre istatistiksel bir modelin, testlerin ve prosedürlerin gücünü ifade eder. Bir çalışmanın bu koşullarının karşılandığı göz önüne alındığında, modellerin matematiksel kanıtlar kullanılarak doğru olduğu doğrulanabilir.

Birçok model, gerçek dünya verileriyle çalışırken var olmayan ideal durumlara dayanır ve sonuç olarak, koşullar tam olarak karşılanmasa bile model doğru sonuçlar sağlayabilir.

Bu nedenle, sağlam istatistikler, çok çeşitli verilerden alındığında iyi performans sağlayan herhangi bir istatistiktir. Belirli bir durumda model varsayımlarından aykırı değerlerden veya küçük sapmalardan büyük ölçüde etkilenmeyen olasılık dağılımları Veri kümesi. Başka bir deyişle, sağlam bir istatistik sonuçlardaki hatalara karşı dayanıklıdır.

Yaygın olarak tutulan sağlam bir istatistiksel prosedürü gözlemlemenin bir yolu, en doğru istatistiksel tahminleri belirlemek için hipotez testlerini kullanan t-prosedürlerinden başka bir yere bakmaya gerek yoktur.

instagram viewer

T-Prosedürlerini Gözlemleme

Bir sağlamlık örneği olarak, t- içeren prosedürler güven aralığı popülasyon standart sapması bilinmeyen bir popülasyon ortalaması ve popülasyon ortalaması hakkında hipotez testleri için.

Kullanımı t-prosedürler aşağıdakileri varsayar:

  • Üzerinde çalıştığımız veri kümesi basit rastgele örnek nüfusun.
  • Numune aldığımız nüfus normal olarak dağılır.

Gerçek hayattaki örneklerle pratikte, istatistikçilerin nadiren normal olarak dağıtılmış bir nüfusu vardır, bu yüzden soru bunun yerine “Ne kadar sağlamız? t-prosedürler?”

Genel olarak basit bir rasgele örneğe sahip olmamız, normal olarak dağılmış bir popülasyondan örneklemiş olmamızdan daha önemlidir; bunun nedeni, merkezi limit teoreminin yaklaşık olarak örnekleme dağılımını sağlamasıdır. normal - numune boyutumuz ne kadar büyük olursa, numune ortalamasının örnekleme dağılımının o kadar yakın olması normal.

T-Prosedürleri Sağlam İstatistikler Olarak İşlevi

Çok sağlamlık tprosedürleri numune büyüklüğüne ve numunemizin dağılımına bağlıdır. Bunun için dikkate alınması gerekenler:

  • Örneklerin boyutu büyükse, yani 40 veya daha fazla gözlemimiz var, t-prosedürler çarpık dağılımlarda bile kullanılabilir.
  • Örnek boyutu 15 ila 40 arasındaysa, o zaman kullanabiliriz t-Aykırı değerler veya yüksek derecede çarpıklık yoksa, herhangi bir şekilli dağılım prosedürü.
  • Örnek boyutu 15'ten azsa, o zaman kullanabiliriz t- aykırı değerleri, tek bir zirvesi olmayan ve neredeyse simetrik olan veriler için prosedürler.

Çoğu durumda, matematiksel istatistiklerde teknik çalışmalar yoluyla sağlamlık sağlanmıştır ve Neyse ki, düzgün bir şekilde yapabilmek için bu gelişmiş matematiksel hesaplamaları yapmamız gerekmiyor. onları kullanın; yalnızca spesifik istatistiksel yöntemimizin sağlamlığı için genel yönergelerin ne olduğunu anlamamız gerekir.

T-prosedürleri sağlam istatistikler olarak işlev görürler çünkü tipik olarak prosedürün uygulanması için temele örnekleme büyüklüğünde çarpanlar halinde bu modeller başına iyi performans verirler.