İstatistikte Simpson Paradoksu Nedir?

bir paradoks yüzeyde çelişkili görünen bir ifadedir. Paradokslar, saçma görünen şeyin yüzeyinin altında yatan gerçeği ortaya çıkarmaya yardımcı olur. İstatistik alanında, Simpson paradoksu, çeşitli gruplardan gelen verileri birleştirmekten ne tür problemlerin ortaya çıktığını gösterir.

Tüm verilerle dikkatli olmalıyız. Nereden geldi? Nasıl elde edildi? Ve gerçekten ne diyor? Bunların hepsi verilerle sunulduğunda sormamız gereken iyi sorular. Simpson'ın paradoksunun çok şaşırtıcı vakası bize bazen verinin söylediklerinin gerçekte böyle olmadığını gösteriyor.

Paradoksa Genel Bakış

Birkaç grup gözlemlediğimizi ve bir ilişki kurduğumuzu varsayalım. bağıntı bu grupların her biri için. Simpson’ın paradoksu, tüm grupları bir araya getirdiğimizde ve verilere toplu halde baktığımızda, daha önce fark ettiğimiz korelasyonun kendisini tersine çevirebileceğini söylüyor. Bu en çok dikkate alınmayan değişkenlerden kaynaklanır, ancak bazen verilerin sayısal değerlerinden kaynaklanır.

Misal

Simpson paradoksunu biraz daha anlamlandırmak için aşağıdaki örneğe bakalım. Belli bir hastanede iki cerrah var. Cerrah A 100 hasta üzerinde ameliyat olur ve 95 hasta hayatta kalır. Cerrah B 80 hasta üzerinde ameliyat olur ve 72 hasta hayatta kalır. Bu hastanede ameliyat yapılmasını düşünüyoruz ve ameliyat boyunca yaşamak önemli bir şey. İki cerrahdan daha iyisini seçmek istiyoruz.

instagram viewer

Verilere bakıyoruz ve cerrah A hastalarının yüzde kaçının operasyonlarından sağ kurtulduğunu hesaplamak ve cerrah B hastalarının sağkalım oranıyla karşılaştırmak için kullanıyoruz.

  • 100 hastadan 95'i cerrah A ile hayatta kalmıştır, bu nedenle 95/100 =% 95'i sağ kalmıştır.
  • 80 hastanın 72'si cerrah B ile hayatta kalmıştır, bu nedenle 72/80 =% 90'ı hayatta kalmıştır.

Bu analizden, bize hangi cerrahı tedavi etmeyi seçmeliyiz? Görünüşe göre cerrah A daha güvenli bir bahis. Ama bu gerçekten doğru mu?

Veriler hakkında biraz daha araştırma yaparsak ve başlangıçta hastanenin düşündüğünü bulursak ne olur? iki farklı ameliyat türü, ancak daha sonra tüm verileri raporlamak için bir araya getirdi. cerrahlar. Tüm ameliyatlar eşit değildir, bazıları yüksek riskli acil ameliyatlar olarak kabul edilirken, diğerleri önceden planlanmış olan daha rutin bir yapıya sahipti.

A cerrahını tedavi eden 100 hastanın 50'si yüksek riskliydi, bunlardan üçü öldü. Diğer 50 kişi rutin olarak kabul edildi ve bunların ikisi öldü. Bu, rutin bir ameliyat için, cerrah A tarafından tedavi edilen bir hastanın 48/50 =% 96 sağkalım oranına sahip olduğu anlamına gelir.

Şimdi B cerrahının verilerine daha dikkatli bakıyoruz ve 40 hastanın 80'inin yüksek riskli olduğunu ve bunların yedi tanesinin öldüğünü buluyoruz. Diğer 40 kişi rutindi ve sadece biri öldü. Bu, bir hastanın cerrah B ile rutin bir ameliyat için% 39/40 =% 97,5 hayatta kalma oranına sahip olduğu anlamına gelir.

Şimdi hangi cerrah daha iyi görünüyor? Ameliyatınız rutin bir ameliyatsa, B cerrahı aslında daha iyi cerrah. Cerrahlar tarafından yapılan tüm ameliyatlara bakarsak, A daha iyidir. Bu oldukça mantıksız. Bu durumda, ameliyat türünün gizlenen değişkeni cerrahların birleşik verilerini etkiler.

Simpson Paradoksunun Tarihi

Simpson’ın paradoksu, bu paradoksu ilk olarak 1951 tarihli "Acil Durum Tablolarında Etkileşimin Yorumlanması" makalesinde Kraliyet İstatistik Topluluğu Dergisi. Pearson ve Yule'nin her biri Simpson'dan yarım yüzyıl önce benzer bir paradoks gözlemledi, bu nedenle Simpson’ın paradoksuna bazen Simpson-Yule etkisi de denir.

Spor istatistikleri ve spor alanları kadar çeşitli alanlarda paradoksun çok çeşitli uygulamaları vardır. işsizlik verisi. Veriler her toplandığında, bu paradoksun ortaya çıkmasına dikkat edin.

instagram story viewer