Permütasyon Testi Örneği

Sormak her zaman önemli olan bir soru İstatistik “Gözlenen sonuç yalnızca şanstan mı kaynaklanıyor yoksa yoksa istatistiksel olarak anlamlı?” Bir sınıf hipotez testleri, permütasyon testleri olarak adlandırılan bu soruyu test etmemize izin verin. Böyle bir teste genel bakış ve adımlar şunlardır:

  • Deneklerimizi bir kontrol ve bir deney grubuna ayırdık. Sıfır hipotezi, bu iki grup arasında fark olmamasıdır.
  • Deney grubuna bir tedavi uygulayın.
  • Tedaviye yanıtı ölçün
  • Deney grubunun olası her konfigürasyonunu ve gözlemlenen yanıtı düşünün.
  • Tüm potansiyel deney gruplarına göre gözlemlenen yanıtımıza dayanarak bir p değeri hesaplayın.

Bu bir permütasyonun ana hatlarıdır. Bu taslağın üstesinden gelmek için, böyle bir permütasyon testinin işlenmiş bir örneğine çok ayrıntılı olarak bakacağız.

Misal

Fareler üzerinde çalıştığımızı varsayalım. Özellikle, farelerin daha önce hiç karşılaşmadıkları bir labirenti ne kadar çabuk bitirdiğiyle ilgileniyoruz. Deneysel bir tedavi lehine kanıt sunmak istiyoruz. Amaç, tedavi grubundaki farelerin, labirenti tedavi edilmeyen farelerden daha hızlı çözeceğini göstermektir.

instagram viewer

Konularımızla başlıyoruz: altı fare. Kolaylık için, farelere A, B, C, D, E, F harfleri ile atıf yapılacaktır. Bu farelerden üçü deneysel tedavi için rastgele seçilecek ve diğer üçü deneklerin plasebo aldığı bir kontrol grubuna konacaktır.

Daha sonra, farelerin labirenti çalıştırmak için seçildiği sırayı rastgele seçeceğiz. Tüm fareler için labirenti bitirmek için harcanan zaman not edilecek ve her grubun bir ortalaması hesaplanacaktır.

Rastgele seçimimizin deney grubunda A, C ve E fareleri olduğunu ve diğer farelerde plasebo kontrol grubu. Tedavi uygulandıktan sonra, farelerin labirentten geçmesi için rasgele seçiyoruz.

Farelerin her biri için çalışma süreleri:

  • Fare A yarışı 10 saniye içinde koşar
  • Fare B yarışı 12 saniyede koşar
  • Fare C yarışı 9 saniyede koşar
  • Fare D yarışı 11 saniyede koşar
  • Fare E yarışı 11 saniyede koşar
  • Fare F yarışı 13 saniyede tamamlar.

Deney grubundaki fareler için labirenti tamamlamak için ortalama süre 10 saniyedir. Kontrol grubundakiler için labirenti tamamlamak için ortalama süre 12 saniyedir.

Birkaç soru sorabiliriz. Tedavi gerçekten daha hızlı ortalama sürenin nedeni midir? Yoksa kontrol ve deney grubu seçimimizde şanslı mıydık? Tedavinin bir etkisi olmayabilir ve plasebo almak için yavaş fareleri ve tedaviyi almak için daha hızlı fareleri rastgele seçtik. Permütasyon testi bu soruları cevaplamaya yardımcı olacaktır.

hipotezler

Permütasyon testimiz için hipotezler:

  • sıfır hipotezi hiçbir etkisinin ifadesidir. Bu spesifik test için H0: Tedavi grupları arasında fark yoktur. Labirenti tedavi edilmeyen tüm fareler için ortalama süre, tedavi edilen tüm fareler için ortalama süre ile aynıdır.
  • Alternatif hipotez, lehine kanıt oluşturmaya çalıştığımız şeydir. Bu durumda, Hbir: Tedavisi olan tüm fareler için ortalama süre, tedavisiz tüm fareler için ortalama süreden daha hızlı olacaktır.

Permutasyonlar

Altı fare vardır ve deney grubunda üç yer vardır. Bu, olası deney grubu sayısının C (6,3) = 6! / (3! 3!) = 20 kombinasyon sayısı ile verildiği anlamına gelir. Geri kalan bireyler kontrol grubunun bir parçası olacaktır. Dolayısıyla, bireyleri iki grubumuza rastgele seçmenin 20 farklı yolu vardır.

Deney grubuna A, C ve E atamaları rastgele yapıldı. Bu tür 20 konfigürasyon olduğundan, deney grubunda A, C ve E ile spesifik olanın 1/20 =% 5 olma olasılığı vardır.

Çalışmamızdaki bireylerin deney grubunun 20 konfigürasyonunu da belirlememiz gerekmektedir.

  1. Deney grubu: A B C ve Kontrol grubu: D E F
  2. Deney grubu: A B D ve Kontrol grubu: C E F
  3. Deney grubu: A B E ve Kontrol grubu: C D F
  4. Deney grubu: A B F ve Kontrol grubu: C D E
  5. Deney grubu: A C D ve Kontrol grubu: B E F
  6. Deney grubu: A C E ve Kontrol grubu: B D F
  7. Deney grubu: A C F ve Kontrol grubu: B D E
  8. Deney grubu: A D E ve Kontrol grubu: B C F
  9. Deney grubu: A D F ve Kontrol grubu: B C E
  10. Deney grubu: A E F ve Kontrol grubu: B C D
  11. Deney grubu: B C D ve Kontrol grubu: A E F
  12. Deney grubu: B C E ve Kontrol grubu: A D F
  13. Deney grubu: B C F ve Kontrol grubu: A D E
  14. Deney grubu: B D E ve Kontrol grubu: A C F
  15. Deney grubu: BD F ve Kontrol grubu: A C E
  16. Deney grubu: B E F ve Kontrol grubu: A C D
  17. Deney grubu: C D E ve Kontrol grubu: A B F
  18. Deney grubu: C D F ve Kontrol grubu: A B E
  19. Deney grubu: C E F ve Kontrol grubu: A B D
  20. Deney grubu: D E F ve Kontrol grubu: A B C

Daha sonra deney ve kontrol gruplarının her bir konfigürasyonuna bakıyoruz. Yukarıdaki listede yer alan 20 permütasyonun her birinin ortalamasını hesaplıyoruz. Örneğin, birincisi için A, B ve C sırasıyla 10, 12 ve 9 zamanlarına sahiptir. Bu üç sayının ortalaması 10.3333'tür. Ayrıca bu ilk permütasyonda, D, E ve F'nin sırasıyla 11, 11 ve 13 zamanları vardır. Ortalama 11.6666.

Hesapladıktan sonra her grubun ortalaması, bu araçlar arasındaki farkı hesaplıyoruz. Aşağıdakilerin her biri, yukarıda listelenen deney ve kontrol grupları arasındaki farka karşılık gelir.

  1. Plasebo - Tedavi = 1.333333333 saniye
  2. Plasebo - Tedavi = 0 saniye
  3. Plasebo - Tedavi = 0 saniye
  4. Plasebo - Tedavi = -1.333333333 saniye
  5. Plasebo - Tedavi = 2 saniye
  6. Plasebo - Tedavi = 2 saniye
  7. Plasebo - Tedavi = 0.666666667 saniye
  8. Plasebo - Tedavi = 0.666666667 saniye
  9. Plasebo - Tedavi = -0.666666667 saniye
  10. Plasebo - Tedavi = -0.666666667 saniye
  11. Plasebo - Tedavi = 0.666666667 saniye
  12. Plasebo - Tedavi = 0.666666667 saniye
  13. Plasebo - Tedavi = -0.666666667 saniye
  14. Plasebo - Tedavi = -0.666666667 saniye
  15. Plasebo - Tedavi = -2 saniye
  16. Plasebo - Tedavi = -2 saniye
  17. Plasebo - Tedavi = 1.333333333 saniye
  18. Plasebo - Tedavi = 0 saniye
  19. Plasebo - Tedavi = 0 saniye
  20. Plasebo - Tedavi = -1.333333333 saniye

P-Değeri

Şimdi yukarıda belirttiğimiz her gruptan ortalamalar arasındaki farkları sıraladık. Ayrıca, ortalamalardaki her farkla temsil edilen 20 farklı konfigürasyonumuzun yüzdesini de tablo haline getiriyoruz. Örneğin, 20 kişiden dördünün kontrol ve tedavi grupları arasında hiçbir farkı yoktu. Bu, yukarıda belirtilen 20 yapılandırmanın% 20'sini oluşturur.

  • % 10 için -2
  • % 10 için -1.33
  • % 20 için -0.667
  • % 20 için 0
  • % 20 için 0.667
  • 1.33% 10 için
  • % 10 için 2.

Burada bu listeyi gözlemlediğimiz sonuçla karşılaştırıyoruz. Tedavi ve kontrol grupları için rastgele seçilmiş fareler ortalama 2 saniye fark ile sonuçlanmıştır. Ayrıca, bu farkın tüm olası örneklerin% 10'una karşılık geldiğini görüyoruz. Sonuç, bu çalışma için bir p-değeri % 10.