Rastgele Diziler İçin Çalıştırma Testi

Verilen veri dizisi, merak edebileceğimiz bir soru, dizinin şans olayları tarafından meydana gelip gelmediği veya verilerin rastgele olmadığıdır. Sadece verilere bakmak ve sadece tesadüfen üretilip üretilmediğini belirlemek çok zor olduğu için, rastgeleliği tanımlamak zordur. Bir dizinin gerçekten tesadüfen meydana gelip gelmediğini belirlemek için kullanılabilecek bir yönteme run testi denir.

Çalışma testi bir önem testi veya hipotez testi. Bu testin prosedürü, belirli bir özelliğe sahip olan bir veri dizisine veya sırasına dayanmaktadır. Koşu testinin nasıl çalıştığını anlamak için, önce koşu kavramını incelemeliyiz.

Veri Dizileri

Bir koşu örneğine bakarak başlayacağız. Aşağıdaki rastgele basamak dizisini göz önünde bulundurun:

6 2 7 0 0 1 7 3 0 5 0 8 4 6 8 7 0 6 5 5

Bu rakamları sınıflandırmanın bir yolu, onları (0, 2, 4, 6 ve 8 rakamları dahil) veya tek (1, 3, 5, 7 ve 9 rakamları dahil) olmak üzere iki kategoriye ayırmaktır. Rastgele rakamların sırasına bakacağız ve çift sayıları E ve tek sayıları O olarak göstereceğiz:

instagram viewer

E E O E E O O E O E E E E E O E E O O

Tüm OS'lerin birlikte ve tüm Es'lerin birlikte olması için bunu yeniden yazıp yazmadığımızı görmek daha kolaydır:

EE O EE OO E O EEEEE O EE OO

Çift veya tek sayıların blok sayısını sayıyoruz ve veriler için toplam on çalışma olduğunu görüyoruz. Dört koşunun uzunluğu bir, beşinin uzunluğu iki ve birinin uzunluğu beş

Koşullar

Herhangi biri ile önem testi, testi gerçekleştirmek için hangi koşulların gerekli olduğunu bilmek önemlidir. Çalışma testi için, numunedeki her bir veri değerini iki kategoriden birine ayırabileceğiz. Her bir kategoriye giren veri değerlerinin sayısına göre toplam çalıştırma sayısını sayacağız.

Test bir iki taraflı test. Bunun nedeni, çok az sayıda çalışmanın, muhtemelen yeterli bir varyasyon olmadığı ve rastgele bir işlemden kaynaklanacak çalıştırma sayısının olduğu anlamına gelir. Bir işlem, kategoriler arasında tesadüfen tanımlanamayacak kadar sık ​​aralıklarla değiştiğinde çok fazla çalışma oluşur.

Hipotezler ve P-Değerleri

Her anlamlılık testi bir null ve alternatif bir hipotez. Çalışma testi için sıfır hipotezi, dizinin rastgele bir dizi olduğudur. Alternatif hipotez, örnek veri dizisinin rastgele olmadığıdır.

İstatistiksel yazılım hesaplayabilir p-değeri belirli bir test istatistiğine karşılık gelir. Belirli bir noktada kritik sayılar veren tablolar da vardır. önem seviyesi toplam koşu sayısı için.

Test Örneği

Çalışma testinin nasıl çalıştığını görmek için aşağıdaki örnek üzerinde çalışacağız. Bir ödev için bir öğrenciden 16 kez bozuk para çevirmesini ve ortaya çıkan kafaların ve kuyrukların sırasını not etmesinin istendiğini varsayalım. Bu veri kümesiyle sonuçlanırsak:

H T H H H T T H H T T H T H T H H

Öğrencinin ödevini gerçekten yapıp yapmadığını sorabilir miyiz, yoksa rasgele görünen bir dizi H ve T mi kandırıp yazdı? Koşu testi bize yardımcı olabilir. Veriler kafa veya kuyruk olarak iki gruba ayrılabileceğinden, çalışma testi için varsayımlar karşılanır. Koşu sayısını sayarak devam ediyoruz. Yeniden gruplandırırken aşağıdakileri görüyoruz:

H T HHH TT H TT H T H T HH

Verilerimiz için on kuyruk vardır, yedi kuyruk dokuz kafa vardır.

Sıfır hipotezi verinin rastgele olduğudur. Alternatif, rastgele olmamasıdır. Alfa'nın 0.05'e eşit bir önem seviyesi için, çalışma sayısı 4'ten az ya da 16'dan büyük olduğunda sıfır hipotezini reddettiğimiz uygun tabloya başvurarak görürüz. Verilerimizde on çalışma olduğu için reddetmek sıfır hipotezi H0.

Normal Yaklaşım

Çalıştırma testi, bir dizinin rastgele olup olmayacağını belirlemek için yararlı bir araçtır. Büyük bir veri kümesi için bazen normal bir yaklaşım kullanmak mümkündür. Bu normal yaklaşım, her bir kategorideki öğe sayısını kullanmamızı ve ardından uygun olanın ortalama ve standart sapmasını hesaplamamızı gerektirir. normal dağılım.

instagram story viewer