Bazı veri dağıtımları, örneğin Çan eğrisi veya normal dağılım, simetrik. Bu, dağılımın sağının ve solunun birbirinin mükemmel ayna görüntüleri olduğu anlamına gelir. Her veri dağılımı simetrik değildir. Simetrik olmayan veri kümelerinin asimetrik olduğu söylenir. Bir dağılımın nasıl asimetrik olabileceğinin ölçüsüne çarpıklık denir.
Ortalama, medyan ve mod hepsi merkezin ölçüleri veri kümesi. Verilerin çarpıklığı, bu miktarların birbiriyle nasıl ilişkili olduğu ile belirlenebilir.
Sağa Eğik
Sağa eğik olan verilerin sağa uzanan uzun bir kuyruğu vardır. Sağa eğilmiş bir veri kümesi hakkında konuşmanın alternatif bir yolu, bunun eğri olduğunu söylemektir. Bu durumda, ortalama ve medyan ikisi de moddan daha büyüktür. Genel bir kural olarak, çoğu zaman sağa eğilmiş veriler için ortalama medyandan daha büyük olacaktır. Özetle, sağ tarafa eğilmiş bir veri kümesi için:
- Her zaman: moddan daha büyük demektir
- Her zaman: medyan moddan daha büyük
- Çoğu zaman: ortalama medyandan daha büyük
Sola Eğik
Sola eğilmiş verilerle uğraştığımızda durum tersine dönüyor. Sola eğilmiş olan veriler, sola doğru uzanan uzun bir kuyruğa sahiptir. Sola eğilmiş bir veri kümesinden bahsetmenin alternatif bir yolu, negatif eğimli olduğunu söylemektir. Bu durumda, hem ortalama hem de medyan moddan daha azdır. Genel bir kural olarak, çoğu zaman sola eğilmiş veriler için, ortalama medyandan daha az olacaktır. Özetle, sola eğilmiş bir veri kümesi için:
- Her zaman: moddan daha az anlamına gelir
- Her zaman: medyan moddan daha az
- Çoğu zaman: ortalama medyandan daha az
Çarpıklık Ölçüleri
İki veri kümesine bakmak ve birinin simetrik, diğerinin asimetrik olduğunu belirlemek bir şeydir. İki asimetrik veri kümesine bakmak ve birinin diğerinden daha çarpık olduğunu söylemek başka bir şeydir. Sadece dağılım grafiğine bakarak hangisinin daha çarpık olduğunu belirlemek çok öznel olabilir. Bu yüzden çarpıklık ölçüsünü sayısal olarak hesaplamanın yolları vardır.
Pearson’un ilk çarpıklık katsayısı adı verilen bir çarpıklık ölçüsü, ortalamayı moddan çıkarmak ve daha sonra bu farkı standart sapma veri. Farkı bölmenin nedeni, boyutsuz bir miktara sahip olmamızdır. Bu, sağda eğriltilmiş verilerin neden olumlu eğriliğe sahip olduğunu açıklar. Veri kümesi sağa eğilirse, ortalama moddan daha büyüktür ve bu nedenle modu ortalamadan çıkarmak pozitif bir sayı verir. Benzer bir argüman, sola eğilmiş verilerin neden negatif eğriliğe sahip olduğunu açıklar.
Pearson’un ikinci çarpıklık katsayısı da bir veri kümesinin asimetrisini ölçmek için kullanılır. Bu miktar için, modu medyandan çıkarırız, bu sayıyı üç ile çarparız ve sonra standart sapmaya böleriz.
Çarpık Veri Uygulamaları
Çarpık veriler çeşitli durumlarda oldukça doğal olarak ortaya çıkar. Gelirler sağa çarpıktır, çünkü milyonlarca dolar kazanan birkaç kişi bile ortalamayı büyük ölçüde etkileyebilir ve olumsuz gelirler yoktur. Benzer şekilde, bir ampul markası gibi bir ürünün ömrünü içeren veriler sağa eğilir. Burada bir ömür boyu en küçük sıfırdır ve uzun ömürlü ampuller verilere olumlu bir çarpıklık verecektir.