Her birimiz kahvaltıda kaç kalori yedik? Bugün herkes evden ne kadar uzakta seyahat etti? Ev dediğimiz yer ne kadar büyük? Başka kaç kişi eve diyor? Tüm bu bilgileri anlamak için belirli araçlar ve düşünme yolları gereklidir. İstatistik adı verilen matematik bilimi, bu aşırı bilgi yüklemesi ile başa çıkmamıza yardımcı olan şeydir.
İstatistik, veri adı verilen sayısal bilginin incelenmesidir. İstatistikçiler veri toplar, organize eder ve analiz eder. Bu sürecin her bir kısmı da incelenir. İstatistik teknikleri diğer birçok bilgi alanına da uygulanır. Aşağıda, istatistikler boyunca bazı ana konulara giriş bulunmaktadır.
Popülasyonlar ve Örnekler
İstatistiğin tekrar eden temalarından biri, o grubun nispeten küçük bir kısmının çalışmasına dayanarak büyük bir grup hakkında bir şeyler söyleyebilmemizdir. Grup bir bütün olarak nüfus olarak bilinir. Grubun üzerinde çalıştığımız kısmı örneklem.
Bunun bir örneği olarak, ABD'de yaşayan insanların ortalama yüksekliğini bilmek istediğimizi varsayalım. 300 milyondan fazla insanı ölçmeye çalışabiliriz, ancak bu mümkün değildir. Ölçümleri hiç kimsenin kaçırmaması ve kimsenin iki kez sayılmaması için lojistik bir kabus olur.
Amerika Birleşik Devletleri'ndeki herkesi ölçmenin imkansız doğası nedeniyle, bunun yerine istatistikleri kullanabiliriz. Nüfustaki herkesin yüksekliklerini bulmak yerine, istatistiksel örnek birkaç bin. Popülasyonu doğru bir şekilde örneklediysek, örneğin ortalama yüksekliği, popülasyonun ortalama yüksekliğine çok yakın olacaktır.
Veri Toplama
İyi sonuçlar çıkarmak için birlikte çalışmamız gereken iyi verilere ihtiyacımız var. Bu verileri elde etmek için bir popülasyonu örnekleme şeklimiz her zaman incelenmelidir. Ne tür bir örnek kullandığımız popülasyon hakkında hangi soruyu sorduğumuza bağlıdır. En sık kullanılan örnekler:
- Basit Rastgele
- tabakalı
- kümelenmiş
Numunenin ölçümünün nasıl yapıldığını bilmek de eşit derecede önemlidir. Yukarıdaki örneğe geri dönmek için, örneğimizde bulunanların yüksekliklerini nasıl elde edebiliriz?
- İnsanların kendi boylarını bir ankette bildirmelerine izin veriyor muyuz?
- Ülke genelinde birkaç araştırmacı farklı insanları ölçüyor ve sonuçlarını rapor ediyor mu?
- Tek bir araştırmacı örnekteki herkesi aynı şerit ölçüsüyle ölçer mi?
Bu veri toplama yollarının her birinin avantajları ve dezavantajları vardır. Bu çalışmadaki verileri kullanan herkes, bunun nasıl elde edildiğini bilmek isteyecektir.
Verileri Düzenleme
Bazen çok sayıda veri vardır ve tüm ayrıntılarda tam anlamıyla kaybolabiliriz. Ağaçlar için ormanı görmek zor. Bu nedenle verilerimizi düzenli tutmak önemlidir. Dikkatli organizasyon ve grafik görüntüler verileriniz, gerçekte herhangi bir hesaplama yapmadan önce kalıpları ve eğilimleri tespit etmemize yardımcı olur.
Verilerimizi grafiksel olarak sunma şeklimiz çeşitli faktörlere bağlıdır. Ortak grafikler:
- Pasta grafikleri veya daire grafikleri
- Çubuk veya pareto grafikleri
- saçılım
- Zaman grafikleri
- Kök ve yaprak parselleri
- Kutu ve bıyık grafikleri
Bu iyi bilinen grafiklere ek olarak, özel durumlarda kullanılan diğerleri de vardır.
Tanımlayıcı istatistikler
Verileri analiz etmenin bir yoluna tanımlayıcı istatistikler denir. Burada amaç, verilerimizi tanımlayan miktarları hesaplamaktır. Sayılar ortalama olarak adlandırıldı, medyan ve modun tümü, ortalama veya verinin merkezi. Aralık ve standart sapma, verilerin ne kadar yayıldığını belirtmek için kullanılır. Gibi daha karmaşık teknikler bağıntı ve regresyon eşleştirilmiş verileri tanımlar.
Çıkarımsal istatistik
Bir örnekle başladığımızda ve sonra nüfus hakkında bir şey çıkarmaya çalıştığımızda, çıkarımsal istatistik. Bu istatistik alanıyla çalışırken, hipotez testi doğar. Burada, bir hipotez ifade ettiğimizde, istatistik konusunun bilimsel doğasını görüyoruz, hipotezi reddetme olasılığımızı belirlemek için örneğimizle birlikte istatistiksel araçlar veya değil. Bu açıklama gerçekten de istatistiklerin bu çok yararlı kısmının yüzeyini çiziyor.
İstatistik Uygulamaları
İstatistik araçlarının neredeyse her bilimsel araştırma alanı tarafından kullanıldığını söylemek abartı olmaz. İşte istatistiklere büyük ölçüde dayanan birkaç alan:
- Psikoloji
- ekonomi bilimi
- İlaç
- reklâm
- demografi
İstatistiğin Temelleri
Bazıları istatistiği bir matematik dalı olarak görseler de, onu matematik üzerine kurulmuş bir disiplin olarak düşünmek daha iyidir. Özellikle, istatistik olasılık olarak bilinen matematik alanından oluşturulur. Olasılık bize bir olayın gerçekleşme olasılığını belirlemenin bir yolunu sunar. Ayrıca, rastgelelik hakkında konuşmak için bir yol da verir. Bu, istatistiklerin anahtarıdır çünkü tipik örneğin popülasyondan rastgele seçilmesi gerekir.
Olasılık ilk olarak 1700'lü yıllarda matematikçiler tarafından paskal ve Fermat. 1700'ler de istatistiklerin başlangıcını işaret ediyordu. İstatistikler olasılık köklerinden büyümeye devam etti ve 1800'lerde gerçekten başladı. Bugün, teorik kapsamı matematiksel istatistik olarak bilinen alanda genişlemeye devam ediyor.