logo

Sağa Çarpık Dağılım: Ne Anlama Geliyor?

feature_right_skewed_histogram

İstatistik mi okuyorsunuz? Verileri açıklarken muhtemelen 'normal dağılım' ifadesini duymuşsunuzdur. Peki 'sağa çarpık' ifadesine ne dersiniz? Sağa çarpık bir histogram neye benzer? Peki buna ne sebep oluyor?

Bu yazımızda size sağa çarpık histogram örnekleri vereceğiz ve bunların normal dağılım grafiklerinden nasıl farklı olduğunu açıklayacağız.

Özellik resmi: Monika'nın Yeri /Wikimedia Commons

Normal Dağılım Nedir?

Verilerin sağa çarpık olmasının ne anlama geldiğini açıklamadan önce normal dağılımın tanımını gözden geçirelim.

Normal dağılımla, iki veya daha fazla değişkenin doğrudan bir ilişkiyi paylaşması simetrik veri seti , sol yarı sağ yarıyı yansıtır. Bu grafiklere denir çan eğrileri açıkça tanımlanmış, çan benzeri şekilleri nedeniyle:

body_normal_distribution-300x215

Normal dağılım grafiğinde, ortalama (ortalama), medyan ve modun tümü eşittir . Bu noktaların tümü verinin merkezini veya grafiğin zirvesini temsil eder.

Sağa Çarpık Ne Demektir?

Normal dağılım en yaygın dağılım biçimlerinden biri olmasına rağmen tüm veri setleri bu temel eğriyi takip etmez. Başka bir deyişle, bazı histogramlar sağa veya sola çarpık .

Sağa çarpık dağılımda ('pozitif çarpık' dağılım olarak da bilinir), çoğu veri grafiğin zirvesinin sağına veya pozitif tarafına düşer. Böylece, histogram, sağ tarafı (veya 'kuyruğu') sol tarafından daha uzun olacak şekilde eğilir.

body_right_skewed_histogram

Sağa çarpık histogram örneği.

Sağa çarpık bir histogramda ortalama, medyan ve mod farklıdır. Bu durumda, mod histogramın en yüksek noktasıdır, medyan ve ortalama ise bunun sağına (veya görsel olarak tepe noktasının sağına) düşer. Dikkat ortalama irade Her zaman medyanın sağında olmak .

body_skewed_right_left

Grafik A sağa çarpık, Grafik B ise sola çarpıktır. Sağa çarpık grafiklerde ortalama her zaman modun (yani tepe noktasının) sağında gelir. ( Giderse /Wikimedia Commons) )

Bu özellikler sonuçta onu tipik bir değer atamak zor Çünkü sağa çarpık bir grafikte net bir merkez nokta yoktur. Bunun aksine, normal dağılımda ortalama, medyan ve mod eşit olduğundan ve veri kümesinin merkezinde yer aldığından, verileri daha doğru bir şekilde genelleştirmek için bu değeri kolayca kullanabilirsiniz.

Sağa Eğik Histogramın Sebebi Nedir?

Sağa çarpık veriler genellikle bir veri setindeki alt sınırın bir sonucu (oysa sola çarpık veriler daha yüksek bir sınırın sonucudur). Yani eğer veri setinin alt sınırları verinin geri kalanına göre çok düşükse bu durum verinin sağa doğru kaymasına neden olur.

Çarpıklığın bir diğer nedeni ise başlangıç ​​efektleri . Örneğin, bir prosedür başlangıçta uzun bir başlangıç ​​döneminde çok fazla başarıya sahipse, bu durum veriler üzerinde olumlu bir çarpıklık yaratabilir. (Diğer yandan, birkaç başlangıç ​​başarısızlığının olduğu bir başlangıç ​​dönemi, verileri olumsuz yönde çarpıtabilir.)