Beberapa distribusi data, seperti kurva lonceng atau distribusi normal, simetris. Ini berarti bahwa kanan dan kiri distribusi adalah gambar cermin sempurna satu sama lain. Tidak setiap distribusi data simetris. Set data yang tidak simetris dikatakan asimetris. Ukuran bagaimana distribusi asimetris dapat disebut skewness.
Rata-rata, median dan mode semuanya ukuran pusat satu set data. Kecenderungan data dapat ditentukan oleh bagaimana jumlah ini terkait satu sama lain.
Condong ke Kanan
Data yang condong ke kanan memiliki ekor panjang yang meluas ke kanan. Cara alternatif untuk berbicara tentang kumpulan data yang condong ke kanan adalah dengan mengatakan bahwa itu miring secara positif. Dalam situasi ini, berarti dan median keduanya lebih besar dari mode. Sebagai aturan umum, sebagian besar waktu untuk data condong ke kanan, rata-rata akan lebih besar daripada median. Singkatnya, untuk kumpulan data yang condong ke kanan:
- Selalu: berarti lebih besar dari mode
- Selalu: median lebih besar dari mode
- Sebagian besar waktu: berarti lebih besar dari median
Condong ke Kiri
Situasi terbalik sendiri ketika kita berurusan dengan data yang condong ke kiri. Data yang condong ke kiri memiliki ekor panjang yang memanjang ke kiri. Cara alternatif untuk berbicara tentang kumpulan data yang condong ke kiri adalah dengan mengatakan bahwa itu miring secara negatif. Dalam situasi ini, rata-rata dan median keduanya kurang dari mode. Sebagai aturan umum, sebagian besar waktu untuk data condong ke kiri, rata-rata akan kurang dari median. Singkatnya, untuk kumpulan data yang condong ke kiri:
- Selalu: berarti kurang dari mode
- Selalu: median kurang dari mode
- Sebagian besar waktu: berarti kurang dari median
Ukuran Skewness
Satu hal untuk melihat dua set data dan menentukan bahwa satu simetris sementara yang lainnya asimetris. Merupakan hal lain untuk melihat dua set data asimetris dan mengatakan bahwa yang satu lebih condong daripada yang lain. Dapat sangat subyektif untuk menentukan mana yang lebih condong dengan hanya melihat grafik distribusi. Inilah sebabnya mengapa ada cara untuk menghitung secara numerik ukuran skewness.
Salah satu ukuran skewness, disebut koefisien skewness pertama Pearson, adalah dengan mengurangi mean dari mode, dan kemudian membagi perbedaan ini dengan standar deviasi dari data. Alasan untuk membagi perbedaan adalah agar kita memiliki kuantitas tanpa dimensi. Ini menjelaskan mengapa data yang condong ke kanan memiliki kecenderungan positif. Jika kumpulan data miring ke kanan, rerata lebih besar dari mode, dan dengan demikian mengurangi mode dari rerata memberikan angka positif. Argumen serupa menjelaskan mengapa data condong ke kiri memiliki kecenderungan negatif.
Koefisien kemiringan kedua Pearson juga digunakan untuk mengukur asimetri dari kumpulan data. Untuk kuantitas ini, kita kurangi mode dari median, kalikan angka ini dengan tiga dan kemudian bagi dengan standar deviasi.
Aplikasi Data yang Timpang
Data miring muncul secara alami dalam berbagai situasi. Penghasilan miring ke kanan karena bahkan hanya beberapa individu yang menghasilkan jutaan dolar dapat sangat mempengaruhi rata-rata, dan tidak ada pendapatan negatif. Demikian pula, data yang melibatkan masa pakai suatu produk, seperti merek bola lampu, condong ke kanan. Di sini yang terkecil yang bisa seumur hidup adalah nol, dan bola lampu tahan lama akan memberikan kecenderungan positif pada data.