Ada banyak pertanyaan untuk ditanyakan ketika melihat sebaran. Salah satu yang paling umum adalah bertanya-tanya seberapa baik garis lurus mendekati data. Untuk membantu menjawab ini, ada statistik deskriptif yang disebut koefisien korelasi. Kami akan melihat bagaimana menghitung statistik ini.
Koefisien Korelasi
Itu koefisien korelasi, dilambangkan dengan r, memberitahu kita seberapa dekat data dalam a sebar jatuh di sepanjang garis lurus. Semakin dekat itu nilai absolut dari r adalah satu, semakin baik bahwa data dijelaskan oleh persamaan linier. Jika r = 1 atau r = -1 maka set data selaras sempurna. Set data dengan nilai r mendekati nol menunjukkan sedikit atau tidak ada hubungan garis lurus.
Karena perhitungannya yang panjang, yang terbaik adalah menghitung r dengan menggunakan kalkulator atau perangkat lunak statistik. Namun, selalu merupakan upaya yang bermanfaat untuk mengetahui apa yang dilakukan kalkulator Anda saat menghitung. Berikut ini adalah proses untuk menghitung koefisien korelasi terutama dengan tangan, dengan kalkulator yang digunakan untuk langkah aritmatika rutin.
Langkah-langkah untuk Menghitung r
Kami akan mulai dengan mendaftar langkah-langkah untuk perhitungan koefisien korelasi. Data yang kami kerjakan adalah data berpasangan, masing-masing pasangan akan dilambangkan dengan (xsaya, ysaya).
- Kami mulai dengan beberapa perhitungan pendahuluan. Kuantitas dari perhitungan ini akan digunakan pada langkah selanjutnya dari perhitungan kami untuk r:
- Hitung x̄, the berarti dari semua koordinat pertama data xsaya.
- Hitung ȳ, rata-rata dari semua koordinat kedua data
- ysaya.
- Menghitung s x contoh standar deviasi dari semua koordinat pertama data xsaya.
- Menghitung s y standar deviasi sampel dari semua koordinat kedua data ysaya.
- Gunakan formula (zx)saya = (xsaya - x̄) / s x dan menghitung nilai standar untuk masing-masing xsaya.
- Gunakan formula (zy)saya = (ysaya – ȳ) / s y dan menghitung nilai standar untuk masing-masing ysaya.
- Lipat gandakan nilai standar: (zx)saya(zy)saya
- Tambahkan produk dari langkah terakhir bersama.
- Bagi jumlah dari langkah sebelumnya dengan n - 1, dimana n adalah jumlah total poin dalam set data pasangan kami. Hasil dari semua ini adalah koefisien korelasi r.
Proses ini tidak sulit, dan setiap langkah cukup rutin, tetapi pengumpulan semua langkah ini cukup terlibat. Perhitungan standar deviasi cukup membosankan. Tetapi perhitungan koefisien korelasi tidak hanya melibatkan dua standar deviasi, tetapi banyak operasi lainnya.
Sebuah contoh
Untuk melihat persis bagaimana nilai r Diperoleh kita melihat contoh. Sekali lagi, penting untuk dicatat bahwa untuk aplikasi praktis kita ingin menggunakan kalkulator atau perangkat lunak statistik untuk menghitung r untuk kita.
Kita mulai dengan daftar data berpasangan: (1, 1), (2, 3), (4, 5), (5,7). Mean dari x nilai, rata-rata 1, 2, 4, dan 5 adalah x̄ = 3. Kami juga memiliki itu ȳ = 4. Standar deviasi dari
x nilai adalah sx = 1,83 dan sy = 2.58. Tabel di bawah ini merangkum perhitungan lain yang diperlukan untuk r. Jumlah produk di kolom paling kanan adalah 2.969848. Karena ada total empat poin dan 4 - 1 = 3, kami membagi jumlah produk dengan 3. Ini memberi kita koefisien korelasi r = 2.969848/3 = 0.989949.
Tabel untuk Contoh Perhitungan Koefisien Korelasi
x | y | zx | zy | zxzy |
---|---|---|---|---|
1 | 1 | -1.09544503 | -1.161894958 | 1.272792057 |
2 | 3 | -0.547722515 | -0.387298319 | 0.212132009 |
4 | 5 | 0.547722515 | 0.387298319 | 0.212132009 |
5 | 7 | 1.09544503 | 1.161894958 | 1.272792057 |