Apa itu Residual?

Regresi linier adalah alat statistik yang menentukan seberapa baik garis lurus cocok dengan satu set data berpasangan. Garis lurus yang paling cocok dengan data itu disebut garis regresi kuadrat terkecil. Baris ini dapat digunakan dalam beberapa cara. Salah satu kegunaan ini adalah untuk memperkirakan nilai dari variabel respon untuk nilai yang diberikan dari variabel penjelas. Terkait dengan ide ini adalah residual.

(1, 2), (2, 3), (3, 7), (3, 6), (4, 9), (5, 9)

Untuk menghitung sisa pada titik x = 5, kami mengurangi nilai prediksi dari nilai yang kami amati. Sejak y koordinat titik data kami adalah 9, ini memberikan sisa 9 - 10 = -1.

Ada beberapa kegunaan untuk residu. Salah satu penggunaannya adalah untuk membantu kita menentukan apakah kita memiliki kumpulan data yang memiliki tren linier secara keseluruhan, atau apakah kita harus mempertimbangkan model yang berbeda. Alasan untuk ini adalah bahwa residu membantu memperkuat pola nonlinier dalam data kami. Apa yang bisa sulit dilihat dengan melihat sebaran dapat lebih mudah diamati dengan memeriksa residu, dan plot residu yang sesuai.

instagram viewer

Alasan lain untuk mempertimbangkan residu adalah untuk memeriksa bahwa kondisi untuk kesimpulan untuk regresi linier terpenuhi. Setelah memverifikasi tren linier (dengan memeriksa residu), kami juga memeriksa distribusi residu. Untuk dapat melakukan inferensi regresi, kami ingin residu tentang garis regresi kami terdistribusi secara normal. SEBUAH histogram atau stemplot residu akan membantu memverifikasi bahwa kondisi ini telah terpenuhi.

instagram story viewer