Salah satu tujuan statistik adalah organisasi dan tampilan data. Sering kali salah satu cara untuk melakukan ini adalah menggunakan a grafik, bagan atau tabel. Saat bekerja dengan data berpasangan, jenis grafik yang berguna adalah sebar. Jenis grafik ini memungkinkan kita untuk mengeksplorasi data dengan mudah dan efektif dengan memeriksa hamburan titik-titik di pesawat.
Data yang Dipasangkan
Patut digarisbawahi bahwa sebar adalah jenis grafik yang digunakan untuk data berpasangan. Ini adalah jenis kumpulan data di mana setiap titik data kami memiliki dua angka yang terkait dengannya. Contoh umum dari pasangan tersebut meliputi:
- Pengukuran sebelum dan sesudah perawatan. Ini bisa berbentuk performa siswa pada pretest dan kemudian posttest.
- Desain eksperimental berpasangan yang cocok. Di sini satu individu dalam kelompok kontrol dan individu lain yang serupa dalam kelompok perlakuan.
- Dua pengukuran dari individu yang sama. Sebagai contoh, kami dapat mencatat berat dan tinggi 100 orang.
Grafik 2D
Kanvas kosong yang akan kita mulai dengan scatterplot kita adalah sistem koordinat Cartesian. Ini juga disebut sistem koordinat persegi panjang karena fakta bahwa setiap titik dapat ditemukan dengan menggambar persegi panjang tertentu. Sistem koordinat persegi panjang dapat diatur oleh:
- Dimulai dengan garis angka horisontal. Ini disebut x-sumbu.
- Tambahkan garis angka vertikal. Persimpangan x-sumbu sedemikian rupa sehingga titik nol dari kedua garis berpotongan. Baris nomor kedua ini disebut y-sumbu.
- Titik di mana nol dari garis bilangan kami bersilangan disebut asal.
Sekarang kita dapat memplot poin data kita. Angka pertama dalam pasangan kami adalah x-koordinat. Ini adalah jarak horizontal dari sumbu y, dan karenanya juga asalnya. Kami bergerak ke kanan untuk nilai positif x dan di sebelah kiri titik asal untuk nilai negatif dari x.
Angka kedua dalam pasangan kami adalah y-koordinat. Itu adalah jarak vertikal dari sumbu x. Mulai dari titik awal di x-axis, naik untuk nilai positif y dan turun untuk nilai negatif dari y.
Lokasi pada grafik kami kemudian ditandai dengan titik. Kami mengulangi proses ini berulang-ulang untuk setiap titik dalam kumpulan data kami. Hasilnya adalah hamburan poin, yang memberikan sebaran namanya.
Penjelasan dan Respon
Salah satu instruksi penting yang tersisa adalah untuk berhati-hati variabel mana pada sumbu mana. Jika data berpasangan kami terdiri dari jelas dan respons berpasangan, maka variabel penjelas ditunjukkan pada sumbu x. Jika kedua variabel dianggap sebagai penjelas, maka kita dapat memilih mana yang akan diplot pada sumbu x dan yang mana pada y-sumbu.
Fitur Scatterplot
Ada beberapa fitur penting dari sebar. Dengan mengidentifikasi sifat-sifat ini, kami dapat mengungkap lebih banyak informasi tentang kumpulan data kami. Fitur-fitur ini termasuk:
- Tren keseluruhan di antara variabel-variabel kami. Ketika kita membaca dari kiri ke kanan, apa gambaran besarnya? Pola ke atas, ke bawah atau siklus?
- Pencilan apa pun dari tren keseluruhan. Apakah ini pencilan dari sisa data kami, atau apakah itu poin yang berpengaruh?
- Bentuk tren apa pun. Apakah ini linear, eksponensial, logaritmik, atau lainnya?
- Kekuatan tren apa pun. Seberapa dekat data tersebut cocok dengan pola keseluruhan yang kami identifikasi?
Topik-topik yang berkaitan
Scatterplots yang menunjukkan tren linier dapat dianalisis dengan teknik statistikregresi linier dan korelasi. Regresi dapat dilakukan untuk jenis tren lain yang nonlinier.