Inilah Cara Membuat Boxplot

Boxplots mendapatkan namanya dari apa yang mereka sukai. Mereka kadang-kadang disebut sebagai plot kotak dan kumis. Jenis grafik ini digunakan untuk menampilkan rentang, median, dan kuartil. Ketika mereka selesai, sebuah kotak berisi kuartil pertama dan ketiga. Kumis diperluas dari kotak ke nilai minimum dan maksimum data.

Halaman-halaman berikut akan menunjukkan cara membuat boxplot untuk satu set data dengan minimum 20, kuartil pertama 25, median 32, kuartil ketiga 35 dan maksimum 43.

Gambar lima garis vertikal di atas garis angka, satu untuk masing-masing nilai minimum, kuartil pertama, median, kuartil ketiga, dan maksimum. Biasanya garis untuk minimum dan maksimum lebih pendek dari garis untuk kuartil dan median.

Untuk data kami, minimum adalah 20, kuartil pertama adalah 25, median adalah 32, kuartil ketiga adalah 35 dan maksimum adalah 43. Garis yang sesuai dengan nilai-nilai ini digambarkan di atas.

Selanjutnya, kita menggambar sebuah kotak dan menggunakan beberapa garis untuk memandu kita. Kuartil pertama adalah sisi kiri kotak kami. Kuartil ketiga adalah sisi kanan kotak kami. Median jatuh di mana saja di dalam kotak.

instagram viewer

Dengan definisi kuartil pertama dan ketiga, setengah dari semua nilai data terkandung di dalam kotak.

Sekarang kita melihat bagaimana grafik kotak dan kumis mendapatkan bagian kedua dari namanya. Kumis ditarik untuk menunjukkan kisaran data. Gambar garis horizontal dari garis untuk minimum ke sisi kiri kotak di kuartil pertama. Ini adalah salah satu kumis kami. Gambar garis horizontal kedua dari sisi kanan kotak di kuartil ketiga ke garis yang mewakili maksimum data. Ini kumis kedua kita.

Grafik kotak dan kumis kami, atau boxplot, sekarang lengkap. Sekilas, kita bisa menentukan kisaran nilai data, dan sejauh mana semuanya terkumpul. Langkah selanjutnya menunjukkan bagaimana kita dapat membandingkan dan membedakan dua plot kotak.

Grafik kotak dan kumis menampilkan ringkasan lima angka dari sekumpulan data. Dengan demikian, dua set data yang berbeda dapat dibandingkan dengan memeriksa kotak-kotaknya bersama-sama. Di atas plot box kedua telah ditarik di atas plot yang telah kami bangun.

Ada beberapa fitur yang pantas disebutkan. Yang pertama adalah bahwa median dari kedua set data identik. Garis vertikal di dalam kedua kotak berada di tempat yang sama pada garis bilangan. Hal kedua yang perlu diperhatikan tentang grafik dua kotak dan kumis adalah bahwa plot teratas tidak tersebar di bagian bawah. Kotak atas lebih kecil dan kumis tidak memanjang sejauh.

Menggambar dua plot kotak di atas garis angka yang sama mengandaikan bahwa data di balik masing-masing layak untuk dibandingkan. Tidak masuk akal untuk membandingkan sebidang peti kemas anak kelas tiga dengan bobot anjing di tempat penampungan lokal. Meskipun keduanya berisi data pada rasio tingkat pengukuran, tidak ada alasan untuk membandingkan data.

Di sisi lain, masuk akal untuk membandingkan plot-plot box dari ketinggian kelas tiga jika satu plot mewakili data dari anak laki-laki di sekolah, dan plot lainnya mewakili data dari anak perempuan di sekolah.