Ada berbagai statistik deskriptif. Angka seperti rata-rata, median, mode, kecondongan, kurtosis, standar deviasi, kuartil pertama dan kuartil ketiga, untuk beberapa nama, masing-masing memberi tahu kami sesuatu tentang data kami. Daripada melihat ini Statistik deskriptif secara individual, terkadang menggabungkannya membantu memberi kita gambaran yang lengkap. Dengan tujuan ini, ringkasan lima angka adalah cara mudah untuk menggabungkan lima statistik deskriptif.
Lima Angka Yang Mana?
Jelas bahwa harus ada lima angka dalam ringkasan kami, tetapi lima yang mana? Angka-angka yang dipilih adalah untuk membantu kami mengetahui pusat data kami, serta bagaimana penyebaran titik data. Dengan mengingat hal ini, ringkasan lima angka terdiri dari yang berikut:
- Minimum - ini adalah nilai terkecil dalam kumpulan data kami.
- Kuartil pertama - angka ini dilambangkan Q1 dan 25% dari data kami berada di bawah kuartil pertama.
- Median - ini adalah titik tengah data. 50% dari semua data berada di bawah median.
- Kuartil ketiga - angka ini dilambangkan Q3 dan 75% dari data kami berada di bawah kuartil ketiga.
- Maksimum - ini adalah nilai terbesar dalam kumpulan data kami.
Deviasi rata-rata dan standar juga dapat digunakan bersama untuk menyampaikan pusat dan penyebaran satu set data. Namun, kedua statistik ini rentan terhadap pencilan. Median, kuartil pertama, dan kuartil ketiga tidak banyak dipengaruhi oleh outlier.
Sebuah contoh
Dengan serangkaian data berikut, kami akan melaporkan ringkasan lima angka:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Ada total dua puluh poin dalam dataset. Dengan demikian median adalah nilai rata-rata data kesepuluh dan kesebelas atau:
(7 + 8)/2 = 7.5.
Median bagian bawah data adalah kuartil pertama. Setengah bagian bawah adalah:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7
Demikian kami hitungQ1= (4 + 6)/2 = 5.
Median setengah bagian atas dari kumpulan data asli adalah kuartil ketiga. Kita perlu menemukan median:
8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Demikian kami hitungQ3= (15 + 15)/2 = 15.
Kami mengumpulkan semua hasil di atas bersama-sama dan melaporkan bahwa ringkasan lima angka untuk kumpulan data di atas adalah 1, 5, 7.5, 12, 20.
Representasi grafis
Lima ringkasan angka dapat dibandingkan satu sama lain. Kita akan menemukan bahwa dua set dengan cara yang sama dan standar deviasi mungkin memiliki rangkuman lima angka yang sangat berbeda. Untuk membandingkan dua ringkasan lima angka dengan mudah, kita dapat menggunakan a boxplot, atau grafik kotak dan kumis.