Kelas Histogram: Informasi dan Contoh

click fraud protection

Sebenarnya tidak ada aturan untuk berapa kelas yang harus ada. Ada beberapa hal yang perlu dipertimbangkan tentang jumlah kelas. Jika hanya ada satu kelas, maka semua data akan jatuh ke kelas ini. Histogram kami hanya akan menjadi persegi panjang tunggal dengan tinggi yang diberikan oleh jumlah elemen dalam set data kami. Ini tidak akan membuat sangat membantu atau histogram yang berguna.

Di sisi lain, kita bisa memiliki banyak kelas. Ini akan menghasilkan banyak bar, tidak ada yang mungkin akan sangat tinggi. Akan sangat sulit untuk menentukan karakteristik yang membedakan dari data dengan menggunakan jenis histogram ini.

Untuk menjaga dari dua ekstrem ini kami memiliki aturan praktis yang digunakan untuk menentukan jumlah kelas untuk histogram. Ketika kami memiliki satu set data yang relatif kecil, kami biasanya hanya menggunakan sekitar lima kelas. Jika kumpulan data relatif besar, maka kami menggunakan sekitar 20 kelas.

Sekali lagi, biarkan ditekankan bahwa ini adalah aturan praktis, bukan prinsip statistik absolut. Mungkin ada alasan bagus untuk memiliki jumlah kelas yang berbeda untuk data. Kita akan melihat contohnya di bawah ini.

instagram viewer

Sebelum kita mempertimbangkan beberapa contoh, kita akan melihat bagaimana menentukan kelas yang sebenarnya. Kami memulai proses ini dengan menemukan jarak dari data kami. Dengan kata lain, kami mengurangi nilai data terendah dari nilai data tertinggi.

Ketika kumpulan data relatif kecil, kami membagi rentang dengan lima. Hasil bagi adalah lebar kelas untuk histogram kami. Kita mungkin perlu melakukan pembulatan dalam proses ini, yang berarti bahwa jumlah total kelas mungkin tidak berakhir menjadi lima.

Ketika kumpulan data relatif besar, kami membagi rentang dengan 20. Seperti sebelumnya, masalah pembagian ini memberi kita lebar kelas untuk histogram kita. Juga, seperti yang kita lihat sebelumnya, pembulatan kita dapat menghasilkan sedikit lebih atau sedikit kurang dari 20 kelas.

Dalam kasus kumpulan data besar atau kecil, kami membuat kelas pertama dimulai pada titik sedikit kurang dari nilai data terkecil. Kita harus melakukan ini sedemikian rupa sehingga nilai data pertama jatuh ke dalam kelas pertama. Kelas berikutnya lainnya ditentukan oleh lebar yang ditetapkan ketika kami membagi rentang. Kami tahu bahwa kami berada di kelas terakhir ketika nilai data tertinggi kami terkandung oleh kelas ini.

Sebagai contoh, kita akan menentukan lebar kelas yang sesuai dan kelas untuk kumpulan data: 1.1, 1.9, 2.3, 3.0, 3.2, 4.1, 4.2, 4.4, 5.5, 5.5, 5.6, 5.7, 5.9, 6.2, 7.1, 7.9, 8.3, 9.0, 9.2, 11.1, 11.2, 14.4, 15.5, 15.5, 16.7, 18.9, 19.2.

Kami melihat bahwa ada 27 titik data di set kami. Ini adalah set yang relatif kecil sehingga kami akan membagi rentangnya dengan lima. Kisarannya adalah 19.2 - 1.1 = 18.1. Kami membagi 18.1 / 5 = 3.62. Ini berarti bahwa lebar kelas 4 akan sesuai. Nilai data terkecil kami adalah 1.1, jadi kami memulai kelas pertama pada titik yang kurang dari ini. Karena data kami terdiri dari angka-angka positif, masuk akal untuk membuat kelas pertama berubah dari 0 menjadi 4.

Untuk satu contohnya, anggaplah ada tes pilihan ganda dengan 35 pertanyaan di atasnya, dan 1000 siswa di sekolah menengah mengambil tes. Kami ingin membentuk histogram yang menunjukkan jumlah siswa yang mencapai skor tertentu dalam ujian. Kita melihat bahwa 35/5 = 7 dan 35/20 = 1.75. Terlepas dari aturan praktis kami yang memberi kami pilihan kelas lebar 2 atau 7 untuk digunakan untuk histogram kami, mungkin lebih baik memiliki kelas lebar 1. Kelas-kelas ini akan sesuai dengan setiap pertanyaan yang dijawab oleh siswa dengan benar pada tes. Yang pertama akan berpusat di 0 dan yang terakhir akan berpusat di 35.

instagram story viewer