Terkadang dalam statistik, sangat membantu untuk melihat contoh masalah yang berhasil. Contoh-contoh ini dapat membantu kita dalam mencari tahu masalah yang sama. Dalam artikel ini, kita akan berjalan melalui proses melakukan statistik inferensial untuk hasil mengenai dua mean populasi. Kita tidak hanya akan melihat bagaimana melakukan a uji hipotesis tentang perbedaan dua populasi berarti, kami juga akan membangun a interval kepercayaan untuk perbedaan ini. Metode yang kami gunakan kadang-kadang disebut uji dua sampel dan interval kepercayaan dua sampel.
Pernyataan Masalah
Misalkan kita ingin menguji kemampuan matematika anak-anak sekolah dasar. Satu pertanyaan yang mungkin kita miliki adalah apakah tingkat kelas yang lebih tinggi memiliki skor tes rata-rata yang lebih tinggi.
Sampel acak sederhana dari 27 siswa kelas tiga diberikan tes matematika, jawaban mereka diberi skor, dan hasilnya ditemukan memiliki skor rata-rata 75 poin dengan standar deviasi sampel 3 poin.
Sampel acak sederhana dari 20 siswa kelas lima diberikan tes matematika yang sama dan jawaban mereka diberi skor. Nilai rata-rata untuk siswa kelas V adalah 84 poin dengan sampel standar deviasi 5 poin.
Dengan skenario ini, kami mengajukan pertanyaan berikut:
- Apakah data sampel memberi kita bukti bahwa skor tes rata-rata populasi semua siswa kelas lima melebihi nilai tes rata-rata populasi semua siswa kelas tiga?
- Apa interval kepercayaan 95% untuk perbedaan dalam nilai tes rata-rata antara populasi siswa kelas tiga dan lima?
Ketentuan dan Prosedur
Kita harus memilih prosedur mana yang akan digunakan. Dalam melakukan ini, kita harus memastikan dan memeriksa bahwa kondisi untuk prosedur ini telah dipenuhi. Kami diminta untuk membandingkan dua cara populasi. Satu kumpulan metode yang dapat digunakan untuk melakukan ini adalah untuk prosedur dua sampel t.
Untuk menggunakan prosedur-t ini untuk dua sampel, kita perlu memastikan bahwa kondisi berikut berlaku:
- Kami memiliki dua sampel acak sederhana dari dua populasi yang menarik.
- Sampel acak sederhana kami tidak mewakili lebih dari 5% populasi.
- Dua sampel independen satu sama lain, dan tidak ada kecocokan antara subjek.
- Variabel terdistribusi normal.
- Baik mean populasi dan standar deviasi tidak diketahui untuk kedua populasi.
Kami melihat bahwa sebagian besar kondisi ini terpenuhi. Kami diberitahu bahwa kami memiliki sampel acak sederhana. Populasi yang kami pelajari adalah besar karena ada jutaan siswa di tingkat kelas ini.
Kondisi yang tidak dapat kami asumsikan secara otomatis adalah jika skor tes didistribusikan secara normal. Karena kami memiliki ukuran sampel yang cukup besar, dengan kekokohan prosedur-t kami, kami tidak perlu variabel untuk didistribusikan secara normal.
Karena kondisinya terpenuhi, kami melakukan beberapa perhitungan pendahuluan.
Kesalahan Standar
Kesalahan standar adalah perkiraan standar deviasi. Untuk statistik ini, kami menambahkan varians sampel dari sampel dan kemudian mengambil akar kuadrat. Ini memberikan rumus:
(s1 2 / n1 + s22 / n2)1/2
Dengan menggunakan nilai-nilai di atas, kita melihat bahwa nilai kesalahan standar adalah
(32 / 27+ 52 / 20)1/2 =(1 / 3 + 5 / 4 )1/2 = 1.2583
Derajat kebebasan
Kita dapat menggunakan pendekatan konservatif untuk kita derajat kebebasan. Ini mungkin meremehkan jumlah derajat kebebasan, tetapi jauh lebih mudah untuk menghitung daripada menggunakan rumus Welch. Kami menggunakan yang lebih kecil dari dua ukuran sampel, dan kemudian kurangi satu dari jumlah ini.
Sebagai contoh kami, yang lebih kecil dari dua sampel adalah 20. Ini berarti bahwa jumlah derajat kebebasan adalah 20 - 1 = 19.
Uji Hipotesis
Kami ingin menguji hipotesis bahwa siswa kelas lima memiliki skor tes rata-rata yang lebih besar daripada skor rata-rata siswa kelas tiga. Biarkan μ1 menjadi skor rata-rata populasi semua siswa kelas lima. Demikian pula, kita membiarkan μ2 menjadi skor rata-rata populasi semua siswa kelas tiga.
Hipotesisnya adalah sebagai berikut:
- H0: μ1 - μ2 = 0
- HSebuah: μ1 - μ2 > 0
Statistik uji adalah perbedaan antara rata-rata sampel, yang kemudian dibagi dengan kesalahan standar. Karena kami menggunakan standar deviasi sampel untuk memperkirakan standar deviasi populasi, statistik uji dari t-distribusi.
Nilai statistik uji adalah (84 - 75) /1.2583. Ini sekitar 7.15.
Kami sekarang menentukan apa nilai p untuk tes hipotesis ini. Kami melihat nilai statistik uji, dan di mana ini terletak pada distribusi-t dengan 19 derajat kebebasan. Untuk distribusi ini, kami memiliki 4,2 x 10-7 sebagai nilai p kami. (Salah satu cara untuk menentukan ini adalah dengan menggunakan fungsi T.DIST.RT di Excel.)
Karena kami memiliki nilai p yang kecil, kami menolak hipotesis nol. Kesimpulannya adalah bahwa nilai tes rata-rata untuk siswa kelas lima lebih tinggi daripada nilai tes rata-rata untuk siswa kelas tiga.
Interval Keyakinan
Karena kami telah menetapkan bahwa ada perbedaan antara skor rata-rata, kami sekarang menentukan interval kepercayaan untuk perbedaan antara dua rata-rata ini. Kami sudah memiliki banyak hal yang kami butuhkan. Interval kepercayaan untuk perbedaan perlu memiliki estimasi dan margin kesalahan.
Perkiraan untuk perbedaan dua cara mudah untuk dihitung. Kami hanya menemukan perbedaan mean sampel. Perbedaan dari sampel berarti memperkirakan perbedaan dari populasi berarti.
Untuk data kami, perbedaan dalam mean sampel adalah 84 - 75 = 9.
Margin of error sedikit lebih sulit untuk dihitung. Untuk ini, kita perlu mengalikan statistik yang sesuai dengan kesalahan standar. Statistik yang kita butuhkan ditemukan dengan berkonsultasi dengan tabel atau perangkat lunak statistik.
Sekali lagi menggunakan perkiraan konservatif, kami memiliki 19 derajat kebebasan. Untuk interval kepercayaan 95% kita melihat bahwa t* = 2.09. Kita bisa menggunakan Fungsi T.INV di Kell untuk menghitung nilai ini.
Kami sekarang menggabungkan semuanya dan melihat bahwa margin kesalahan kami adalah 2,09 x 1,2583, yaitu sekitar 2,63. Interval kepercayaan adalah 9 ± 2.63. Intervalnya adalah 6,37 hingga 11,63 poin pada tes yang dipilih siswa kelas lima dan tiga.