Interval kepercayaan diri dapat digunakan untuk memperkirakan beberapa populasi parameter. Salah satu jenis parameter yang dapat diperkirakan menggunakan statistik inferensial adalah proporsi populasi. Misalnya, kami mungkin ingin mengetahui persentase populasi A.S. yang mendukung undang-undang tertentu. Untuk jenis pertanyaan ini, kita perlu menemukan interval kepercayaan.
Pada artikel ini, kita akan melihat bagaimana membangun interval kepercayaan untuk proporsi populasi, dan memeriksa beberapa teori di balik ini.
Kerangka Keseluruhan
Kita mulai dengan melihat gambaran besar sebelum kita masuk ke spesifik. Jenis interval kepercayaan yang akan kita pertimbangkan adalah dalam bentuk berikut:
Perkirakan +/- Margin of Error
Ini berarti bahwa ada dua angka yang perlu kita tentukan. Nilai-nilai ini merupakan estimasi untuk parameter yang diinginkan, bersama dengan margin of error.
Kondisi
Sebelum melakukan uji statistik atau prosedur apa pun, penting untuk memastikan bahwa semua persyaratan terpenuhi. Untuk interval kepercayaan untuk proporsi populasi, kita perlu memastikan bahwa penahanan berikut:
- Kita punya sebuah sampel acak sederhana ukuran n dari populasi besar
- Individu kita telah dipilih secara independen satu sama lain.
- Setidaknya ada 15 keberhasilan dan 15 kegagalan dalam sampel kami.
Jika item terakhir tidak puas, maka mungkin untuk menyesuaikan sampel kami sedikit dan menggunakan a ditambah empat interval kepercayaan. Dalam apa yang berikut, kami akan menganggap bahwa semua kondisi di atas telah dipenuhi.
Proporsi Sampel dan Populasi
Kami mulai dengan estimasi proporsi populasi kami. Seperti halnya kita menggunakan mean sampel untuk memperkirakan rata-rata populasi, kita menggunakan proporsi sampel untuk memperkirakan proporsi populasi. Proporsi populasi adalah parameter yang tidak diketahui. Proporsi sampel adalah statistik. Statistik ini ditemukan dengan menghitung jumlah keberhasilan dalam sampel kami dan kemudian membaginya dengan jumlah total individu dalam sampel.
Proporsi populasi dilambangkan dengan hal dan sudah jelas. Notasi untuk proporsi sampel sedikit lebih terlibat. Kami menunjukkan proporsi sampel sebagai p̂, dan kami membaca simbol ini sebagai "p-hat" karena terlihat seperti huruf hal dengan topi di atasnya.
Ini menjadi bagian pertama dari interval kepercayaan kami. Estimasi p adalah p̂.
Distribusi Sampling Proporsi Sampel
Untuk menentukan formula margin of error, kita perlu memikirkan distribusi sampling dari p̂. Kita perlu mengetahui mean, standar deviasi, dan distribusi tertentu yang sedang kita tangani.
Distribusi sampel p̂ adalah distribusi binomial dengan probabilitas keberhasilan hal dan n uji coba. Jenis variabel acak ini memiliki mean hal dan standar deviasi dari (hal(1 - hal)/n)0.5. Ada dua masalah dengan ini.
Masalah pertama adalah distribusi binomial bisa sangat rumit untuk dikerjakan. Kehadiran faktorial dapat menyebabkan jumlah yang sangat besar. Di sinilah kondisinya membantu kita. Selama kondisi kami terpenuhi, kami dapat memperkirakan distribusi binomial dengan distribusi normal standar.
Masalah kedua adalah bahwa standar deviasi penggunaan p̂ hal dalam definisinya. Parameter populasi yang tidak diketahui harus diestimasi dengan menggunakan parameter yang sama dengan margin kesalahan. Alasan melingkar ini adalah masalah yang perlu diperbaiki.
Jalan keluar dari teka-teki ini adalah mengganti deviasi standar dengan kesalahan standarnya. Kesalahan standar didasarkan pada statistik, bukan parameter. Kesalahan standar digunakan untuk memperkirakan standar deviasi. Apa yang membuat strategi ini bermanfaat adalah kita tidak perlu lagi mengetahui nilai parameter hal.
Rumus
Untuk menggunakan kesalahan standar, kami mengganti parameter yang tidak dikenal hal dengan p̂ statistik. Hasilnya adalah rumus berikut untuk interval kepercayaan untuk proporsi populasi:
p̂ +/- z * (p̂ (1 - p̂) /n)0.5.
Di sini nilai z * ditentukan oleh tingkat kepercayaan kami C. Untuk distribusi normal standar, tepatnya C persen dari distribusi normal standar adalah antara -z * dan z *. Nilai umum untuk z * termasuk 1,645 untuk kepercayaan 90% dan 1,96 untuk kepercayaan 95%.
Contoh
Mari kita lihat bagaimana metode ini bekerja dengan sebuah contoh. Misalkan kita ingin tahu dengan keyakinan 95% persen pemilih di suatu daerah yang mengidentifikasi dirinya sebagai Demokrat. Kami melakukan sampel acak sederhana dari 100 orang di daerah ini dan menemukan bahwa 64 dari mereka mengidentifikasi sebagai seorang Demokrat.
Kami melihat bahwa semua persyaratan terpenuhi. Perkiraan proporsi populasi kami adalah 64/100 = 0,64. Ini adalah nilai proporsi sampel p̂, dan ini adalah pusat dari interval kepercayaan kami.
Margin of error terdiri dari dua bagian. Yang pertama adalah z*. Seperti yang kami katakan, untuk kepercayaan 95%, nilai z* = 1.96.
Bagian lain dari margin of error diberikan oleh rumus (p̂ (1 - p̂) /n)0.5. Kami menetapkan p̂ = 0,64 dan menghitung = kesalahan standar menjadi (0,64 (0,36) / 100)0.5 = 0.048.
Kami mengalikan dua angka ini bersama-sama dan mendapatkan margin kesalahan 0,09408. Hasil akhirnya adalah:
0.64 +/- 0.09408,
atau kita dapat menulis ulang ini sebagai 54,592% menjadi 73,408%. Dengan demikian, kami yakin 95% bahwa proporsi populasi sebenarnya dari Demokrat berada di kisaran persentase ini. Ini berarti bahwa dalam jangka panjang, teknik dan formula kami akan menangkap proporsi populasi 95% dari waktu.
Ide Terkait
Ada sejumlah ide dan topik yang terhubung ke jenis interval kepercayaan ini. Sebagai contoh, kita dapat melakukan tes hipotesis yang berkaitan dengan nilai proporsi populasi. Kami juga dapat membandingkan dua proporsi dari dua populasi yang berbeda.