Interval kepercayaan diri adalah salah satu bagian dari statistik inferensial. Ide dasar di balik topik ini adalah untuk memperkirakan nilai populasi yang tidak diketahui parameter dengan menggunakan sampel statistik. Kami tidak hanya dapat memperkirakan nilai parameter, tetapi kami juga dapat menyesuaikan metode untuk memperkirakan perbedaan antara dua parameter terkait. Misalnya, kami mungkin ingin menemukan perbedaan dalam persentase populasi pemilih pria AS yang mendukung bagian undang-undang tertentu dibandingkan dengan populasi pemilih wanita.
Kita akan melihat bagaimana melakukan jenis perhitungan ini dengan membangun interval kepercayaan untuk perbedaan dua proporsi populasi. Dalam prosesnya kita akan memeriksa beberapa teori di balik perhitungan ini. Kita akan melihat beberapa kesamaan dalam bagaimana kita membangun a interval kepercayaan untuk proporsi populasi tunggal serta a Interval kepercayaan untuk perbedaan dua populasi berarti.
Generalitas
Sebelum melihat formula spesifik yang akan kita gunakan, mari kita pertimbangkan keseluruhan kerangka yang cocok dengan interval kepercayaan ini. Bentuk tipe interval kepercayaan yang akan kita lihat diberikan oleh rumus berikut:
Perkirakan +/- Margin of Error
Banyak interval kepercayaan dari jenis ini. Ada dua angka yang perlu kita hitung. Nilai-nilai pertama adalah estimasi untuk parameter. Nilai kedua adalah margin of error. Margin kesalahan ini menjelaskan fakta bahwa kami memang memiliki perkiraan. Interval kepercayaan memberi kami kisaran nilai yang mungkin untuk parameter kami yang tidak diketahui.
Kondisi
Kita harus memastikan bahwa semua persyaratan dipenuhi sebelum melakukan perhitungan apa pun. Untuk menemukan interval kepercayaan untuk perbedaan dua proporsi populasi, kita perlu memastikan bahwa penahanan berikut:
- Kami punya dua sampel acak sederhana dari populasi besar. Di sini "besar" berarti bahwa populasi setidaknya 20 kali lebih besar dari ukuran sampel. Ukuran sampel akan dilambangkan dengan n1 dan n2.
- Individu kita telah dipilih secara independen satu sama lain.
- Setidaknya ada sepuluh keberhasilan dan sepuluh kegagalan di masing-masing sampel kami.
Jika item terakhir dalam daftar tidak puas, maka mungkin ada jalan keluarnya. Kita dapat memodifikasi ditambah empat interval kepercayaan konstruksi dan memperoleh hasil yang kuat. Seiring kami melangkah maju, kami menganggap bahwa semua kondisi di atas telah terpenuhi.
Sampel dan Proporsi Penduduk
Sekarang kita siap untuk membangun interval kepercayaan kita. Kami mulai dengan perkiraan perbedaan antara proporsi populasi kami. Kedua proporsi populasi ini diperkirakan dengan proporsi sampel. Proporsi sampel ini adalah statistik yang ditemukan dengan membagi jumlah keberhasilan dalam setiap sampel, dan kemudian membaginya dengan masing-masing ukuran sampel.
Proporsi populasi pertama dilambangkan dengan hal1. Jika jumlah keberhasilan dalam sampel kami dari populasi ini adalah k1, maka kami memiliki proporsi sampel k1 / n1.
Kami menyatakan statistik ini dengan p̂1. Kami membaca simbol ini sebagai "hal1-yaitu "karena terlihat seperti simbol p1 dengan topi di atasnya.
Dengan cara yang sama kita dapat menghitung proporsi sampel dari populasi kedua kita. Parameter dari populasi ini adalah hal2. Jika jumlah keberhasilan dalam sampel kami dari populasi ini adalah k2, dan proporsi sampel kami adalah p̂2 = k2 / n2.
Kedua statistik ini menjadi bagian pertama dari interval kepercayaan kami. Estimasi dari hal1 adalah p̂1. Estimasi dari hal2 adalah p̂2. Jadi perkiraan untuk perbedaannya hal1 - hal2 adalah p̂1 - p̂2.
Distribusi Pengambilan Sampel dari Perbedaan Proporsi Sampel
Selanjutnya kita perlu mendapatkan formula untuk margin kesalahan. Untuk melakukan ini, pertama kita akan mempertimbangkan distribusi sampling dari p̂1 . Ini adalah distribusi binomial dengan probabilitas keberhasilan hal1 dan n1 uji coba. Mean dari distribusi ini adalah proporsi hal1. Simpangan baku dari jenis variabel acak ini memiliki varian hal1 (1 - hal1 )/n1.
Distribusi sampling p̂2 mirip dengan p̂1 . Cukup ubah semua indeks dari 1 menjadi 2 dan kami memiliki distribusi binomial dengan rata-rata p2 dan varian dari hal2 (1 - hal2 )/n2.
Kami sekarang memerlukan beberapa hasil dari statistik matematika untuk menentukan distribusi sampel p̂1 - p̂2. Mean dari distribusi ini adalah hal1 - hal2. Karena fakta bahwa varians menambah bersama, kita melihat bahwa varians dari distribusi sampling adalah hal1 (1 - hal1 )/n1 + hal2 (1 - hal2 )/n2. Deviasi standar dari distribusi adalah akar kuadrat dari rumus ini.
Ada beberapa penyesuaian yang perlu kita lakukan. Yang pertama adalah formula untuk standar deviasi p̂1 - p̂2 menggunakan parameter yang tidak diketahui dari hal1 dan hal2. Tentu saja jika kita benar-benar mengetahui nilai-nilai ini, maka itu tidak akan menjadi masalah statistik yang menarik sama sekali. Kami tidak perlu memperkirakan perbedaan antara keduanya hal1 dan hal2.. Alih-alih, kami cukup menghitung perbedaan yang tepat.
Masalah ini dapat diperbaiki dengan menghitung kesalahan standar dan bukan standar deviasi. Yang perlu kita lakukan hanyalah mengganti proporsi populasi dengan proporsi sampel. Kesalahan standar dihitung dari statistik bukan parameter. Kesalahan standar bermanfaat karena secara efektif memperkirakan deviasi standar. Apa artinya ini bagi kita adalah kita tidak perlu lagi mengetahui nilai parameter hal1 dan hal2. .Karena proporsi sampel ini diketahui, kesalahan standar diberikan oleh akar kuadrat dari ekspresi berikut:
p̂1 (1 - p̂1 )/n1 + p̂2 (1 - p̂2 )/n2.
Item kedua yang perlu kita tangani adalah bentuk khusus dari distribusi sampling kami. Ternyata kita bisa menggunakan distribusi normal untuk mendekati distribusi sampling p̂1 - p̂2. Alasannya agak teknis, tetapi diuraikan dalam paragraf berikutnya.
Keduanya p̂1 dan p̂2 memiliki distribusi sampling yang bersifat binomial. Setiap distribusi binomial ini dapat diperkirakan dengan cukup baik oleh distribusi normal. Jadi p̂1 - p̂2 adalah variabel acak. Ini dibentuk sebagai kombinasi linear dari dua variabel acak. Masing-masing didekati dengan distribusi normal. Oleh karena itu distribusi sampling p̂1 - p̂2 juga terdistribusi secara normal.
Formula Interval Keyakinan
Kami sekarang memiliki semua yang kami butuhkan untuk mengumpulkan interval kepercayaan kami. Perkiraannya adalah (p̂1 - p̂2) dan margin kesalahan adalah z * [hal1 (1 - p̂1 )/n1 + p̂2 (1 - p̂2 )/n2.]0.5. Nilai yang kami masukkan z * ditentukan oleh tingkat kepercayaan C. Nilai yang biasa digunakan untuk z * adalah 1,645 untuk kepercayaan 90% dan 1,96 untuk kepercayaan 95%. Nilai-nilai ini untuk z * menunjukkan bagian dari distribusi normal standar di mana tepatnya C persen dari distribusi adalah antara -z * dan z *.
Formula berikut memberi kita interval kepercayaan untuk perbedaan dua proporsi populasi:
(hal1 - p̂2) +/- z * [hal1 (1 - p̂1 )/n1 + p̂2 (1 - p̂2 )/n2.]0.5