Interval Keyakinan untuk Perbedaan Dua Proporsi Populasi

Interval kepercayaan diri adalah salah satu bagian dari statistik inferensial. Ide dasar di balik topik ini adalah untuk memperkirakan nilai populasi yang tidak diketahui parameter dengan menggunakan sampel statistik. Kami tidak hanya dapat memperkirakan nilai parameter, tetapi kami juga dapat menyesuaikan metode untuk memperkirakan perbedaan antara dua parameter terkait. Misalnya, kami mungkin ingin menemukan perbedaan dalam persentase populasi pemilih pria AS yang mendukung bagian undang-undang tertentu dibandingkan dengan populasi pemilih wanita.

Kita akan melihat bagaimana melakukan jenis perhitungan ini dengan membangun interval kepercayaan untuk perbedaan dua proporsi populasi. Dalam prosesnya kita akan memeriksa beberapa teori di balik perhitungan ini. Kita akan melihat beberapa kesamaan dalam bagaimana kita membangun a interval kepercayaan untuk proporsi populasi tunggal serta a Interval kepercayaan untuk perbedaan dua populasi berarti.

Generalitas

Sebelum melihat formula spesifik yang akan kita gunakan, mari kita pertimbangkan keseluruhan kerangka yang cocok dengan interval kepercayaan ini. Bentuk tipe interval kepercayaan yang akan kita lihat diberikan oleh rumus berikut:

instagram viewer

Perkirakan +/- Margin of Error

Banyak interval kepercayaan dari jenis ini. Ada dua angka yang perlu kita hitung. Nilai-nilai pertama adalah estimasi untuk parameter. Nilai kedua adalah margin of error. Margin kesalahan ini menjelaskan fakta bahwa kami memang memiliki perkiraan. Interval kepercayaan memberi kami kisaran nilai yang mungkin untuk parameter kami yang tidak diketahui.

Kondisi

Kita harus memastikan bahwa semua persyaratan dipenuhi sebelum melakukan perhitungan apa pun. Untuk menemukan interval kepercayaan untuk perbedaan dua proporsi populasi, kita perlu memastikan bahwa penahanan berikut:

Kami punya dua sampel acak sederhana dari populasi besar. Di sini "besar" berarti bahwa populasi setidaknya 20 kali lebih besar dari ukuran sampel. Ukuran sampel akan dilambangkan dengan n₁ dan n₂.
Individu kita telah dipilih secara independen satu sama lain.
Setidaknya ada sepuluh keberhasilan dan sepuluh kegagalan di masing-masing sampel kami.

Jika item terakhir dalam daftar tidak puas, maka mungkin ada jalan keluarnya. Kita dapat memodifikasi ditambah empat interval kepercayaan konstruksi dan memperoleh hasil yang kuat. Seiring kami melangkah maju, kami menganggap bahwa semua kondisi di atas telah terpenuhi.

Sampel dan Proporsi Penduduk

Sekarang kita siap untuk membangun interval kepercayaan kita. Kami mulai dengan perkiraan perbedaan antara proporsi populasi kami. Kedua proporsi populasi ini diperkirakan dengan proporsi sampel. Proporsi sampel ini adalah statistik yang ditemukan dengan membagi jumlah keberhasilan dalam setiap sampel, dan kemudian membaginya dengan masing-masing ukuran sampel.

Proporsi populasi pertama dilambangkan dengan hal₁. Jika jumlah keberhasilan dalam sampel kami dari populasi ini adalah k₁, maka kami memiliki proporsi sampel k₁ / n_1.

Kami menyatakan statistik ini dengan p̂₁. Kami membaca simbol ini sebagai "hal₁-yaitu "karena terlihat seperti simbol p₁ dengan topi di atasnya.

Dengan cara yang sama kita dapat menghitung proporsi sampel dari populasi kedua kita. Parameter dari populasi ini adalah hal₂. Jika jumlah keberhasilan dalam sampel kami dari populasi ini adalah k₂, dan proporsi sampel kami adalah p̂₂= k₂ / n_2.

Kedua statistik ini menjadi bagian pertama dari interval kepercayaan kami. Estimasi dari hal₁ adalah p̂₁. Estimasi dari hal₂ adalah p̂_2.Jadi perkiraan untuk perbedaannya hal₁ - hal₂ adalah p̂₁- p̂_2.

Distribusi Pengambilan Sampel dari Perbedaan Proporsi Sampel

Selanjutnya kita perlu mendapatkan formula untuk margin kesalahan. Untuk melakukan ini, pertama kita akan mempertimbangkan distribusi sampling dari p̂₁. Ini adalah distribusi binomial dengan probabilitas keberhasilan hal₁ dan n₁ uji coba. Mean dari distribusi ini adalah proporsi hal₁. Simpangan baku dari jenis variabel acak ini memiliki varian hal₁(1 - hal₁)/n₁.

Distribusi sampling p̂₂mirip dengan p̂₁. Cukup ubah semua indeks dari 1 menjadi 2 dan kami memiliki distribusi binomial dengan rata-rata p₂dan varian dari hal₂(1 - hal₂)/n₂.

Kami sekarang memerlukan beberapa hasil dari statistik matematika untuk menentukan distribusi sampel p̂₁- p̂₂. Mean dari distribusi ini adalah hal₁ - hal₂. Karena fakta bahwa varians menambah bersama, kita melihat bahwa varians dari distribusi sampling adalah hal₁(1 - hal₁)/n₁ + hal₂(1 - hal₂)/n_2.Deviasi standar dari distribusi adalah akar kuadrat dari rumus ini.

Ada beberapa penyesuaian yang perlu kita lakukan. Yang pertama adalah formula untuk standar deviasi p̂₁- p̂₂ menggunakan parameter yang tidak diketahui dari hal₁dan hal₂. Tentu saja jika kita benar-benar mengetahui nilai-nilai ini, maka itu tidak akan menjadi masalah statistik yang menarik sama sekali. Kami tidak perlu memperkirakan perbedaan antara keduanya hal₁dan hal_2..Alih-alih, kami cukup menghitung perbedaan yang tepat.

Masalah ini dapat diperbaiki dengan menghitung kesalahan standar dan bukan standar deviasi. Yang perlu kita lakukan hanyalah mengganti proporsi populasi dengan proporsi sampel. Kesalahan standar dihitung dari statistik bukan parameter. Kesalahan standar bermanfaat karena secara efektif memperkirakan deviasi standar. Apa artinya ini bagi kita adalah kita tidak perlu lagi mengetahui nilai parameter hal₁ dan hal₂. .Karena proporsi sampel ini diketahui, kesalahan standar diberikan oleh akar kuadrat dari ekspresi berikut:

p̂₁(1 - p̂₁)/n₁ + p̂₂(1 - p̂₂)/n_2.

Item kedua yang perlu kita tangani adalah bentuk khusus dari distribusi sampling kami. Ternyata kita bisa menggunakan distribusi normal untuk mendekati distribusi sampling p̂₁- p̂₂. Alasannya agak teknis, tetapi diuraikan dalam paragraf berikutnya.

Keduanya p̂₁dan p̂₂memiliki distribusi sampling yang bersifat binomial. Setiap distribusi binomial ini dapat diperkirakan dengan cukup baik oleh distribusi normal. Jadi p̂₁- p̂₂adalah variabel acak. Ini dibentuk sebagai kombinasi linear dari dua variabel acak. Masing-masing didekati dengan distribusi normal. Oleh karena itu distribusi sampling p̂₁- p̂₂juga terdistribusi secara normal.

Formula Interval Keyakinan

Kami sekarang memiliki semua yang kami butuhkan untuk mengumpulkan interval kepercayaan kami. Perkiraannya adalah (p̂₁- p̂₂) dan margin kesalahan adalah z * [hal₁(1 - p̂₁)/n₁ + p̂₂(1 - p̂₂)/n_2.]^0.5. Nilai yang kami masukkan z * ditentukan oleh tingkat kepercayaan C. Nilai yang biasa digunakan untuk z * adalah 1,645 untuk kepercayaan 90% dan 1,96 untuk kepercayaan 95%. Nilai-nilai ini untuk z * menunjukkan bagian dari distribusi normal standar di mana tepatnya C persen dari distribusi adalah antara -z * dan z *.

Formula berikut memberi kita interval kepercayaan untuk perbedaan dua proporsi populasi:

(hal₁- p̂₂) +/- z * [hal₁(1 - p̂₁)/n₁ + p̂₂(1 - p̂₂)/n_2.]^0.5