Pengambilan sampel secara statistik dapat dilakukan dengan berbagai cara. Selain jenis metode pengambilan sampel yang kami gunakan, ada pertanyaan lain yang berkaitan dengan apa yang secara spesifik terjadi pada seseorang yang telah kami pilih secara acak. Pertanyaan ini yang muncul ketika pengambilan sampel adalah, "Setelah kita memilih seorang individu dan mencatat pengukuran atribut yang sedang kita pelajari, apa yang kita lakukan dengan individu tersebut?"
Ada dua opsi:
- Kami dapat mengganti individu kembali ke kolam yang kami sampel.
- Kita dapat memilih untuk tidak mengganti individu.
Kita dapat dengan mudah melihat bahwa ini mengarah pada dua situasi yang berbeda. Pada opsi pertama, penggantian membiarkan kemungkinan individu dipilih secara acak untuk kedua kalinya. Untuk opsi kedua, jika kita bekerja tanpa penggantian, maka tidak mungkin untuk memilih orang yang sama dua kali. Kita akan melihat bahwa perbedaan ini akan mempengaruhi perhitungan probabilitas yang terkait dengan sampel-sampel ini.
Efek pada Probabilitas
Untuk melihat bagaimana kami menangani penggantian memengaruhi perhitungan probabilitas, pertimbangkan contoh pertanyaan berikut. Berapa probabilitas menarik dua ace dari a setumpuk kartu standar?
Pertanyaan ini ambigu. Apa yang terjadi setelah kami mengambil kartu pertama? Apakah kita memasukkannya kembali ke dek, atau kita membiarkannya?
Kami mulai dengan menghitung probabilitas dengan penggantian. Ada empat ace dan 52 kartu total, sehingga kemungkinan menggambar satu kartu as adalah 4/52. Jika kita mengganti kartu ini dan menggambar lagi, maka probabilitasnya adalah 4/52. Peristiwa ini independen, jadi kami mengalikan probabilitas (4/52) x (4/52) = 1/169, atau sekitar 0,592%.
Sekarang kita akan membandingkan ini dengan situasi yang sama, dengan pengecualian bahwa kita tidak mengganti kartu. Probabilitas menggambar kartu as pada undian pertama masih 4/52. Untuk kartu kedua, kami mengasumsikan bahwa kartu As telah ditarik. Kita sekarang harus menghitung probabilitas bersyarat. Dengan kata lain, kita perlu tahu berapa probabilitas menggambar kartu as kedua, mengingat kartu pertama juga kartu As.
Sekarang ada tiga kartu As yang tersisa dari total 51 kartu. Jadi probabilitas bersyarat dari kartu as kedua setelah menggambar kartu as adalah 3/51. Probabilitas menggambar dua ace tanpa penggantian adalah (4/52) x (3/51) = 1/221, atau sekitar 0,425%.
Kami melihat langsung dari masalah di atas bahwa apa yang kami pilih untuk dilakukan dengan penggantian memiliki kaitan dengan nilai probabilitas. Ini dapat secara signifikan mengubah nilai-nilai ini.
Ukuran Populasi
Ada beberapa situasi di mana pengambilan sampel dengan atau tanpa penggantian tidak secara substansial mengubah probabilitas. Misalkan kita secara acak memilih dua orang dari sebuah kota dengan populasi 50.000, dimana 30.000 di antaranya adalah perempuan.
Jika kita sampel dengan penggantian, maka kemungkinan memilih betina pada seleksi pertama diberikan oleh 30000/50000 = 60%. Probabilitas wanita pada seleksi kedua masih 60%. Probabilitas kedua orang tersebut adalah perempuan adalah 0,6 x 0,6 = 0,36.
Jika kita sampel tanpa penggantian maka probabilitas pertama tidak akan terpengaruh. Probabilitas kedua sekarang 29999/49999 = 0,5999919998..., yang sangat dekat dengan 60%. Probabilitas bahwa keduanya wanita adalah 0,6 x 0,5999919998 = 0,359995.
Probabilitasnya secara teknis berbeda, namun mereka cukup dekat sehingga hampir tidak bisa dibedakan. Untuk alasan ini, berkali-kali meskipun kami mengambil sampel tanpa penggantian, kami memperlakukan pemilihan masing-masing individu seolah-olah mereka independen dari individu lain dalam sampel.
Aplikasi lain
Ada contoh lain di mana kita perlu mempertimbangkan apakah akan mengambil sampel dengan atau tanpa penggantian. Contohnya adalah bootstrap. Teknik statistik ini berada di bawah judul teknik resampling.
Dalam bootstrap, kita mulai dengan sampel statistik suatu populasi. Kami kemudian menggunakan perangkat lunak komputer untuk menghitung sampel bootstrap. Dengan kata lain, komputer sampel ulang dengan penggantian dari sampel awal.