Contoh Bootstrap dalam Statistik

Bootstrap adalah teknik statistik yang kuat. Ini sangat berguna ketika Sampel ukuran yang kami kerjakan kecil. Dalam keadaan biasa, ukuran sampel kurang dari 40 tidak dapat ditangani dengan mengasumsikan a distribusi normal atau a distribusi t. Teknik-teknik bootstrap bekerja cukup baik dengan sampel yang memiliki kurang dari 40 elemen. Alasannya adalah bootstrapping melibatkan resampling. Jenis teknik ini tidak menganggap apa pun tentang distribusi dari data kami.

Bootstrapping menjadi lebih populer karena sumber daya komputasi telah tersedia. Ini karena agar bootstrap praktis, komputer harus digunakan. Kita akan melihat bagaimana ini bekerja dalam contoh bootstrap berikut.

Kita mulai dengan sampel statistik dari populasi yang kita tidak tahu tentang. Tujuan kami adalah interval kepercayaan 90% tentang rata-rata sampel. Meskipun teknik statistik lainnya digunakan untuk menentukan interval kepercayaan berasumsi bahwa kita tahu mean atau standar deviasi populasi kita, bootstrap tidak memerlukan apa pun selain sampel.

instagram viewer

Untuk keperluan contoh kami, kami akan menganggap bahwa sampel adalah 1, 2, 4, 4, 10.

Kami sekarang melakukan resample dengan penggantian dari sampel kami untuk membentuk apa yang dikenal sebagai sampel bootstrap. Setiap sampel bootstrap akan memiliki ukuran lima, seperti sampel asli kami. Karena kami memilih secara acak dan kemudian mengganti setiap nilai, sampel bootstrap mungkin berbeda dari sampel asli dan dari satu sama lain.

Sebagai contoh bahwa kita akan bertemu di dunia nyata, kita akan melakukan ini resampling ratusan jika tidak ribuan kali. Dalam apa yang berikut di bawah ini, kita akan melihat contoh 20 sampel bootstrap:

Karena kami menggunakan bootstrap untuk menghitung interval kepercayaan untuk rata-rata populasi, kami sekarang menghitung rata-rata masing-masing sampel bootstrap kami. Cara-cara ini, diatur dalam urutan menaik adalah: 2, 2.4, 2.6, 2.6, 2.8, 3, 3, 3.2, 3.4, 3.6, 3.8, 4, 4, 4.2, 4.6, 5.2, 6, 6, 6, 6.6, 7.6.

Kami sekarang memperoleh dari daftar sampel bootstrap kami berarti interval kepercayaan. Karena kami menginginkan interval kepercayaan 90%, kami menggunakan persentil ke-95 dan ke-5 sebagai titik akhir interval. Alasan untuk ini adalah bahwa kami membagi 100% - 90% = 10% menjadi setengah sehingga kami akan memiliki 90% tengah dari semua mean sampel bootstrap.

instagram story viewer