Apa Bootstrapping dalam Sehubungan dengan Statistik?

Bootstrapping adalah teknik statistik yang berada di bawah judul resampling yang lebih luas. Teknik ini melibatkan prosedur yang relatif sederhana tetapi diulang berkali-kali sehingga sangat tergantung pada perhitungan komputer. Bootstrapping memberikan metode selain interval kepercayaan untuk memperkirakan parameter populasi. Bootstrap sepertinya berfungsi seperti sulap. Baca terus untuk mengetahui bagaimana ia memperoleh nama yang menarik.

Penjelasan tentang Bootstrap

Satu tujuan statistik inferensial adalah untuk menentukan nilai parameter suatu populasi. Biasanya terlalu mahal atau bahkan tidak mungkin untuk mengukurnya secara langsung. Jadi kami gunakan sampling statistik. Kami mengambil sampel populasi, mengukur statistik sampel ini, dan kemudian menggunakan statistik ini untuk mengatakan sesuatu tentang parameter yang sesuai dari populasi.

Misalnya, di pabrik cokelat, kami mungkin ingin menjamin bahwa permen memiliki yang istimewa berarti bobot. Tidak layak untuk menimbang setiap batang permen yang diproduksi, jadi kami menggunakan teknik pengambilan sampel untuk memilih secara acak 100 batang permen. Kami menghitung rata-rata dari 100 batang permen ini dan mengatakan bahwa rata-rata populasi berada dalam batas kesalahan dari rata-rata sampel kami.

instagram viewer

Misalkan beberapa bulan kemudian kita ingin tahu dengan akurasi yang lebih besar - atau kurang dari a margin of error - apa artinya berat batang permen pada hari kami mencicipi jalur produksi. Kita juga tidak bisa menggunakan candy bar hari ini banyak variabel telah memasuki gambar (berbagai batch susu, gula dan biji kakao, kondisi atmosfer yang berbeda, karyawan yang berbeda di telepon, dll.). Semua yang kita miliki sejak hari yang membuat kita penasaran adalah 100 bobot. Tanpa mesin waktu kembali ke hari itu, tampaknya margin kesalahan awal adalah yang terbaik yang bisa kita harapkan.

Untungnya, kita bisa menggunakan teknik bootstrap. Dalam situasi ini, kami secara acak sampel dengan penggantian dari 100 bobot yang diketahui. Kami kemudian menyebutnya sampel bootstrap. Karena kami mengizinkan penggantian, sampel bootstrap ini kemungkinan besar tidak identik dengan sampel awal kami. Beberapa titik data dapat diduplikasi, dan titik data lainnya dari awal 100 dapat dihilangkan dalam sampel bootstrap. Dengan bantuan komputer, ribuan sampel bootstrap dapat dibuat dalam waktu yang relatif singkat.

Sebuah contoh

Seperti disebutkan, untuk benar-benar menggunakan teknik bootstrap, kita perlu menggunakan komputer. Contoh numerik berikut akan membantu menunjukkan bagaimana proses itu bekerja. Jika kita mulai dengan sampel 2, 4, 5, 6, 6, maka semua yang berikut ini adalah sampel bootstrap yang memungkinkan:

  • 2 ,5, 5, 6, 6
  • 4, 5, 6, 6, 6
  • 2, 2, 4, 5, 5
  • 2, 2, 2, 4, 6
  • 2, 2, 2, 2, 2
  • 4,6, 6, 6, 6

Sejarah Teknik

Teknik bootstrap relatif baru di bidang statistik. Penggunaan pertama diterbitkan dalam makalah 1979 oleh Bradley Efron. Karena daya komputasi telah meningkat dan menjadi lebih murah, teknik-teknik bootstrap menjadi lebih luas.

Mengapa Nama Bootstrapping?

Nama "bootstrap" berasal dari frasa, "Untuk mengangkat dirinya dengan bootstraps-nya." Ini merujuk pada sesuatu yang tidak masuk akal dan tidak mungkin. Berusaha sekeras yang Anda bisa, Anda tidak bisa mengangkat diri ke udara dengan menarik-narik potongan kulit di sepatu bot Anda.

Ada beberapa teori matematika yang membenarkan teknik bootstrap. Namun, penggunaan bootstrap memang terasa seperti Anda melakukan hal yang mustahil. Meskipun sepertinya Anda tidak akan dapat memperbaiki estimasi statistik populasi dengan menggunakan kembali sampel yang sama berulang kali, bootstrap dapat, pada kenyataannya, melakukan hal ini.

instagram story viewer