Apa itu Robustness in Statistics?

Di statistik, istilah robust atau robustness mengacu pada kekuatan model statistik, tes, dan prosedur sesuai dengan kondisi spesifik analisis statistik yang ingin dicapai oleh penelitian. Mengingat bahwa kondisi-kondisi penelitian ini terpenuhi, model-model tersebut dapat diverifikasi kebenarannya melalui penggunaan bukti matematika.

Banyak model didasarkan pada situasi ideal yang tidak ada ketika bekerja dengan data dunia nyata, dan, sebagai hasilnya, model tersebut dapat memberikan hasil yang benar bahkan jika kondisinya tidak terpenuhi dengan tepat.

Statistik yang kuat, oleh karena itu, adalah statistik yang menghasilkan kinerja yang baik ketika data diambil dari berbagai distribusi probabilitas yang sebagian besar tidak terpengaruh oleh outlier atau keberangkatan kecil dari asumsi model dalam suatu pemberian Himpunan data. Dengan kata lain, statistik yang kuat tahan terhadap kesalahan dalam hasil.

Salah satu cara untuk mengamati prosedur statistik yang kuat dan umum dipegang, seseorang tidak perlu melihat lebih jauh dari prosedur-t, yang menggunakan tes hipotesis untuk menentukan prediksi statistik yang paling akurat.

instagram viewer

Mengamati Prosedur-T

Sebagai contoh ketahanan, kami akan mempertimbangkan t-Prosedur, yang meliputi interval kepercayaan untuk mean populasi dengan standar deviasi populasi yang tidak diketahui serta uji hipotesis tentang mean populasi.

Penggunaan t-prosedur mengasumsikan sebagai berikut:

  • Himpunan data yang kami kerjakan adalah a sampel acak sederhana dari populasi.
  • Populasi yang kami sampel dari biasanya terdistribusi.

Dalam praktiknya dengan contoh-contoh kehidupan nyata, ahli statistik jarang memiliki populasi yang terdistribusi normal, jadi pertanyaannya malah menjadi, "Seberapa kuatkah kita t-Prosedur?"

Secara umum kondisi bahwa kami memiliki sampel acak sederhana lebih penting daripada kondisi yang kami sampel dari populasi yang berdistribusi normal; alasan untuk ini adalah bahwa teorema limit pusat memastikan distribusi sampling yang kira-kira normal - semakin besar ukuran sampel kami, semakin dekat distribusi sampel dari rata-rata sampel normal.

Bagaimana Prosedur-T Berfungsi sebagai Statistik Kuat

Jadi kekokohan untuk t- Prosedur bergantung pada ukuran sampel dan distribusi sampel kami. Pertimbangan untuk ini meliputi:

  • Jika ukuran sampel besar, artinya kita memiliki 40 atau lebih pengamatan, maka t-prosedur dapat digunakan bahkan dengan distribusi yang miring.
  • Jika ukuran sampel antara 15 dan 40, maka kita bisa menggunakan t-prosedur untuk setiap distribusi berbentuk, kecuali ada pencilan atau tingkat kemiringan yang tinggi.
  • Jika ukuran sampel kurang dari 15, maka kita bisa menggunakan t- prosedur untuk data yang tidak memiliki outlier, puncak tunggal, dan hampir simetris.

Dalam kebanyakan kasus, ketahanan telah ditetapkan melalui kerja teknis dalam statistik matematika, dan, untungnya, kita tidak perlu melakukan perhitungan matematis lanjutan ini agar dapat berjalan dengan baik memanfaatkannya; kita hanya perlu memahami apa pedoman keseluruhan untuk kekokohan metode statistik khusus kami.

T-procedure berfungsi sebagai statistik yang kuat karena mereka biasanya menghasilkan kinerja yang baik per model ini dengan memperhitungkan ukuran sampel menjadi dasar untuk menerapkan prosedur.