Diberikan a urutan data, satu pertanyaan yang mungkin kita tanyakan adalah apakah urutan terjadi oleh fenomena kebetulan, atau jika data tidak acak. Keacakan sulit untuk diidentifikasi, karena sangat sulit untuk hanya melihat data dan menentukan apakah itu diproduksi secara kebetulan atau tidak. Salah satu metode yang dapat digunakan untuk membantu menentukan apakah suatu urutan benar-benar terjadi secara kebetulan disebut tes jalan.
Tes berjalan adalah tes signifikansi atau uji hipotesis. Prosedur untuk pengujian ini didasarkan pada data, yang berjalan, atau berurutan, yang memiliki sifat tertentu. Untuk memahami cara kerja tes berjalan, kita harus terlebih dahulu memeriksa konsep lari.
Urutan Data
Kita akan mulai dengan melihat contoh run. Pertimbangkan urutan angka acak berikut:
6 2 7 0 0 1 7 3 0 5 0 8 4 6 8 7 0 6 5 5
Salah satu cara untuk mengklasifikasikan angka-angka ini adalah dengan membaginya menjadi dua kategori, baik genap (termasuk angka 0, 2, 4, 6 dan 8) atau ganjil (termasuk angka 1, 3, 5, 7 dan 9). Kami akan melihat urutan angka acak dan menunjukkan angka genap sebagai E dan angka ganjil sebagai O:
E E O E E O O E E E E E E O E E O
Berjalan lebih mudah untuk melihat apakah kita menulis ulang ini sehingga semua O bersama-sama dan semua Es bersama:
EE O EE OO E O EEEEE O EE OO
Kami menghitung jumlah blok angka genap atau ganjil dan melihat bahwa ada total sepuluh run untuk data. Empat run memiliki panjang satu, lima memiliki panjang dua dan satu memiliki panjang lima
Kondisi
Dengan apapun uji signifikansi, penting untuk mengetahui kondisi apa yang diperlukan untuk melakukan tes. Untuk pengujian jalan, kami akan dapat mengklasifikasikan setiap nilai data dari sampel menjadi salah satu dari dua kategori. Kami akan menghitung jumlah total berjalan relatif terhadap jumlah jumlah nilai data yang termasuk dalam setiap kategori.
Tes akan menjadi tes dua sisi. Alasan untuk ini adalah bahwa terlalu sedikit berjalan berarti bahwa ada kemungkinan tidak cukup variasi dan jumlah jalan yang akan terjadi dari proses acak. Terlalu banyak proses akan terjadi ketika suatu proses berganti-ganti antar kategori terlalu sering untuk dijelaskan secara kebetulan.
Hipotesis dan Nilai-P
Setiap tes signifikansi memiliki a nol dan hipotesis alternatif. Untuk tes jalan, hipotesis nol adalah bahwa urutannya adalah urutan acak. Hipotesis alternatif adalah bahwa urutan data sampel tidak acak.
Perangkat lunak statistik dapat menghitung nilai p yang sesuai dengan statistik uji tertentu. Ada juga tabel yang memberikan angka kritis pada suatu waktu tingkat signifikansi untuk jumlah total run.
Menjalankan Contoh Uji
Kami akan bekerja melalui contoh berikut untuk melihat bagaimana tes berjalan bekerja. Misalkan untuk suatu tugas seorang siswa diminta untuk melemparkan koin sebanyak 16 kali dan mencatat urutan kepala dan ekor yang muncul. Jika kita berakhir dengan kumpulan data ini:
H T H H H T T H T T H T H T H H
Kita mungkin bertanya apakah siswa benar-benar mengerjakan pekerjaan rumahnya, atau apakah dia menipu dan menuliskan serangkaian H dan T yang terlihat acak? Tes berjalan dapat membantu kami. Asumsi-asumsi dipenuhi untuk tes jalan karena data dapat diklasifikasikan ke dalam dua kelompok, baik sebagai kepala atau ekor. Kami terus berjalan dengan menghitung jumlah proses. Mengelompokkan kembali, kita melihat hal berikut:
H T HHH TT H TT H T H T HH
Ada sepuluh jalan untuk data kami dengan tujuh ekor sembilan kepala.
Hipotesis nol adalah bahwa data tersebut acak. Alternatifnya adalah tidak acak. Untuk tingkat signifikansi alfa yang sama dengan 0,05, kita melihat dengan melihat tabel yang tepat bahwa kita menolak hipotesis nol ketika jumlah run kurang dari 4 atau lebih besar dari 16. Karena ada sepuluh proses dalam data kami, kami gagal menolak hipotesis nol H0.
Perkiraan Normal
Tes jalan adalah alat yang berguna untuk menentukan apakah suatu urutan cenderung acak atau tidak. Untuk kumpulan data besar, kadang-kadang dimungkinkan untuk menggunakan perkiraan normal. Perkiraan normal ini mengharuskan kita untuk menggunakan jumlah elemen dalam setiap kategori dan kemudian menghitung rata-rata dan standar deviasi yang sesuai. distribusi normal.