Ņemot vērā a datu secība, viens jautājums, kas mums varētu rasties jautājums, ir, ja secība notikusi nejauši, vai arī dati nav nejauši. Nejaušību ir grūti noteikt, jo ir ļoti grūti vienkārši aplūkot datus un noteikt, vai tie iegūti tikai nejauši. Vienu metodi, kuru var izmantot, lai noteiktu, vai secība patiešām ir notikusi nejauši, sauc par izmēģinājumu testu.
Skriešanas pārbaude ir nozīmīguma pārbaude vai hipotēzes pārbaude. Šī testa procedūra ir balstīta uz tādu datu izpildi vai secību, kuriem ir īpaša iezīme. Lai saprastu, kā darbojas ieskaites tests, vispirms jāpārbauda izbraukuma jēdziens.
Datu secības
Sākumā apskatīsim skrējienu piemērus. Apsveriet šādu nejaušu ciparu secību:
6 2 7 0 0 1 7 3 0 5 0 8 4 6 8 7 0 6 5 5
Viens no veidiem, kā klasificēt šos ciparus, ir tos sadalīt divās kategorijās: pāra (ieskaitot ciparus 0, 2, 4, 6 un 8) vai nepāra (ieskaitot ciparus 1, 3, 5, 7 un 9). Mēs apskatīsim nejaušu ciparu secību un pāra skaitļus apzīmēsim kā E un nepāra skaitļus kā O:
E E O E E O O E O E E E E O E E O O
Skrējienus ir vieglāk pamanīt, ja mēs to pārrakstām tā, ka visi Os ir kopā un visi Es ir kopā:
EE O EE OO E O EEEEE O EE OO
Mēs saskaitām nepāra vai nepāra skaitļu bloku skaitu un redzam, ka kopumā ir desmit mēģinājumi. Četriem braucieniem ir viens garums, pieciem ir divi garumi un vienam ir pieci garumi
Nosacījumi
Ar jebkuru nozīmīguma pārbaude, ir svarīgi zināt, kādi apstākļi ir nepieciešami testa veikšanai. Izpildes pārbaudē mēs varēsim klasificēt katru datu vērtību no izlases vienā no divām kategorijām. Mēs saskaitīsim kopējo darbību skaitu attiecībā pret katrā kategorijā ietilpstošo datu vērtību skaitu.
Pārbaude būs a divpusējs tests. Iemesls tam ir tas, ka pārāk maz izlaižu nozīmē, ka, iespējams, nav pietiekami daudz izmaiņu un izlaižu skaita, kas varētu rasties no nejauša procesa. Pārāk daudz palaišanas radīsies, ja process pārmaiņus kategorijās mainās pārāk bieži, lai to aprakstītu nejauši.
Hipotēzes un P vērtības
Katram nozīmīguma testam ir a nulle un alternatīva hipotēze. Skriešanas testa nulles hipotēze ir tāda, ka secība ir nejauša secība. Alternatīva hipotēze ir tāda, ka izlases datu secība nav nejauša.
Statistikas programmatūra var aprēķināt p-vērtība kas atbilst noteiktai testa statistikai. Ir arī tabulas, kas noteiktā skaitā norāda kritiskos skaitļus nozīmīguma līmenis par kopējo nobraukumu skaitu.
Darbojas testa piemērs
Mēs strādāsim ar šo piemēru, lai redzētu, kā darbojas ieskaites pārbaude. Pieņemsim, ka uzdevuma veikšanai studentam tiek lūgts 16 reizes pārsist monētu un atzīmēt uzrādīto galvu un astiņu secību. Ja mēs beigsim šo datu kopu:
H T H H H T T H T T H T H T H H
Mēs varam jautāt, vai students patiešām ir paveicis mājasdarbu, vai arī viņš krāpis un pierakstījis H un T sērijas, kas izskatās pēc nejaušības principa? Skrējienu pārbaude mums var palīdzēt. Izpildes testa pieņēmumi ir izpildīti, jo datus var iedalīt divās grupās kā galviņa vai aste. Mēs turpinām, skaitot nobraukumu skaitu. Pārgrupējot, mēs redzam sekojošo:
H T HHH TT H TT H T H T HH
Mūsu datiem ir desmit izmēģinājumi ar septiņām astēm, kurām ir deviņas galvas.
Nulles hipotēze ir tāda, ka dati ir nejauši. Alternatīva ir tā, ka tā nav nejauša. Ja alfa nozīmīguma līmenis ir vienāds ar 0,05, tad, izmantojot atbilstošo tabulu, mēs redzam, ka mēs noraidām nulles hipotēzi, ja izpildes gadījumu skaits ir mazāks par 4 vai lielāks par 16. Tā kā mūsu datos ir desmit piegājieni, mēs neizdodas noraidīt nulles hipotēze H0.
Normāla tuvināšana
Darbību pārbaude ir noderīgs rīks, lai noteiktu, vai secība, iespējams, ir nejauša. Lielai datu kopai dažreiz ir iespējams izmantot parasto tuvinājumu. Šī normāla tuvināšana liek mums izmantot elementu skaitu katrā kategorijā un pēc tam aprēķināt atbilstošās vidējo un standartnovirzi. normāls sadalījums.