Kas ir Chi-Square statistika?
Chi-kvadrāts ( χ 2) statistika ir pārbaude, kas nosaka, kā cerības tiek salīdzinātas ar faktiskajiem novērotajiem datiem (vai modeļa rezultātiem). Chi-kvadrāta statistikas aprēķināšanai izmantotajiem datiem jābūt nejaušiem, neapstrādātiem, savstarpēji izslēdzošiem, iegūtiem no neatkarīgiem mainīgajiem un no pietiekami liela parauga. Piemēram, rezultāti, izmetot monētu 100 reizes, atbilst šiem kritērijiem.
Chi-square testus bieži izmanto hipotēžu pārbaudē.
Chi-Square formula ir
χc2 = ∑ (Oi − Ei) 2Ei kur: c = brīvības pakāpesO = novērotā vērtība (-s) E = paredzamā (-ās) vērtība (-as) sākas {izlīdzināta} & \ chi ^ 2_c = \ summa \ frac {(O_i - E_i) ^ 2} {E_i} \ & \ textbf {kur:} \ & c = \ teksts {brīvības pakāpes} \ & O = \ teksts {novērotā vērtība (-s)} \ & E = \ teksts {paredzamā (-ās) vērtība (-as) } \ \ beigas {izlīdzinātas} χc2 = ∑Ei (Oi −Ei) 2, kur: c = brīvības pakāpesO = novērotā vērtība (-s) E = paredzamā (-ās) vērtība (-as)
Ko Chi-Square statistika jums saka?
Pastāv divi galvenie četru kvadrātu veidu veidi: neatkarības pārbaude, kurā tiek uzdots jautājums par attiecībām, piemēram, "Vai pastāv saistība starp dzimumu un SAT vērtējumu?"; un derīguma pārbaude, kurā tiek uzdots kaut kas līdzīgs: "Ja monētu iemet 100 reizes, vai tā nāks virs galvas 50 reizes un astes 50 reizes?"
Šajos testos tiek izmantotas brīvības pakāpes, lai noteiktu, vai noteiktu nulles hipotēzi var noraidīt, pamatojoties uz kopējo mainīgo un paraugu skaitu eksperimentā.
Piemēram, apsverot studentus un kursa izvēli, izlases lielums 30 vai 40 studenti, iespējams, nav pietiekami lieli, lai iegūtu nozīmīgus datus. Tādu pašu vai līdzīgu rezultātu iegūšana no pētījuma, kurā izmanto 400 vai 500 studentu izlasi, ir pamatotāka.
Citā piemērā apsveriet iespēju nomest monētu 100 reizes. Gaidāmais rezultāts, metot taisnīgu monētu 100 reizes, ir tāds, ka galvas uzcels 50 reizes un astes - 50 reizes. Faktiskais rezultāts varētu būt tāds, ka galvas uznāk 45 reizes un astes - 55 reizes. Chi-square statistika rāda jebkādas neatbilstības starp sagaidāmajiem rezultātiem un faktiskajiem rezultātiem.
Chi-kvadrāta testa piemērs
Iedomājieties, ka izlases veida aptaujā piedalījās 2000 dažādu vēlētāju - gan vīriešu, gan sieviešu. Cilvēki, kuri atbildēja, tika klasificēti pēc dzimuma un tā, vai viņi bija republikas, demokrāti vai neatkarīgi. Iedomājieties režģi ar kolonnām, kas apzīmētas ar republikāņu, demokrātu un neatkarību, un divām rindām ar marķējumu vīrietis un sieviete. Pieņemsim, ka 2000 respondentu dati ir šādi:
Pirmais solis, lai aprēķinātu statistiku par chi kvadrātu, ir paredzamo frekvenču atrašana. Tos aprēķina katrai režģa "šūnai". Tā kā ir divas dzimumu kategorijas un trīs politiskā viedokļa kategorijas, ir paredzamas sešas frekvences. Paredzamā biežuma formula ir šāda:
E (r, c) = n (r) × c (r) n kur: r = rinda questionc = apšaubāmā kolonna = atbilstošā kopsumma \ sākas {saskaņots} un E (r, c) = \ frac {n (r) reizes c (r)} {n} \ & \ textbf {kur:} \ & r = \ teksts {attiecīgā rinda} \ & c = \ teksts {attiecīgā kolonna} \ & n = \ teksts {atbilstošā kopsumma} \ \ beigas {izlīdzināts} E (r, c) = nn (r) × c (r) kur: r = rindā questionc = jautājuma kolonnā = atbilstošā kopsumma
Šajā piemērā paredzamās frekvences ir:
- E (1, 1) = (900 x 800) / 2 000 = 360E (1, 2) = (900 x 800) / 2 000 = 360E (1, 3) = (200 x 800) / 2 000 = 80E (2, 1) = (900 x 1 200) / 2 000 = 540E (2, 2) = (900 x 1 200) / 2 000 = 540E (2, 3) = (200 x 1 200) / 2 000 = 120
Tālāk šīs tiek izmantotas vērtības, lai aprēķinātu chi kvadrāta statistiku, izmantojot šādu formulu:
Chi-kvadrāts = ∑2E (r, c) kur: O (r, c) = novērotie dati dotajā rindā un kolonnā \ sākas {saskaņots} & \ teksts {Chi-kvadrātā} = \ summa \ frac {^ 2} {E (r, c)} \ & \ textbf {kur:} \ & O (r, c) = \ teksts {novērotie dati par doto rindu un kolonnu} \ \ beigas {izlīdzināts} Chi-square = ∑E (r, c) 2, kur: O (r, c) = novērotie dati attiecīgajā rindā un kolonnā
Šajā piemērā katras novērotās vērtības izteiksme ir:
- O (1, 1) = (400 - 360) 2/360 = 4, 44O (1, 2) = (300 - 360) 2/360 = 10O (1, 3) = (100 - 80) 2/80 = 5O (2, 1) = (500 - 540) 2/540 = 2, 96 O (2, 2) = (600 - 540) 2/540 = 6, 67 O (2, 3) = (100 - 120) 2/120 = 3, 33
Chi-kvadrāta statistika ir vienāda ar šo vērtību summu vai 32.41. Pēc tam mēs varam apskatīt chi-kvadrātu statistikas tabulu, lai redzētu, ņemot vērā mūsu iestatījuma brīvības pakāpes, vai rezultāts ir statistiski nozīmīgs vai nē.
