Kas ir dispersijas analīze (ANOVA)?
Dispersijas analīze (ANOVA) ir statistikā izmantots analīzes rīks, kas sadalās novēroto kopējo mainīgumu, kas atrodams datu kopā, divās daļās: sistemātiskos faktoros un nejaušības faktoros. Sistemātiskajiem faktoriem ir statistiska ietekme uz doto datu kopu, bet izlases veida faktoriem tas nav. Analītiķi izmanto ANOVA testu, lai noteiktu neatkarīgo mainīgo ietekmi uz atkarīgo mainīgo regresijas pētījumā.
20. gadsimtā izstrādātās t- un z-testa metodes statistiskajā analīzē tika izmantotas līdz 1918.gadam, kad Ronalds Fišers izveidoja dispersijas metodes analīzi. ANOVA sauc arī par Fišera dispersijas analīzi, un tā ir t- un z-testu pagarināšana. Šis termins kļuva plaši pazīstams 1925. gadā pēc parādīšanās Fišera grāmatā "Pētniecības darbinieku statistiskās metodes". To izmantoja eksperimentālajā psiholoģijā un vēlāk izvērsa sarežģītākos priekšmetos.
ANOVA formula ir:
Visiem, kas noklusina, tacu F = MSEMST kur: F = ANOVA koeficientsMST = vidējā kvadrātu summa apstrādes dēļMSE = vidējā kvadrātu summa kļūdas dēļ
Ko atklāj dispersijas analīze?
ANOVA tests ir sākotnējais solis, analizējot faktorus, kas ietekmē doto datu kopu. Kad pārbaude ir pabeigta, analītiķis veic papildu testēšanu ar metodiskajiem faktoriem, kas izmērāmi veicina datu kopas neatbilstību. Analītiķis izmanto ANOVA testa rezultātus f-testā, lai iegūtu papildu datus, kas atbilst ierosinātajiem regresijas modeļiem.
ANOVA tests ļauj salīdzināt vairāk nekā divas grupas vienlaikus, lai noteiktu, vai starp tām pastāv saistība. ANOVA formulas rezultāts, F statistika (ko sauc arī par F koeficientu), ļauj analizēt vairākas datu grupas, lai noteiktu mainīgumu starp paraugiem un paraugu iekšienē.
Ja starp pārbaudītajām grupām nepastāv reālas atšķirības, ko sauc par nulles hipotēzi, ANOVA F attiecības statistikas rezultāts būs tuvu 1. Svārstības izlases veidošanā, iespējams, sekos Fišera F sadalījumam. Šī faktiski ir sadalījuma funkciju grupa ar diviem raksturīgiem skaitļiem, ko sauc par skaitītāja brīvības pakāpēm un saucēju par brīvības pakāpēm.
Taustiņu izņemšana
- Dispersijas analīze jeb ANOVA ir statistikas metode, kas novērotos dispersijas datus atdala dažādos komponentos, lai tos izmantotu papildu pārbaudēs. Vienvirziena ANOVA izmanto trim vai vairāk datu grupām, lai iegūtu informāciju par saistību starp atkarīgo un neatkarīgi mainīgie.Ja starp grupām nepastāv patiesa dispersija, ANOVA F koeficientam jābūt vienādam ar tuvu 1.
ANOVA lietošanas piemērs
Pētnieks, piemēram, var pārbaudīt studentus no vairākām koledžām, lai noskaidrotu, vai studenti no vienas koledžas konsekventi pārspēj studentus no citām koledžām. Uzņēmējdarbības lietojumprogrammā R&D pētnieks var pārbaudīt divus dažādus produkta radīšanas procesus, lai redzētu, vai viens process ir labāks par otru izmaksu efektivitātes ziņā.
Izmantotā ANOVA testa veids ir atkarīgs no vairākiem faktoriem. To lieto gadījumos, kad datiem jābūt eksperimentāliem. Variances analīze tiek izmantota, ja nav piekļuves statistikas programmatūrai, kuras rezultātā ANOVA tiek aprēķināta ar roku. Tas ir vienkārši lietojams un vislabāk piemērots maziem paraugiem. Daudzos eksperimentālos projektos izlases lielumam jābūt vienādam dažādu faktoru līmeņa kombinācijām.
ANOVA ir noderīga trīs vai vairāku mainīgo testēšanai. Tas ir līdzīgs vairākiem divu paraugu t-testiem. Tomēr tas rada mazāk I tipa kļūdu un ir piemērots virknei problēmu. ANOVA sadala atšķirības, salīdzinot katras grupas līdzekļus, un ietver dispersijas izkliedi dažādos avotos. Tas tiek nodarbināts ar priekšmetiem, testa grupām, starp grupām un grupu iekšienē.
Vienvirziena ANOVA pret Divvirzienu ANOVA
Pastāv divu veidu ANOVA: vienvirziena (vai vienvirziena) un divvirzienu. Vienvirziena vai divvirzienu virziens norāda uz neatkarīgo mainīgo skaitu jūsu dispersijas testa analīzē. Vienvirziena ANOVA novērtē vienīgā faktora ietekmi uz vienas reakcijas mainīgo. Tas nosaka, vai visi paraugi ir vienādi. Vienvirziena ANOVA tiek izmantota, lai noteiktu, vai pastāv statistiski nozīmīgas atšķirības starp trīs vai vairāk neatkarīgu (nesaistītu) grupu vidējiem rādītājiem.
Divvirzienu ANOVA ir vienvirziena ANOVA paplašinājums. Izmantojot vienvirziena, jums ir viens neatkarīgs mainīgais, kas ietekmē atkarīgo mainīgo. Ar divvirzienu ANOVA ir divi neatkarīgie. Piemēram, divvirzienu ANOVA ļauj uzņēmumam salīdzināt darbinieku produktivitāti, pamatojoties uz diviem neatkarīgiem mainīgajiem, piemēram, algu un prasmju kopumu. To izmanto, lai novērotu mijiedarbību starp diviem faktoriem un vienlaikus pārbaudītu divu faktoru iedarbību.
