Kas ir neparametriskā statistika?
Neparametriskā statistika attiecas uz statistikas metodi, kurā dati nav nepieciešami, lai ietilptu normālā sadalījumā. Neparametriskā statistikā tiek izmantoti dati, kas bieži ir parasti, kas nozīmē, ka tā nepaļaujas uz skaitļiem, bet drīzāk uz rangu vai šķiru secību. Piemēram, apsekojums, kurā patērētāji izvēlas dažādas vēlmes, sākot no patikas līdz nepatikai, tiek uzskatīti par kārtējiem datiem.
Neparametriskā statistika ietver neparametrisko aprakstošo statistiku, statistiskos modeļus, secinājumus un statistiskos testus. Neparametrisko modeļu struktūras struktūra nav noteikta a priori, bet gan tiek noteikta pēc datiem. Ar terminu “ neparametrisks” nav domāts, ka šādiem modeļiem pilnīgi trūkst parametru, bet gan tas, ka parametru skaits un raksturs ir elastīgs un nav iepriekš noteikts. Histogramma ir varbūtības sadalījuma neparametriska novērtējuma piemērs.
Neparametriskās statistikas izpratne
Statistikā parametriskā statistika ietver tādus parametrus kā vidējais, vidējais, standartnovirze, dispersija utt. Šajā statistikas formā tiek izmantoti novērotie dati, lai novērtētu sadalījuma parametrus. Saskaņā ar parametrisko statistiku tiek pieņemts, ka dati atbilst normālam sadalījumam ar nezināmiem parametriem μ (populācijas vidējais lielums) un σ 2 (populācijas dispersija), kurus pēc tam aprēķina, izmantojot parauga vidējo lielumu un izlases dispersiju.
Neparametriskā statistika neizdara pieņēmumu par izlases lielumu vai to, vai novērotie dati ir kvantitatīvi.
Neparametriskā statistika neuzskata, ka dati tiek iegūti no normāla sadalījuma. Tā vietā, izmantojot šo statistisko mērījumu formu, tiek novērtēta sadalījuma forma. Lai gan daudzās situācijās var pieņemt normālu izplatīšanu, ir arī daži scenāriji, kuros nebūs iespējams noteikt, vai dati tiks izplatīti normāli.
Neparametriskas statistikas piemēri
Pirmajā piemērā apsveriet iespēju pētniekam, kurš vēlas aprēķināt mazuļu skaitu Ziemeļamerikā, kas dzimuši ar brūnām acīm, var nolemt ņemt paraugu no 150 000 mazuļiem un veikt datu kopas analīzi. To iegūtais mērījums tiks izmantots kā visu to mazuļu populācijas aprēķins, kuriem ir brūnas acis un kas dzimuši nākamajā gadā.
Otrajā piemērā apsveriet citu pētnieku, kurš vēlas uzzināt, vai gulēt agri vai vēlu ir saistīts ar to, cik bieži cilvēks saslimst. Pieņemot, ka izlase tiek izvēlēta nejauši no populācijas, var uzskatīt, ka parauga lieluma sadalījums pēc slimības biežuma ir normāls. Tomēr nevar uzskatīt, ka eksperimentam, kas mēra cilvēka ķermeņa izturību pret baktēriju celmu, ir normāls sadalījums.
Tas notiek tāpēc, ka nejauši izvēlēti parauga dati var būt izturība pret celmu. No otras puses, ja pētnieks ņem vērā tādus faktorus kā ģenētiskais uzbūve un etniskā piederība, viņš var secināt, ka parauga lielums, kas izvēlēts, izmantojot šīs īpašības, var nebūt izturīgs pret celmu. Līdz ar to nevar pieņemt normālu sadalījumu.
Šī metode ir noderīga, ja datiem nav skaidras skaitliskas interpretācijas, un tos vislabāk izmantot ar datiem, kuriem ir šķirotība. Piemēram, personības novērtēšanas pārbaudē tās metriku var klasificēt kā izteikti nepiekrītu, nepiekrītu, vienaldzīgu, piekrist un pilnīgi piekrītu. Šajā gadījumā jāizmanto neparametriskās metodes.
Īpaši apsvērumi
Neparametriskā statistika ir guvusi atzinību, pateicoties to ērtai lietošanai. Atbrīvojoties no nepieciešamības pēc parametriem, dati kļūst piemērojamāki plašākam testu klāstam. Šāda veida statistiku var izmantot bez vidējā lieluma, izlases lieluma, standartnovirzes vai citu saistīto parametru novērtējuma, ja šāda informācija nav pieejama.
Tā kā neparametriskā statistika padara mazāk pieņēmumu par izlases datiem, tās piemērošana ir plašāka nekā parametru statistika. Gadījumos, kad parametriskā pārbaude ir piemērotāka, neparametriskās metodes būs mazāk efektīvas. Tas ir tāpēc, ka rezultātiem, kas iegūti no neparametriskās statistikas, ir zemāka ticamības pakāpe nekā tad, ja rezultāti būtu iegūti, izmantojot parametru statistiku.
Taustiņu izņemšana
- Neparametrisko statistiku ir viegli izmantot, taču tā nepiedāvā citu statistisko modeļu precīzu precizitāti. Šis analīzes veids ir vispiemērotākais, apsverot kaut ko pēc kārtas, kur pat tad, ja mainās skaitliskie dati, rezultāti, iespējams, paliks nemainīgi.
