Kāds ir noteikšanas koeficients?
Noteikšanas koeficients ir statistiskajā analīzē izmantots mērs, kas novērtē, cik labi modelis izskaidro un prognozē turpmākos rezultātus. Tas norāda uz datu kopas izskaidroto mainīgumu. Noteikšanas koeficients, ko mēdz dēvēt arī par “R-kvadrātu”, tiek izmantots kā vadlīnijas modeļa precizitātes mērīšanai.
Viens veids, kā interpretēt šo skaitli, ir teikt, ka mainīgajā modelī iekļautie mainīgie izskaidro aptuveni x% no novērotajām variācijām. Tātad, ja R2 = 0, 50, tad aptuveni puse no novērotajām variācijām ir izskaidrojama ar modeli.
R-kvadrātā
Taustiņu izņemšana
- Noteikšanas koeficients ir sarežģīta ideja, kuras centrā ir nākotnes datu modeļa statistiskā analīze. Noteikšanas koeficientu izmanto, lai izskaidrotu, cik lielu viena faktora mainīgumu var izraisīt tā saistība ar citu faktoru.
Izpratnes koeficienta izpratne
Noteikšanas koeficientu izmanto, lai izskaidrotu, cik lielu viena faktora mainīgumu var izraisīt tā saistība ar citu faktoru. To ļoti paļauj tendenču analīzē, un to attēlo kā vērtību no 0 līdz 1.
Jo tuvāk vērtībai ir 1, jo labāka ir abu faktoru atbilstība vai saistība. Noteikšanas koeficients ir korelācijas koeficienta kvadrāts, kas pazīstams arī kā "R", kas ļauj tam parādīt lineāro korelācijas pakāpi starp diviem mainīgajiem.
Šī korelācija ir pazīstama kā "piemērotības piemērotība". Vērtība 1, 0 norāda uz perfektu piemērotību, un tādējādi tas ir ļoti uzticams modelis nākotnes prognozēm, norādot, ka modelis izskaidro visas novērotās izmaiņas. No otras puses, vērtība 0 norāda, ka modelim nav iespējams precīzi modelēt datus. Modelim ar vairākiem mainīgiem lielumiem, piemēram, daudzkārtējas regresijas modelim, labāks noteikšanas koeficients ir koriģētais R2. Ekonomikā R 2 vērtību virs 0, 60 uzskata par vērtīgu.
Noteikšanas koeficienta analīzes priekšrocības
Noteikšanas koeficients ir korelācijas kvadrāts starp prognozētajiem rādītājiem datu kopā ar faktisko punktu kopu. To var izteikt arī kā korelācijas kvadrātu starp X un Y vērtībām, X ir neatkarīgais mainīgais un Y ir atkarīgs mainīgais.
Neatkarīgi no attēlojuma R kvadrāts, kas vienāds ar 0, nozīmē, ka atkarīgo mainīgo nevar paredzēt, izmantojot neatkarīgo mainīgo. Un otrādi, ja tas ir vienāds ar 1, tas nozīmē, ka mainīgā atkarību vienmēr prognozē neatkarīgais mainīgais.
Šajā diapazonā esošais noteikšanas koeficients mēra to, cik lielā mērā neatkarīgais mainīgais prognozē atkarīgo mainīgo. Piemēram, R kvadrāts 0, 20 nozīmē, ka neatkarīgais mainīgais paredz 20% no atkarīgā mainīgā.
Piemērotības pakāpe vai lineārās korelācijas pakāpe mēra attālumu starp diagrammā uzstādīto līniju un visiem datu punktiem, kas ir izkaisīti pa grafiku. Šaurā datu kopā būs regresijas līnija, kas ir ļoti tuvu punktiem un ir ļoti piemērota, tas nozīmē, ka attālums starp līniju un datiem ir ļoti mazs. Labam piemērotumam ir R kvadrāts, kas ir tuvu 1.
Tomēr R kvadrāts nespēj noteikt, vai datu punkti vai prognozes ir neobjektīvas. Tas arī nenosaka analītiķim vai lietotājam, vai noteikšanas koeficients ir labs vai nē. Piemēram, zems R kvadrāts nav slikts, un personai ir jāpieņem lēmums, pamatojoties uz R kvadrāta numuru.
Noteikšanas koeficientu nevajadzētu interpretēt naivi. Piemēram, ja modeļa R kvadrāts ir 75%, tā kļūdu novirze ir par 75% mazāka nekā atkarīgā mainīgā dispersija, un tā kļūdu standartnovirze ir par 50% mazāka nekā atkarīgā standarta novirze mainīgs. Modeļa kļūdu standartnovirze ir aptuveni viena trešdaļa no kļūdu standartnovirzes, ko jūs varētu iegūt ar tikai nemainīgu modeli.
Visbeidzot, pat ja R kvadrāta vērtība ir liela, modelī skaidrojošajiem mainīgajiem var nebūt statistiskas nozīmes, vai arī praktiski šo mainīgo faktiskais lielums var būt ļoti mazs.
