Kas ir multiklinearitāte?
Daudzkrāsainība ir lielu savstarpējo saistību parādīšanās starp neatkarīgiem mainīgajiem daudzkārtējās regresijas modelī. Daudzkrāsainība var radīt šķībus vai maldinošus rezultātus, kad pētnieks vai analītiķis mēģina noteikt, cik labi katru neatkarīgo mainīgo var visefektīvāk izmantot, lai prognozētu vai izprastu atkarīgo mainīgo statistiskajā modelī. Kopumā daudzkolīniskums var izraisīt lielākus ticamības intervālus un mazāk ticamas varbūtību vērtības neatkarīgajiem mainīgajiem. Tas ir, statistiskie secinājumi no modeļa ar daudzkrāsu līniju var nebūt uzticami.
Izpratne par daudzkolīniju
Statistikas analītiķi izmanto vairākus regresijas modeļus, lai prognozētu noteikta atkarīgā mainīgā lielumu, pamatojoties uz divu vai vairāku neatkarīgu mainīgo vērtībām. Atkarīgo mainīgo dažreiz sauc par iznākuma, mērķa vai kritērija mainīgo. Kā piemēru var minēt daudzdaļīgu regresijas modeli, kas mēģina paredzēt akciju atdevi, pamatojoties uz tādiem posteņiem kā cenu un peļņas attiecība, tirgus kapitalizācija, iepriekšējie rezultāti vai citi dati. Akciju ienesīgums ir atkarīgs mainīgais lielums, un dažādie finanšu datu biti ir neatkarīgi mainīgie.
Taustiņu izņemšana
- Daudzkoloģiskums ir statistikas jēdziens, kurā modeļa neatkarīgie mainīgie ir savstarpēji saistīti.Multicollinearitāte starp neatkarīgiem mainīgajiem radīs mazāk ticamus statistiskos secinājumus. Labāk ir izmantot neatkarīgus mainīgos, kas nav savstarpēji saistīti vai atkārtojas, veidojot vairākus regresijas modeļus, kas izmanto divus vai vairākus mainīgos lielumus..
Daudzkrāsainība daudzkārtējās regresijas modelī norāda, ka kolineārie neatkarīgi mainīgie ir zināmā mērā saistīti, lai gan attiecības var būt vai nebūt gadījuma rakstura. Piemēram, iepriekšējie rezultāti var būt saistīti ar tirgus kapitalizāciju, jo akcijām, kuru darbība iepriekš bijusi laba, tirgus vērtības pieaugs. Citiem vārdiem sakot, daudzkrāsainība var pastāvēt, ja divi neatkarīgi mainīgie ir ļoti savstarpēji saistīti. Tas var notikt arī tad, ja neatkarīgu mainīgo aprēķina no citiem datu kopas mainīgajiem vai ja divi neatkarīgi mainīgie sniedz līdzīgus un atkārtotus rezultātus.
Viens no visizplatītākajiem veidiem, kā novērst daudzkrāsu problēmu, ir vispirms identificēt kolineāros neatkarīgos mainīgos un pēc tam noņemt visus, izņemot vienu. Ir iespējams arī novērst daudzkolīniju, apvienojot divus vai vairākus kolineārus mainīgos vienā mainīgā lielumā. Pēc tam var veikt statistisko analīzi, lai izpētītu attiecības starp norādīto atkarīgo mainīgo un tikai vienu neatkarīgo mainīgo.
Daudzkoloģiskuma piemērs
Veicot tehnisko analīzi, lai veiktu ieguldījuma vērtspapīru, piemēram, akciju vai preču nākotnes, cenu iespējamās izmaiņas nākotnē, bieži tiek ņemts vērā daudzkolīniskums. Tirgus analītiķi vēlas izvairīties no tehnisku rādītāju, kas ir kolineāri, jo to pamatā ir ļoti līdzīgi vai saistīti dati; tie mēdz atklāt līdzīgas prognozes par cenu kustības atkarīgo mainīgo. Tā vietā tirgus analīzei jābalstās uz ievērojami atšķirīgiem neatkarīgiem mainīgajiem, lai nodrošinātu, ka tie analizē tirgu no dažādiem neatkarīgiem analītiskiem viedokļiem.
Ievērojamais tehniskais analītiķis Džons Bollingers, Bollinger Bands indikatora izveidotājs, norāda, ka "kardināls noteikums veiksmīgai tehniskās analīzes izmantošanai prasa izvairīties no daudzkolīniskuma rādītājiem".
Lai atrisinātu problēmu, analītiķi izvairās izmantot divus vai vairākus viena veida tehniskos rādītājus. Tā vietā viņi analizē vērtspapīru, izmantojot viena veida indikatorus, piemēram, impulsa indikatoru, un pēc tam veic atsevišķu analīzi, izmantojot cita veida indikatorus, piemēram, tendences indikatoru.
Potenciālas daudzkolīniskuma problēmas piemērs ir tehniskās analīzes veikšana, izmantojot tikai vairākus līdzīgus rādītājus, piemēram, stohastiku, relatīvā stipruma indeksu (RSI) un Williams% R, kas visi ir impulsa indikatori, kuri paļaujas uz līdzīgām izejvielām un, domājams, ražos līdzīgus rezultāti. Šajā gadījumā labāk ir noņemt visus rādītājus, izņemot vienu, vai atrast veidu, kā vairākus no tiem apvienot tikai vienā indikatorā, vienlaikus pievienojot arī tendences indikatoru, kas, visticamāk, nav ļoti korelēts ar impulsa indikatoru.
