Kas ir multiplārā lineārā regresija - MLR?
Daudzkārtējā lineārā regresija (MLR), kas pazīstama arī kā daudzkārtējā regresija, ir statistikas paņēmiens, kas izmanto vairākus skaidrojošos mainīgos, lai paredzētu reakcijas mainīgā iznākumu. Daudzkārtējās lineārās regresijas (MLR) mērķis ir modelēt lineāro sakarību starp skaidrojošajiem (neatkarīgajiem) mainīgajiem un atbildes (atkarīgajiem) mainīgajiem.
Būtībā daudzkāršā regresija ir parastās mazāko kvadrātu (OLS) regresijas pagarinājums, kas ietver vairāk nekā vienu skaidrojošo mainīgo.
Vairāku lineāru regresiju formula ir
Visiem, kas noklusina, tacu Yi = β0 + β1 xi1 + β2 xi2 +… + βp xip + ϵ kur, i = n novērojumiem: yi = atkarīgs mainīgaisxi = izplešanās mainīgaisβ0 = y-pārtvērums (konstante termins) βp = katra skaidrojošā mainīgā slīpuma koeficientiϵ = modeļa kļūdas termins (pazīstams arī kā atlikumi)
Vairāku lineāru regresiju izskaidrošana
Vienkārša lineārā regresija ir funkcija, kas ļauj analītiķim vai statistiķim veikt prognozes par vienu mainīgo, pamatojoties uz informāciju, kas ir zināma par citu mainīgo. Lineāro regresiju var izmantot tikai tad, ja vienam ir divi nepārtraukti mainīgie - neatkarīgs mainīgais un atkarīgs mainīgais. Neatkarīgais mainīgais ir parametrs, kuru izmanto, lai aprēķinātu atkarīgo mainīgo vai rezultātu. Vairāku regresiju modelis attiecas uz vairākiem skaidrojošiem mainīgajiem.
Daudzkārtējās regresijas modeļa pamatā ir šādi pieņēmumi:
- Starp atkarīgajiem mainīgajiem un neatkarīgajiem mainīgajiem ir lineāra sakarība. Neatkarīgie mainīgie nav pārāk savstarpēji korelēti.y i novērojumi tiek izvēlēti neatkarīgi un nejauši no populācijas.Relatīvi parasti jāsadala ar vidējo vērtību 0 un dispersiju. σ.
Noteikšanas koeficients (R-kvadrātā) ir statistikas rādītājs, ko izmanto, lai izmērītu, cik lielu iznākuma variāciju var izskaidrot ar neatkarīgo mainīgo izmaiņām. R 2 vienmēr palielinās, jo MLR modelim tiek pievienots vairāk pareģotāju, kaut arī prognozētāji var nebūt saistīti ar iznākuma mainīgo.
Tādējādi R2 pats par sevi nevar izmantot, lai noteiktu, kuri pareģi būtu jāiekļauj modelī un kuri jāizslēdz. R2 var būt tikai no 0 līdz 1, kur 0 norāda, ka iznākumu nevar paredzēt neviens no neatkarīgajiem mainīgajiem, un 1 norāda, ka iznākumu var prognozēt bez kļūdām no neatkarīgajiem mainīgajiem.
Interpretējot daudzkārtējās regresijas rezultātus, beta koeficienti ir derīgi, turot visus pārējos mainīgos nemainīgus ("visi pārējie vienādi"). Vairāku regresiju izvadi var parādīt horizontāli kā vienādojumu vai vertikāli tabulas formā.
Piemērs, izmantojot vairāku lineāru regresiju
Piemēram, analītiķis varētu vēlēties uzzināt, kā tirgus kustība ietekmē Exxon Mobil (XOM) cenu. Šajā gadījumā viņa lineārajam vienādojumam būs S&P 500 indeksa kā neatkarīga mainīgā vai prognozētāja vērtība un XOM kā atkarīgā mainīgā vērtība.
Patiesībā ir vairāki faktori, kas paredz notikuma iznākumu. Piemēram, Exxon Mobil cenu kustība ir atkarīga ne tikai no kopējā tirgus snieguma. Citi prognozētāji, piemēram, naftas cena, procentu likmes un naftas fjūčeru cenu kustība var ietekmēt XOM cenu un citu naftas kompāniju akciju cenas. Lai saprastu attiecības, kurās ir vairāk nekā divi mainīgie, tiek izmantota daudzkārtējā lineārā regresija.
Vairāku lineāro regresiju (MLR) izmanto, lai noteiktu matemātisko sakarību starp vairākiem nejaušiem mainīgajiem. Citiem vārdiem sakot, MLR pārbauda, kā vairāki neatkarīgi mainīgie ir saistīti ar vienu atkarīgo mainīgo. Kad katrs neatkarīgais faktors ir noteikts, lai prognozētu atkarīgo mainīgo, informāciju par vairākiem mainīgajiem var izmantot, lai izveidotu precīzu prognozi par to, kāds ir to ietekmes līmenis uz iznākuma mainīgo. Modelis rada attiecības taisnas līnijas (lineāras) formā, kas vislabāk tuvina visus atsevišķos datu punktus.
Atsaucoties uz iepriekš minēto MLR vienādojumu, mūsu piemērā:
- y i = atkarīgs mainīgais: XOMx cena i1 = procentu likmes x i2 = naftas cena x i3 = S&P 500 indeksa vērtība x i4 = naftas fjūčeru cenaB 0 = y-krustojums laikā nulleB 1 = regresijas koeficients, kas mēra vienības izmaiņas atkarīgajā mainīgs, mainoties x i1 - izmaiņas XOM cenā, mainoties procentu likmēmB 2 = koeficienta vērtība, kas mēra vienības izmaiņas atkarīgajā mainīgajā, mainoties x i2 - XOM cenas izmaiņas, mainoties naftas cenām
Vismazāko kvadrātu aprēķini, B 0, B 1, B 2 … B p, parasti tiek aprēķināti ar statistikas programmatūru. Tā kā daudzus mainīgos var iekļaut regresijas modelī, kurā katrs neatkarīgais mainīgais tiek diferencēts ar skaitli - 1, 2, 3, 4… p. Vairāku regresiju modelis ļauj analītiķim paredzēt iznākumu, pamatojoties uz informāciju, kas sniegta par vairākiem skaidrojošiem mainīgajiem.
Tomēr modelis ne vienmēr ir pilnīgi precīzs, jo katrs datu punkts var nedaudz atšķirties no modeļa prognozētā rezultāta. Atlikušo vērtību E, kas ir starpība starp faktisko un prognozēto iznākumu, iekļauj modelī, lai ņemtu vērā šādas nelielās izmaiņas.
Pieņemot, ka mēs izmantojam mūsu XOM cenu regresijas modeli, izmantojot statistikas skaitļošanas programmatūru, kas nodrošina šo izvadi:
Analītiķis šo izlaidumu interpretētu tādējādi, ka, ja citi mainīgie lielumi tiek turēti nemainīgi, XOM cena paaugstināsies par 7, 8%, ja naftas cena tirgos palielināsies par 1%. Modelis arī parāda, ka XOM cena samazināsies par 1, 5% pēc procentu likmju paaugstināšanās par 1%. R 2 norāda, ka 86, 5% no Exxon Mobil akciju cenu izmaiņām var izskaidrot ar procentu likmju, naftas cenas, naftas fjūčeru un S&P 500 indeksa izmaiņām.
Taustiņu izņemšana
- Daudzkārtējā lineārā regresija (MLR), kas pazīstama arī kā daudzkārtējā regresija, ir statistikas paņēmiens, kurā reakcijas mainīgā rezultāta prognozēšanai tiek izmantoti vairāki skaidrojošie mainīgie. Daudzkārtējā regresija ir lineārās (OLS) regresijas pagarinājums, kurā tiek izmantots tikai viens skaidrojošais mainīgais. MLR tiek plaši izmantots ekonometrijā un finanšu secinājumos.
Atšķirība starp lineāro un daudzkārto regresiju
Lineārā (OLS) regresija salīdzina atkarīgā mainīgā reakciju, ņemot vērā izmaiņas dažos skaidrojošos mainīgajos. Tomēr reti, ja atkarīgs mainīgais tiek izskaidrots tikai ar vienu mainīgo. Šajā gadījumā analītiķis izmanto vairāku regresiju, kas mēģina izskaidrot atkarīgo mainīgo, izmantojot vairāk nekā vienu neatkarīgu mainīgo. Vairākas regresijas var būt lineāras un nelineāras.
Vairāku regresiju pamatā ir pieņēmums, ka pastāv atkarība starp atkarīgajiem un neatkarīgajiem mainīgajiem. Tas arī neuzņemas būtisku korelāciju starp neatkarīgajiem mainīgajiem.
