Dispersija ir skaitļa starpības mērīšana datu kopā. Variants mēra, cik tālu katrs kopas skaitlis ir no vidējā.
Izmantojot datu kopas diagrammu, mēs varam novērot, kāda ir dažādu datu punktu jeb skaitļu lineārā attiecība. Mēs to darām, novelkot regresijas līniju, kas mēģina samazināt jebkura atsevišķa datu punkta attālumu no pašas līnijas. Zemāk redzamajā tabulā datu punkti ir zilie punkti, oranžā līnija ir regresijas līnija, un sarkanās bultiņas ir attālums no novērotajiem datiem un regresijas līnija.
Attēla Džūlija Banga © Investopedia 2020
Aprēķinot dispersiju, mēs jautājam, cik lielu attālumu mēs sagaidām nākamajā datu punktā, ņemot vērā visu šo datu punktu attiecības? Šo "attālumu" sauc par kļūdas terminu, un to mēra dispersija.
Pati par sevi dispersija nav bieži noderīga, jo tai nav vienības, kas apgrūtina izmērīšanu un salīdzināšanu. Tomēr dispersijas kvadrātsakne ir standarta novirze, un tā ir gan praktiska mērīšana.
Variances aprēķināšana programmā Excel
Aprēķināt dispersiju programmā Excel ir viegli, ja datu kopa jau ir ievadīta programmatūrā. Zemāk redzamajā piemērā mēs aprēķināsim 20 dienu ikdienas ienesīguma dispersiju ļoti populārajā biržā tirgotajā fondā (ETF) ar nosaukumu SPY, kas iegulda S&P 500.
- Formula ir = VAR.S (atlasīt datus)
Iemesls, kāpēc vēlaties izmantot VAR.S, nevis VAR.P (kas ir vēl viena piedāvātā formula), ir tas, ka bieži vien jums nav visu datu kopuma, ko izmērīt. Piemēram, ja mūsu tabulā būtu visi SPY ETF atdeves vēsturē, mēs varētu izmantot populācijas mērījumu VAR.P, bet, tā kā mēs jēdziena ilustrēšanai mēra tikai pēdējās 20 dienas, mēs izmantosim VAR.S.
Kā redzat, aprēķinātā dispersijas vērtība.000018674 pati par sevi maz liecina par datu kopu. Ja mēs turpinātu pie šīs vērtības kvadrātsaknes, lai iegūtu atdeves standarta novirzi, tas būtu noderīgāk.
