Kas ir Winsorized nozīmē?
Winsorizētais vidējais ir vidējās vērtības metode, kas sākotnēji mazākās un lielākās vērtības aizstāj ar tām vistuvākajiem novērojumiem. Tas tiek darīts, lai ierobežotu nenormālu galējo vērtību jeb noviržu ietekmi uz aprēķinu. Pēc vērtību aizstāšanas vidējo aritmētisko formulu izmanto, lai aprēķinātu vidējo koeficientu, kas iegūts uz uzvaru.
Winsorizētā vidējā līmeņa formula ir
Visiem, kas noklusina, tacu Winsorized Mean = Nxn… xn + 1 + xn + 2… xn, kur: n = lielāko un mazāko datu punktu skaits, kas jāaizstāj ar novērojumu
Winsorizētos līdzekļus izsaka divējādi. Ar “k n ” vidējo vērtību norāda uz “k” mazāko un lielāko novērojumu aizstāšanu, kur “k” ir vesels skaitlis. Ar “X%” vidējo vērtību vidējais lielums ir noteikta vērtības procentuālā aizstāšana no abiem datu galiem.
Kā aprēķināt vidējo koeficientu
Vidējo uzvaras koeficientu aprēķina, aizstājot mazāko un lielāko datu punktu daudzumu, pēc tam summējot visus datu punktus un summu dalot ar kopējo datu punktu skaitu.
Ko stāsta Winsorized?
Vidējais uzvaras koeficients ir mazāk jutīgs pret novirzēm, jo tas var tos aizstāt ar mazāk galējām vērtībām. Tas ir, tas ir mazāk pakļauts kontūrām salīdzinājumā ar vidējo. Tomēr, ja sadalījumam ir tauku astes, sadalījuma augstāko un zemāko vērtību noņemšanai nebūs lielas ietekmes, jo sadalījuma skaitļos ir ļoti daudz mainību.
Taustiņu izņemšana
- Vidējā metode, kas ietver mazāko un lielāko vērtību aizstāšanu ar tām vistuvākajiem novērojumiem. Mazāk jutīga pret novirzēm, jo tā var tās aizstāt ar mazāk ekstrēmām vērtībām. Atšķirībā no saīsinātā vidējā lieluma, kas saistīts ar datu punktu noņemšanu, kaut arī šo divu rezultātu rezultāts mēdz būt tuvu.
Winsorized Mean lietošanas piemērs
Var aprēķināt vidējo koeficientu uzvarošai vērtībai sekojošai datu kopai: 1, 5, 7, 8, 9, 10, 14. Šajā piemērā mēs pieņemam, ka vidējais uzvaras koeficients ir pirmajā secībā, un mazākās un lielākās vērtības aizstājam ar tuvākie novērojumi.
Tagad datu kopa parādās šādi: 5, 5, 7, 8, 9, 10, 10. Ja jaunās kopas vidējais aritmētiskais tiek iegūts, vidējais uzvaras koeficients ir 7, 7 vai (5 + 5 + 7 + 8 + 9 + 10 +). 10) dalīts ar 7.
Vai arī apsveriet 20% vidējo koeficientu, kura vidējais lielums ir 10% un apakšējais 10%, un aizvieto tos ar nākamo tuvāko vērtību. Mēs uzvarēsim šādu datu kopu: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. mazākie un lielākie datu punkti jeb 10% tiks aizstāti ar nākamo tuvāko vērtību. Tādējādi jaunā datu kopa ir: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. vidējais ir 33, 9 jeb kopējais datu skaits (678) dalīts ar kopējo datu punktu skaitu (20).
Atšķirība starp winsorizēto un apgriezto vidējo
Vidējais uzvaras koeficients ietver datu punktu modificēšanu, savukārt samazināts vidējais ir saistīts ar datu punktu noņemšanu. Parasti visticamākais un apgrieztais vidējais ir tuvu.
Winsorized Mean lietošanas ierobežojumi
Viens no lielākajiem negatīvajiem uzvaras veidotajiem līdzekļiem ir tas, ka tie datu bāzē ievieš neobjektivitāti. Piešķirts, ka datu kopa pēc pārveidošanas ir ideāli neobjektīvāka nekā tad, ja atlikušās vērtības būtu atstātas.
Uzziniet vairāk par Winsorized Mean
Saistītam ieskatam par atšķirībām starp galvenajiem vidējiem aprēķiniem.
