Kāds ir empīriskais noteikums?
Empīriskais noteikums, ko dēvē arī par trīs sigmas likumu vai 68-95-99.7 likumu, ir statistikas noteikums, kas nosaka, ka normālam sadalījumam gandrīz visi dati ietilpst trīs vidējo (apzīmētu ar σ) trīs standarta novirzēs (apzīmēti ar σ): apzīmēts ar µ). Sadalīts, empīriskais noteikums rāda, ka 68% ietilpst pirmajā standartnovirzē (µ ± σ), 95% - pirmajās divās standarta novirzēs (µ ± 2σ) un 99, 7% - pirmajās trīs standarta novirzēs (µ ± 3σ)..
Empīriskais noteikums
Izpratne par empīrisko likumu
Galīgo rezultātu prognozēšanai statistikā bieži izmanto empīrisko noteikumu. Pēc standarta novirzes aprēķināšanas un pirms precīzu datu savākšanas šo noteikumu var izmantot kā aptuvenu gaidāmo datu iznākumu. Šo varbūtību var izmantot pagaidu kārtā, jo atbilstošu datu vākšana var būt laikietilpīga vai pat neiespējama. Empīriskais noteikums tiek izmantots arī kā aptuvens veids, kā pārbaudīt sadalījuma "normalitāti". Ja pārāk daudz datu punktu atrodas ārpus trim standarta novirzes robežām, tas liek domāt, ka sadalījums nav normāls.
Taustiņu izņemšana
- Empīriskajā likumā teikts, ka gandrīz visi dati ir 3 normālā sadalījuma vidējās vērtības standartnovirzēs. Saskaņā ar šo noteikumu 68% datu ietilpst vienā standartnovirzē.Deviņdesmit pieci procenti datu atrodas divās standarta novirzēs.Pašlaik trīs standartnovirzes ir 99, 7% no datiem.
Empīriskā likuma piemēri
Pieņemsim, ka zoodārzā dzīvnieku populācija parasti tiek izplatīta. Katrs dzīvnieks dzīvo vidēji 13, 1 gadu vecumā (vidējais rādītājs), un mūža ilguma standartnovirze ir 1, 5 gadi. Ja kāds vēlas zināt varbūtību, ka dzīvnieks dzīvos ilgāk par 14, 6 gadiem, viņš varētu izmantot empīrisko noteikumu. Zinot sadalījuma vidējo lielumu 13, 1 gadu vecumā, katrai standartnovirzei ir šādi vecuma diapazoni:
- Viena standartnovirze (µ ± σ): (13, 1–1, 5) līdz (13, 1 + 1, 5) vai 11, 6–14, 6 Divas standarta novirzes (µ ± 2σ): no 13, 1 - (2 x 1, 5) līdz 13, 1 + (2 x 1, 5), vai 10.1 līdz 16.1. Trīs standarta novirzes (µ ± 3σ): 13, 1 - (3 x 1, 5) līdz 13, 1 + (3 x 1, 5), vai no 8, 6 līdz 17, 6
Personai, kas risina šo problēmu, jāaprēķina kopējā varbūtība, ka dzīvnieks dzīvo 14, 6 gadus vai ilgāk. Empīriskais noteikums rāda, ka 68% sadalījuma atrodas vienā standartnovirzē, šajā gadījumā no 11, 6 līdz 14, 6 gadiem. Tādējādi atlikušie 32% sadalījuma atrodas ārpus šī diapazona. Puse atrodas virs 14, 6 un puse atrodas zem 11, 6. Tātad varbūtība, ka dzīvnieks dzīvo vairāk nekā 14, 6, ir 16% (aprēķināta kā 32%, dalīta ar divām).
Kā citu piemēru pieņemsim, ka tā vietā dzīvnieks zoodārzā dzīvo vidēji 10 gadu vecumā ar standarta novirzi 1, 4 gadi. Pieņemsim, ka zoodārza mēģinājumi noskaidrot varbūtību, ka dzīvnieks dzīvos vairāk nekā 7, 2 gadus. Šis sadalījums izskatās šādi:
- Viena standartnovirze (µ ± σ): no 8, 6 līdz 11, 4 gadiemDivas standarta novirzes (µ ± 2σ): no 7, 2 līdz 12, 8 gadiemTrīs standarta novirzes ((µ ± 3σ): 5, 8 līdz 14, 2 gadi
Empīriskais noteikums nosaka, ka 95% sadalījuma atrodas divās standartnovirzēs. Tādējādi 5% atrodas ārpus divām standarta novirzēm; puse virs 12, 8 gadiem un puse zem 7, 2 gadi. Tādējādi varbūtība nodzīvot vairāk nekā 7, 2 gadus ir šāda:
95% + (5% / 2) = 97, 5%
