Satura rādītājs
- Kas ir T-tests?
- T-testa izskaidrošana
- Neskaidri testa rezultāti
- T-testa pieņēmumi
- T-testu aprēķināšana
- Korelēts (vai pāra) T-tests
- T-tests ar vienādas dispersijas (apvienotu)
- Nevienlīdzīgas variācijas T-tests
- Izmantojamā T-testa noteikšana
- Nevienmērīgas dispersijas T-testa piemērs
Kas ir T-tests?
T-tests ir secinošās statistikas veids, ko izmanto, lai noteiktu, vai starp divām grupām ir būtiska atšķirība, kas dažās pazīmēs var būt saistīta. To lielākoties izmanto, ja datu kopām, piemēram, datu kopai, kas reģistrēta kā rezultāts 100 reizes pārspējot monētu, būtu normāls sadalījums, un tām varētu būt nezināmas novirzes. T-testu izmanto kā hipotēzes pārbaudes rīku, kas ļauj pārbaudīt pieņēmumu, kas piemērojams populācijai.
T-testā tiek apskatīta t-statistika, t-sadalījuma vērtības un brīvības pakāpes, lai noteiktu atšķirību varbūtību starp divām datu kopām. Lai veiktu testu ar trim vai vairākiem mainīgiem lielumiem, jāizmanto dispersijas analīze.
T-tests
T-testa izskaidrošana
Būtībā t-tests ļauj mums salīdzināt abu datu kopu vidējās vērtības un noteikt, vai tās nāk no vienas un tās pašas grupas. Iepriekš minētajos piemēros, ja mēs ņemtu studentu izlasi no A klases un citu studentu izlasi no B klases, mēs negaidītu, ka viņiem būs tieši tāds pats vidējais un standarta novirze. Tāpat paraugiem, kas ņemti no placebo barotajām kontroles grupām, un paraugiem, kas ņemti no izrakstīto zāļu grupas, vajadzētu būt nedaudz atšķirīgiem vidējiem rādītājiem un standarta novirzei.
Matemātiski t-testā tiek ņemts paraugs no abām kopām un tiek noteikts problēmas paziņojums, pieņemot nulles hipotēzi, ka abi līdzekļi ir vienādi. Balstoties uz piemērojamajām formulām, noteiktas vērtības tiek aprēķinātas un salīdzinātas ar standarta vērtībām, un pieņemto nulles hipotēzi attiecīgi pieņem vai noraida.
Ja nulles hipotēzi var noraidīt, tas norāda, ka datu nolasījumi ir spēcīgi un nav nejauši. T-tests ir tikai viens no daudzajiem šajā nolūkā izmantotajiem testiem. Statistiķiem papildus jāizmanto testi, kas nav t-tests, lai pārbaudītu vairāk mainīgo lielumu un pārbaudes ar lielākiem paraugu lielumiem. Statistiķi liela parauga lielumam izmanto z-testu. Citas testēšanas iespējas ietver chi-kvadrāta testu un f-testu.
Pastāv trīs t-testu veidi, un tos klasificē kā atkarīgus un neatkarīgus t-testus.
Taustiņu izņemšana
- T-tests ir secinošās statistikas veids, ko izmanto, lai noteiktu, vai pastāv būtiska atšķirība starp divu grupu vidējo vērtību, kas var būt saistīta ar noteiktām pazīmēm. T-tests ir viens no daudzajiem testiem, ko izmanto hipotēzes pārbaudei. statistikā. Lai aprēķinātu t-testu, nepieciešamas trīs galvenās datu vērtības. Tajos ietilpst atšķirība starp katras datu kopas vidējām vērtībām (ko sauc par vidējo starpību), katras grupas standartnovirzi un katras grupas datu vērtību skaitu. Ir vairāki dažādi t-testa veidi, kurus var veikt atkarībā no par nepieciešamajiem datiem un analīzes veidu.
Neskaidri testa rezultāti
Apsveriet, ka zāļu ražotājs vēlas pārbaudīt nesen izgudrotas zāles. Tas notiek pēc standarta procedūras, kad tiek izmēģinātas zāles vienai pacientu grupai un piešķirts placebo citai grupai, ko sauc par kontroles grupu. Kontroles grupai piešķirtais placebo ir viela, kurai nav paredzētas terapeitiskās vērtības, un tā kalpo par etalonu, lai noteiktu, kā reaģē otra grupa, kurai tiek dotas faktiskās zāles.
Pēc zāļu izmēģināšanas placebo barotās kontroles grupas locekļi ziņoja par vidējā dzīves ilguma palielināšanos par trim gadiem, savukārt grupas locekļiem, kuriem izrakstītas jaunās zāles, ziņo par vidējā dzīves ilguma palielināšanos par četriem gadiem. Tūlītējs novērojums var norādīt, ka zāles patiešām darbojas, jo rezultāti, kas iegūti grupā, ir labāki. Tomēr ir arī iespējams, ka novērojums var būt saistīts ar iespējamību, īpaši pārsteidzošu veiksmes gabalu. T-tests ir noderīgs, lai secinātu, vai rezultāti ir patiesi pareizi un piemērojami visai populācijai.
Skolā 100 A klases audzēkņi novērtēja vidēji 85% ar standarta novirzi 3%. Vēl 100 B klases audzēkņu vērtēja vidēji 87% ar standarta novirzi 4%. Lai gan B klases vidējais rādītājs ir labāks nekā A klases, varbūt nav pareizi secināt, ka B klases skolēnu vispārējie rezultāti ir labāki nekā A klases skolēnu. Tas ir tāpēc, ka līdztekus nozīmē, ka B klases standartnovirze ir arī lielāka nekā A klasei. Tas norāda, ka to galējie procenti apakšējā un augstākajā pusē bija daudz vairāk izkliedēti nekā A klases. T-tests var palīdzēt noteikt kura klase izturējās labāk.
T-testa pieņēmumi
- Pirmais pieņēmums attiecībā uz t-testiem attiecas uz mērījumu skalu. T-testa pieņēmums ir tāds, ka savāktajiem datiem piemērotā mērījumu skala seko nepārtrauktai vai kārtējai skalai, piemēram, IQ testa rādītājiem. Otrais pieņēmums ir vienkārša izlases veida paraugs, ka dati ir kas savākti no reprezentatīvas, nejauši atlasītas visu iedzīvotāju daļas. Trešais pieņēmums ir, ja diagramma parādīta, iegūst normālu sadalījumu, zvanveida formas sadalījuma līkni. Ceturtais pieņēmums ir par samērā lielu izlases lielumu. Lielāks parauga lielums nozīmē, ka rezultātu sadalījumam vajadzētu tuvināties normālai zvanveida formai. Pēdējais pieņēmums ir dispersijas viendabīgums. Viendabīga vai vienāda dispersija pastāv, ja paraugu standartnovirzes ir aptuveni vienādas.
T-testu aprēķināšana
T-testa aprēķināšanai ir vajadzīgas trīs galvenās datu vērtības. Tajos ietilpst starpība starp katras datu kopas vidējām vērtībām (ko sauc par vidējo starpību), katras grupas standartnovirzi un katras grupas datu vērtību skaitu.
T-testa rezultāts rada t-vērtību. Pēc tam šo aprēķināto t-vērtību salīdzina ar vērtību, kas iegūta no kritisko vērtību tabulas (ko sauc par T-sadalījuma tabulu). Šis salīdzinājums palīdz noteikt, cik liela varbūtība, ka starpība starp līdzekļiem radās nejauši, vai datu kopām patiešām ir raksturīgas atšķirības. T-tests apšauba, vai atšķirība starp grupām atspoguļo patiesu atšķirību pētījumā vai arī tā, iespējams, ir bezjēdzīga statistiskā atšķirība.
T-sadales tabulas
T-sadalījuma tabula ir pieejama vienas un divu astes formātos. Pirmo izmanto, lai novērtētu gadījumus, kuriem ir noteikta vērtība vai diapazons ar skaidru virzienu (pozitīvu vai negatīvu). Piemēram, kāda ir varbūtība, ka izlaides vērtība paliek zemāka par -3 vai, kad ripo kauliņu pāri, iegūst vairāk nekā septiņus? Pēdējo izmanto diapazona robežu analīzei, piemēram, jautājot, vai koordinātas ir no -2 līdz +2.
Aprēķinus var veikt ar standarta programmatūras programmām, kas atbalsta nepieciešamās statistiskās funkcijas, piemēram, tās, kas atrodamas MS Excel.
T-vērtības un brīvības pakāpes
T-tests izvada divas vērtības: t-vērtību un brīvības pakāpi. T vērtība ir starpības starp divu paraugu kopu vidējo un starpību, kas pastāv paraugu kopās, attiecība. Kaut arī skaitītāja vērtību (starpību starp divu paraugu kopu vidējo vērtību) ir viegli aprēķināt, saucējs (atšķirība, kas pastāv paraugu kopās) var kļūt nedaudz sarežģīts atkarībā no iesaistīto datu vērtību veida. Attiecības saucējs ir dispersijas vai mainības mērījums. Lielākas t-vērtības vērtības, ko sauc arī par t-rādītājiem, norāda, ka starp abām paraugu kopām pastāv liela atšķirība. Jo mazāka t vērtība, jo lielāka līdzība pastāv starp abām paraugu kopām.
- Liels t-vērtējums norāda, ka grupas ir atšķirīgas. Mazs t-rādītājs norāda, ka grupas ir līdzīgas.
Brīvības pakāpes attiecas uz vērtībām pētījumā, kurai ir tiesības mainīties un kas ir būtiskas nulles hipotēzes nozīmīguma un pamatotības novērtēšanai. Šo vērtību aprēķināšana parasti ir atkarīga no datu ierakstu skaita, kas pieejams paraugkopā.
Korelēts (vai pāra) T-tests
Korelēto t-testu veic, ja paraugi parasti sastāv no līdzīgu vienību pāriem vai ja ir atkārtotu mērījumu gadījumi. Piemēram, var būt gadījumi, kad tie paši pacienti tiek pārbaudīti atkārtoti - pirms un pēc noteiktas ārstēšanas saņemšanas. Šādos gadījumos katrs pacients tiek izmantots kā kontroles paraugs pret sevi.
Šī metode attiecas arī uz gadījumiem, kad paraugi ir kaut kādā veidā saistīti vai tiem ir atbilstošas īpašības, piemēram, salīdzinošā analīze, kurā iesaistīti bērni, vecāki vai brāļi un māsas. Korelēti vai sapāroti t-testi ir atkarīga tipa, jo tie attiecas uz gadījumiem, kad abas paraugu kopas ir saistītas.
Pārmērīga t-testa t vērtības un brīvības pakāpes aprēķināšanas formula ir šāda:
- Mean1 un mean2 ir katras paraugu kopas vidējās vērtības, savukārt var1 un var2 apzīmē katras paraugu kopas dispersiju.
Atlikušie divi veidi pieder neatkarīgajiem t-testiem. Šo tipu paraugi tiek atlasīti neatkarīgi viens no otra, tas ir, abu grupu datu kopas neatsaucas uz vienām un tām pašām vērtībām. Tajos ietilpst tādi gadījumi kā 100 pacientu grupa, kas tiek sadalīta divās grupās pa 50 pacientiem katrā. Viena no grupām kļūst par kontroles grupu, un tai piešķir placebo, bet otra grupa saņem noteikto ārstēšanu. Tas veido divas neatkarīgas izlases grupas, kas nav savstarpēji savienotas.
T-tests ar vienādu dispersiju (vai apvienotu)
Vienādas dispersijas t-testu izmanto, ja paraugu skaits katrā grupā ir vienāds vai abu datu kopu dispersija ir līdzīga. T-vērtības un brīvības pakāpes aprēķināšanai vienādās dispersijas t-testā izmanto šādu formulu:
Visiem, kas noklusina, tacu T-vērtība = n1 + n2−2 (n1−1) × var12 + (n2−1) × var22 × n11 + n21 vidējais1 – vidējais2, kur: vidējais1 un vidējais2 = katra parauga kopas1 vidējās vērtības un var2 = katras izlases kopas dispersijan1 un n2 = ierakstu skaits katrā izlases kopā
un, Visiem, kas noklusina, tacu Brīvības pakāpes = n1 + n2−2 kur: n1 un n2 = ierakstu skaits katrā izlases kopā
Nevienlīdzīgas variācijas T-tests
Nevienlīdzīgas dispersijas t-testu izmanto, ja paraugu skaits katrā grupā ir atšķirīgs, un atšķiras arī abu datu kopu dispersija. Šo testu sauc arī par Velča t-testu. Lai aprēķinātu t-vērtību un brīvības pakāpi nevienlīdzīgas dispersijas t-testam, izmanto šādu formulu:
Visiem, kas noklusina, tacu T-vērtība = n1var12 + n2var22 vidējais1-vidējais2, kur: vidējais1 un vidējais2 = katra parauga kopas vidējās vērtības1 un var2 = katras parauga kopas dispersijan1 un n2 = ierakstu skaits katrā paraugu kopā
un, Visiem, kas noklusina, tacu Brīvības pakāpes = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2, kur: var1 un var2 = Katra no paraugu kopām dispersija n1 un n2 = Skaits ierakstu skaits katrā izlases kopā
Pareiza izmantojamā T-testa noteikšana
Lai noteiktu, kuru t-testu vajadzētu izmantot, pamatojoties uz paraugu kopu parametriem, var izmantot šo diagrammu. Galvenie apsvērumi, kas jāņem vērā, ir tas, vai izlases ieraksti ir līdzīgi, datu ierakstu skaits katrā izlases kopā un katras izlases kopas dispersija.
Attēla autore Džūlija Banga © Investopedia 2019
Nevienmērīgas dispersijas T-testa piemērs
Pieņemsim, ka mēs veicam mākslas galerijā saņemto gleznu pa diagonāli. Vienā paraugu grupā ietilpst 10 gleznas, bet otrā - 20 gleznas. Datu kopas ar atbilstošajām vidējām un dispersijas vērtībām ir šādas:
1. komplekts | 2. komplekts | |
19, 7 | 28.3 | |
20.4 | 26.7 | |
19, 6 | 20.1 | |
17.8 | 23.3 | |
18.5 | 25.2 | |
18.9 | 22.1 | |
18.3 | 17, 7 | |
18.9 | 27, 6 | |
19.5 | 20.6 | |
21.95 | 13, 7 | |
23.2 | ||
17.5 | ||
20.6 | ||
18 | ||
23.9 | ||
21.6 | ||
24.3 | ||
20.4 | ||
23.9 | ||
13.3 | ||
Nozīmē | 19.4 | 21.6 |
Dispersija | 1.4 | 17.1 |
Lai arī 2. komplekta vidējais rādītājs ir augstāks nekā 1. komplekta, mēs nevaram secināt, ka visu gleznu vidējais garums ir aptuveni 21, 6 vienības, jo 2. komplekta dispersija ir ievērojami augstāka nekā 1. komplekta. Vai tas ir nejauši, vai tiešām pastāv atšķirības? visu mākslas galerijā saņemto gleznu kopskaits? Mēs konstatējam problēmu, pieņemot, ka nulles hipotēze ir tāda, ka vidējā vērtība abām paraugu kopām ir vienāda, un veicam t-testu, lai apstiprinātu, vai hipotēze ir patiesa.
Tā kā datu ierakstu skaits ir atšķirīgs (n1 = 10 un n2 = 20) un ir arī atšķirība, dispersija t vērtība un brīvības pakāpe tiek aprēķināta iepriekšminētajai datu kopai, izmantojot formulu, kas minēta U -qual Variance T-Test sadaļa.
T vērtība ir -2, 24787. Tā kā mīnus zīmi var ignorēt, salīdzinot abas t vērtības, aprēķinātā vērtība ir 2.24787.
Brīvības pakāpes vērtība ir 24, 38 un tiek samazināta līdz 24, jo formulas definīcija prasa vērtības noapaļošanu uz leju līdz mazākajai iespējamajai veselajai vērtībai.
Kad tiek pieņemts normāls sadalījums, kā pieņemšanas kritēriju var norādīt varbūtības līmeni (alfa līmenis, nozīmīguma līmenis, p ). Vairumā gadījumu var pieņemt 5% vērtību.
Izmantojot brīvības pakāpi kā 24 un 5% nozīmīguma līmeni, apskatot t-vērtības sadalījuma tabulu, iegūst vērtību 2, 064. Salīdzinot šo vērtību ar aprēķināto vērtību 2.247, tiek norādīts, ka aprēķinātā t vērtība ir lielāka par tabulas vērtību pie nozīmīguma līmeņa 5%. Tāpēc droši var noraidīt nulles hipotēzi, ka starp līdzekļiem nav atšķirības. Iedzīvotāju grupai ir raksturīgas atšķirības, un tās nav nejaušas.
Investīciju kontu salīdzināšana × Piedāvājumi, kas parādās šajā tabulā, ir no partnerībām, no kurām Investtopedia saņem kompensāciju. Piegādātāja nosaukums AprakstsSaistītie noteikumi
Kā darbojas dispersijas analīze (ANOVA) dispersijas analīze (ANOVA) ir statistiskās analīzes rīks, kas datu kopā atrasto kopējo mainīgumu atdala divās sastāvdaļās: nejauši un sistemātiski. vairāk Z-testa definīcija Z-tests ir statistisks tests, ko izmanto, lai noteiktu, vai divi populācijas vidējie rādītāji ir atšķirīgi, ja ir zināmas dispersijas un parauga lielums ir liels. vairāk brīvības pakāpes definīcijas Brīvības pakāpes norāda uz maksimāli loģiski neatkarīgu vērtību skaitu, kas ir vērtības, kuras var mainīties, datu paraugā. vairāk Izpratne par T sadalījumu AT sadalījums ir varbūtības funkcijas tips, kas ir piemērots, lai novērtētu populācijas parametrus maziem izlases lielumiem vai nezināmām dispersijām. vairāk, ko mēra pusnovirzes Semi-novirze ir metode, lai novērtētu ieguldījumu atdeves svārstības zem vidējā līmeņa. To izmanto kā alternatīvu standarta novirzei. vairāk Bonferroni tests Bonferroni tests ir vairāku salīdzināšanas testu veids, ko izmanto statistiskajā analīzē. vairāk partneru saišuSaistītie raksti
Ekonomika
Kādi pieņēmumi tiek izdarīti, veicot t-testu?
Riska vadība
Vēsturiskās nepastāvības izmantošana nākotnes riska novērtēšanai
Akciju tirdzniecības stratēģija un izglītība
Kā izmantot Excel, lai modelētu akciju cenas
Finanšu rādītāji
Kā aprēķināt IRR programmā Excel?
Matemātika un statistika
Kas ir relatīvā standarta kļūda
Finanšu rādītāji
Kāda ir formula neto pašreizējās vērtības (NPV) aprēķināšanai programmā Excel?
