Student'i t‑jaotus on tõenäosusjaotus, mille töötas välja William Sealy Gosset 1908. aastal. Pseudonüüm Student oli tema avaldamisel kasutatud nimi: Gosset töötas õlletehases ja huvitus väikeste proovide statistilisest analüüsist — tema uurimistes võis proovi suurus olla näiteks vaid kolm. Üks lugu pseudonüümi taga on see, et tööandja eelistaski, et töötajate teadustööd ilmuksid mitte nende pärisnime all; teine seletus on, et õlletehas ei soovinud konkurentidele näidata, et nad kontrollisid tooraine kvaliteeti t‑testi abil.

Põhimõte ja definitsioon

Kui valim on võetud normaaljaotusest ja selle suurus on n, siis Student'i t‑jaotust määritakse seose kaudu, kus t‑statistik saadakse valimi keskmise ja tõelise (populatsiooni) keskmise erinevuse jagamisel valimi standardhälbega, korrigeeritud normaliseeriva faktoriga n {\displaystyle {\sqrt {n}}}.{\displaystyle {\sqrt {n}}} Praktikas on t‑jaotuse kuju määratud vabadusastmete arvuga ν = n − 1 (kasutades valimi varieeruvuse hindamisel vabastatud parameetrit), mis näitab, kui palju täiendavat varieeruvust hinnangusse sisse tuleb väikesest proovimahust.

Peamised omadused

  • t‑jaotus on sümmeetriline ja kellakujuline nagu normaaljaotus, kuid tal on paksemad sabad — see tähendab, et ekstreemsed väärtused on tõenäolisemad kui normaaljaotuse korral.
  • Väikeste vabadusastmete puhul (väikesed n) on sabad märgatavalt paksemad; kui ν kasvab, läheneb t‑jaotus kiiresti normaaljaotusele.
  • t‑jaotus saab tuletada kui suhet normaalsest ja chi‑ruut jaotusest: t = Z / sqrt(χ²/ν), kus Z ~ N(0,1) ja χ² sõltub ν vabadusastmest.
  • See jaotus on erijuht hüperboolse (t‑) jaotuse perekonnas ning seda saab esitada ka normaalse ja skalaarse hajutuse miiksi kaudu (mixture of normals), mis selgitab raskeid saba‑omadusi.

Kus ja kuidas seda kasutatakse

T‑jaotus on statistikas laialdaselt kasutatav, eriti siis, kui populatsiooni standardhälvet ei tunta ja proovi suurus on mõõdukas või väike. Peamised rakendused on:

  • Student'it‑testis — ühe‑ ja kahevalimilise keskmiste võrdlemiseks (sh paaris‑jaotused ja sõltumatute valimite testid), et hinnata kahe keskmise vahe statistilist olulisust.
  • Usaldusvahemike koostamisel, kui soovitakse hinnata populatsiooni keskmist või kahe keskmise erinevust ilma pop. standardhälvet teadmata.
  • Lineaarses regressioonianalüüsis kasutatakse t‑jaotust regressioonikordajate tõlgendamiseks ja hüpoteeside testimiseks (näiteks kas koefitsient on null).
  • Bayesi statistikast: Student'i jaotus ilmub normaalse perekonna mudelite Bayesiaanlikus analüüsis ja mõnedes Bayesi priorites/posteriortesel kujul.

Millal valida t‑test, mitte z‑test?

  • Kasutage t‑testi, kui populatsiooni standardhälve ei ole teada ja hinnatakse seda valimi põhjal.
  • Kui valim on väga suur, annavad nii t kui ka z sarnase tulemuse (kuna t läheneb normaalsele). Väikeste ja keskmiste valimite puhul on t‑test konservatiivsem ja sobivam.
  • Asumused: t‑test eeldab tavaliselt, et andmed on ligikaudu normaalse jaotusega või et proovi suurus on piisav CLT kehtimiseks; t‑test on mõnevõrra robustne mõõduka kõrvalekalde korral normaalsusest.

Seosed teiste jaotustega ja täiendav märkus

Student'i t‑jaotus seostub mitmete teiste jaotustega: see tuleneb normaalsest ja chi‑ruut jaotusest (suhete kaudu) ning läheneb normaalsele jaotusele, kui vabadusastmete arv läheneb lõpmatusele. Tänu oma raskemate sabade olemasolule on t‑jaotus kasulik ka olukordades, kus määraja (näiteks hinnatud standardhälve) suureneb varieeruvusest ja võib anda välja äärmuslikke suhtarve.

Lühike näide

Oletame, et mõõdate ühes laboris 10 proovi ja leiate nende keskmiseks x̄ ning valimi standardhälbeks s. Kui soovite testida hüpoteesi, et populatsiooni keskmine μ on võrdne mõne väärtusega μ0, arvutate t‑statistiku t = (x̄ − μ0) / (s / sqrt(n)) ja võrdlete seda kriitiliste t‑vaartustega ν = n − 1 vabadusastmete jadalt. Kui |t| on suurem kui kriitiline väärtus, on tulemus statistiliselt oluline valitud usaldustasemel.

Student'i t‑jaotus on seega põhiline tööriist kõikjal, kus tuleb teha järeldusi keskmiste kohta väikeste või mõõdukate valimite korral ning populatsiooni standardhälve ei ole teada.