Statistikas on usaldusvahemik teatud parameetri hindamise erivorm. Selle meetodi puhul antakse parameetri jaoks ühe väärtuse asemel terve aktsepteeritavate väärtuste intervall koos tõenäosusega, et parameetri tegelik (tundmatu) väärtus on selles intervallis. Usaldusvahemik põhineb valimi vaatlustel ja on seega valimi puhul erinev. Tõenäosust, et parameeter on intervalli sees, nimetatakse usaldusnivooks. Väga sageli esitatakse see protsentides. Usaldusvahemik esitatakse alati koos usaldusnivooga. Võib rääkida "95% usaldusvahemikust". Usaldusintervalli lõpp-punkte nimetatakse usalduspiirideks. Mida kõrgem on usaldusnivoo, seda laiem on usaldusvahemik, mida suurem on usaldusvahemik.

Usaldusvahemiku arvutamine nõuab üldiselt eeldusi hindamisprotsessi olemuse kohta - see on peamiselt parameetriline meetod. Üks levinud eeldus on, et valimi aluseks oleva populatsiooni jaotus on normaalne. Seega ei ole allpool käsitletavad usaldusvahemikud robustne statistika, kuigi robustsuse lisamiseks võib teha muudatusi.

Mida usaldusvahemik tegelikult tähendab?

95% usaldusnivoo tähendab, et kui me korraksime sama analüüsi (võtaksime samasuguse suurusega juhusliku valimi ja arvutaksime usaldusvahemiku) palju kordi, siis ligikaudu 95% neist arvutatavatest vahemikest sisaldaks populaarsest tegelikku parameetri väärtust. See ei tähenda, et antud ühe arvutatud vahemiku puhul on tõenäosus täpselt 95% selle konkreetse intervalli sees olla — sageduslikus statistikas on ühe konkreetse intervalli puhul parameeter kas sees või väljas. Praktikas võetakse aga tihti lihtsustatud tõlgendusena, et "on 95% usaldust, et tõeline väärtus jääb selle vahemiku sisse".

Kuidas arvutatakse usaldusvahemik (põhitõed)

Usaldusvahemiku laius sõltub kolmest peamisest komponendist:

  • Hinnang — nt valimi keskmine või osakaal.
  • Standardsest veast (SE) — kui suur on hinnangu hajuvus: SE = s / √n keskmise puhul (kus s on valimi standardhälve ja n on valimi suurus).
  • Mitmekordsest kritilisest väärtusest — määratud usaldusnivoo alusel (nt z- või t-kriteerium, näiteks z ≈ 1.96 95% kahepoolse vahemiku jaoks).

Üldine kahepoolne valem keskmise puhul on:

usaldusvahemik = hinnang ± kriitiline_väärtus × SE

95% usaldusvahemik keskmise jaoks (näide)

Kui meil on valimi keskmine x̄, standardhälve s ja suurus n, siis 95% usaldusvahemik (kui populatsioonijaotus on ligikaudu normaalne) arvutatakse tavaliselt kas kasutades z‑või t‑jaotust:

  • Kui n on suur (või kui populatsiooni hajuvus on teada), kasutatakse z‑kriitilist väärtust ≈ 1.96: x̄ ± 1.96 × (s/√n).
  • Kui n on väike ja populatsiooni standardhälvet ei teata, kasutatakse t‑jaotuse kriitilist väärtust t_{n-1, 0.975}: x̄ ± t_{n-1,0.975} × (s/√n).

Näide: valimi keskmine on 100, s = 15, n = 25. SE = 15/√25 = 3. Kui kasutame t‑jaotust (df = 24) ja t ≈ 2.064, siis 95% usaldusvahemik ≈ 100 ± 2.064 × 3 = 100 ± 6.192 → (93.81, 106.19).

Usaldusvahemik proportsiooni jaoks

Proportsiooni p-hinnangu (nt osakaal) tavaline ligikaudne 95% vahemik on:

p ± 1.96 × √(p(1 − p)/n)

Kuid väikeste valimite või äärmuslike p väärtuste puhul on parem kasutada Wilsoni vahemikku või täpsemaid meetodeid, sest lihtne Wald‑vahemik võib anda ebatäpseid või isegi ebaadekvaatseid tulemusi.

Mõned olulised täpsustused ja eeldused

  • Juhuslik valim: usaldusvahemiku kehtivus sõltub sellest, et valim oleks juhuslik ja esinduslik.
  • Jaotuse eeldus: paljud valemid eeldavad normaaljaotust (või suurt n, kus Keskväärtuste Keskpiiruste Teoreemist tulenevalt on normaaljaotus kehtiv).
  • Parameetriline vs mitteparameetriline: standardsed usaldusvahemikud on parameetrilised; kui eeldused ei pea, võib kasutada robustseid meetodeid või bootstrap‑taasesinemisi usaldusvahemiku hindamiseks.

Ühepoolne vs kahepoolne usaldusvahemik

Enamikul juhtudel esitatakse kahepoolne usaldusvahemik (nt 95% kahepoolne). Kui huvi on ainult ühes suunas (nt kas keskmine on väiksem kui mingi piir), võidakse kasutada ühepoolset usaldusvahemikku — see muudab kriitilise väärtuse vastavalt (näiteks 95% ühepoolne vastab kahepoolsele 90% kriitilisele tasemele).

Kuidas usaldusvahemikku teatada ja tõlgendada

  • Esita alati usaldusnivoo (nt "95% usaldusvahemik").
  • Kirjuta selgelt hinnang ja piirid (näiteks "keskmine = 100, 95% usaldusvahemik 93.8 kuni 106.2").
  • Ära väida, et "on 95% tõenäosus, et tõeline väärtus on selles konkreetses vahemikus" ilma Bayesiaanalüüsita — korrektsem on öelda, et "seda protseduuri korrates sisaldaks 95% moodustatud vahemikest tõelist väärtust".

Tüüpilised eksiarvamused ja piirangud

  • Usaldusvahemik ei ota arvesse uuringu võimalikke pööramatusi, valikukaldkonda või süsteemseid vigu — see kajastab ainult juhuslikku viga tingimusel, et eeldused kehtivad.
  • Laialt levinud on usaldusvahemiku ja statistilise olulisuse (p‑väärtuse) segamine — need annavad erinevat teavet: usaldusvahemik näitab võimalikku suurust ja täpsust, p‑väärtus tähistab tõenäosust saada vaadeldud (või äärmuslikum) tulemus nullhüpoteesi korral.

Alternatiivid ja täiustused

  • Bootstrap: mitteparameetriline korduvvõtmise meetod, mille abil saab hinnata usaldusvahemikku ilma tugeva jaotuse eelduseta.
  • Robustsed meetodid: näiteks keskmise asemel mediaani usaldusvahemikud või muudetud standardvead outlier'ite vähendamiseks.
  • Bayesiaalsed usaldusintervallid (credible intervals): annavad otseselt tõlgendatava tõenäosuse, kuna kasutavad priore ja andmeid koos, kuid nõuavad priori valikut.

Lõppsõna

Usaldusvahemik on võimas vahend hinnangute täpsuse kirjeldamiseks, kuid selle õige kasutamine nõuab teadlikkust eeldustest ja piirangutest. Selgelt formuleeritud vahemik koos usaldusnivoo ja kasutatud meetodiga aitab tõlgendada tulemusi täpsemalt ja vältida levinud väärarusaamu.