Standardviga on statistika valimijaotuse standardhälve. Terminit võib kasutada ka kogu grupi valimi põhjal võetud standardhälbe hinnangu (hea hinnangu) kohta.

Grupi mingi osa (mida nimetatakse valimiks) keskmine on tavaline viis kogu grupi keskmise hindamiseks. Kogu rühma mõõtmine on sageli liiga raske või liiga kulukas. Kui aga mõõdetakse teist valimit, siis on selle keskmine veidi erinev esimesest valimist. Keskmise standardviga on viis teada saada, kui lähedal on valimi keskmine kogu rühma keskmisele. See on viis teada saada, kui kindel võib olla valimi keskmises väärtuses.

Reaalsete mõõtmiste puhul ei ole kogu rühma keskmise standardhälbe tegelik väärtus tavaliselt teada. Seega kasutatakse sageli terminit standardviga, mis tähendab kogu rühma tõelise arvu lähedast hinnangut. Mida rohkem mõõtmisi on valimis, seda lähemal on see arv kogu rühma tegelikule arvule.

Kuidas standardviga arvutatakse

Standarviga (SE, inglise keeles standard error) sõltub sellest, millist statistikat hinnatakse. Kõige sagedamini kasutatakse seda keskmise hinnangu täpsuse kirjeldamiseks. Levinumad valemid:

  • Kui populatsiooni standardhälve σ on teada: SE(µ) = σ / √n.
  • Kui populatsiooni σ ei ole teada (tavapärane olukord): SE(µ) ≈ s / √n, kus s on valimi standardhälve ja n on valimi suurus.
  • Protsendi (osakaalu) puhul: SE(p) = √[ p(1 − p) / n ], kus p on valimi osakaal.
  • Kahe sõltumatu valimi keskmiste erinevuse SE: SE(µ1 − µ2) = √[ σ1²/n1 + σ2²/n2 ] (vastavatel juhtudel asendatakse σi valimi hinnanguga si).

Tähendus ja tõlgendus

Standardviga kirjeldab, kui palju erinevate valimite põhjal arvutatud keskmised tõenäoliselt varieeruvad ümber tõelise populatsiooni keskmise. Väike SE tähendab, et valimikeskmine on usaldusväärsem (vähem hajub); suur SE näitab suurt ebakindlust.

Praktiline tõlgendus: kui SE = 2 üksust, siis tüüpiline erinevus valimi keskmise ja populaatsiooni tegeliku keskmise vahel on umbes 2 ühikut (eeldusel, et jaotus on ligikaudu normaalne).

Usaldusintervallid

Standardviga kasutatakse usaldusintervalli (UI) leidmisel. Näiteks ligikaudne 95% usaldusintervall keskmisele on:

  • Kui populatsiooni σ teada ja n suur: µ ± 1.96·SE
  • Kui σ pole teada ja n väike: µ ± t_{n−1;0.975}·SE (kasutatakse t-jaotust)

Näide: kui valimi keskmine on 50, s = 10 ja n = 25, siis SE = 10/√25 = 2 ja ligikaudne 95% UI on 50 ± 1.96·2 = (46.08, 53.92).

Mõju valimi suurusele

Standardviga väheneb ruutjuurega valimi suurusest: SE ∝ 1/√n. See tähendab, et neljakordse suurema valimi korral väheneb SE kaks korda. Seega suurendades n, väheneb hinnangu ebakindlus, kuid valimi suuruse suurenemise mõju on vähenev – et SE pooleks vähendada, tuleb n neljakordistada.

Erinevus standardhälbe ja standardvea vahel

  • Standardhälve (SD) kirjeldab individuaalsete vaatluste hajuvust kokku kogutud andmetes (näiteks kui palju üksikisikud erinevad valimis keskmisest).
  • Standardviga (SE) kirjeldab hinnangu (nt keskmise) täpsust ja kui palju see hinnang tõenäoliselt varieerub erinevates valimites.

Bootstrap ja muud hinnangumeetodid

Kui analüütiline valem SE leidmiseks puudub või eeldused on rikkunud (nt jaotused ei ole normaalsed), saab standardvea hinnata ka bootstrapping-meetodiga: korduv juhuslik ümvalik (resampling) valimist koos asendamisega, arvutades iga kord huvipakkuva statistika ja selle hinnangulise standardhälbe.

Levinud eksiarvamused ja praktilised soovitused

  • Ära kasuta SE-d sama tähendusega kui SD — need mõõdavad erinevat asju.
  • Kui näitad graafikul vigu, märgi selgelt, kas viga on SD või SE; SE võib andmeid "liiga täpselt" näidata ja eksitada vaatlejat, kui eesmärgiks on kujutada andmepunkte ise.
  • Kui valimi suurus on väike (<30) ja populatsiooni jaotuse kohta pole teavet, kasutage t-jaotust ja olge ettevaatlikud eeldustega.

Kokkuvõttes on standardviga oluline statistiline tööriist, mis aitab hinnata, kui täpne on valimi statistika (eriti keskmise) kui hinnang populatsiooni kohta. Õige kasutamine nõuab selgust eelduste, valimi suuruse ja õige valemi osas.