Standardviga — mis see on ja kuidas hinnata valimi keskmise täpsust

Mis on standardviga ja kuidas hinnata valimi keskmise täpsust? Selge juhend, valimi suuruse mõju, arvutus ja praktilised nõuanded usaldusväärsete tulemuste saamiseks.

Autor: Leandro Alegsa

14-11-2025 20:40

Standardviga on statistika valimijaotuse standardhälve. Terminit võib kasutada ka kogu grupi valimi põhjal võetud standardhälbe hinnangu (hea hinnangu) kohta.

Grupi mingi osa (mida nimetatakse valimiks) keskmine on tavaline viis kogu grupi keskmise hindamiseks. Kogu rühma mõõtmine on sageli liiga raske või liiga kulukas. Kui aga mõõdetakse teist valimit, siis on selle keskmine veidi erinev esimesest valimist. Keskmise standardviga on viis teada saada, kui lähedal on valimi keskmine kogu rühma keskmisele. See on viis teada saada, kui kindel võib olla valimi keskmises väärtuses.

Reaalsete mõõtmiste puhul ei ole kogu rühma keskmise standardhälbe tegelik väärtus tavaliselt teada. Seega kasutatakse sageli terminit standardviga, mis tähendab kogu rühma tõelise arvu lähedast hinnangut. Mida rohkem mõõtmisi on valimis, seda lähemal on see arv kogu rühma tegelikule arvule.

Kuidas standardviga arvutatakse

Standarviga (SE, inglise keeles standard error) sõltub sellest, millist statistikat hinnatakse. Kõige sagedamini kasutatakse seda keskmise hinnangu täpsuse kirjeldamiseks. Levinumad valemid:

Kui populatsiooni standardhälve σ on teada: SE(µ) = σ / √n.
Kui populatsiooni σ ei ole teada (tavapärane olukord): SE(µ) ≈ s / √n, kus s on valimi standardhälve ja n on valimi suurus.
Protsendi (osakaalu) puhul: SE(p) = √[ p(1 − p) / n ], kus p on valimi osakaal.
Kahe sõltumatu valimi keskmiste erinevuse SE: SE(µ1 − µ2) = √[ σ1²/n1 + σ2²/n2 ] (vastavatel juhtudel asendatakse σi valimi hinnanguga si).

Tähendus ja tõlgendus

Standardviga kirjeldab, kui palju erinevate valimite põhjal arvutatud keskmised tõenäoliselt varieeruvad ümber tõelise populatsiooni keskmise. Väike SE tähendab, et valimikeskmine on usaldusväärsem (vähem hajub); suur SE näitab suurt ebakindlust.

Praktiline tõlgendus: kui SE = 2 üksust, siis tüüpiline erinevus valimi keskmise ja populaatsiooni tegeliku keskmise vahel on umbes 2 ühikut (eeldusel, et jaotus on ligikaudu normaalne).

Usaldusintervallid

Standardviga kasutatakse usaldusintervalli (UI) leidmisel. Näiteks ligikaudne 95% usaldusintervall keskmisele on:

Kui populatsiooni σ teada ja n suur: µ ± 1.96·SE
Kui σ pole teada ja n väike: µ ± t_{n−1;0.975}·SE (kasutatakse t-jaotust)

Näide: kui valimi keskmine on 50, s = 10 ja n = 25, siis SE = 10/√25 = 2 ja ligikaudne 95% UI on 50 ± 1.96·2 = (46.08, 53.92).

Mõju valimi suurusele

Standardviga väheneb ruutjuurega valimi suurusest: SE ∝ 1/√n. See tähendab, et neljakordse suurema valimi korral väheneb SE kaks korda. Seega suurendades n, väheneb hinnangu ebakindlus, kuid valimi suuruse suurenemise mõju on vähenev – et SE pooleks vähendada, tuleb n neljakordistada.

Erinevus standardhälbe ja standardvea vahel

Standardhälve (SD) kirjeldab individuaalsete vaatluste hajuvust kokku kogutud andmetes (näiteks kui palju üksikisikud erinevad valimis keskmisest).
Standardviga (SE) kirjeldab hinnangu (nt keskmise) täpsust ja kui palju see hinnang tõenäoliselt varieerub erinevates valimites.

Bootstrap ja muud hinnangumeetodid

Kui analüütiline valem SE leidmiseks puudub või eeldused on rikkunud (nt jaotused ei ole normaalsed), saab standardvea hinnata ka bootstrapping-meetodiga: korduv juhuslik ümvalik (resampling) valimist koos asendamisega, arvutades iga kord huvipakkuva statistika ja selle hinnangulise standardhälbe.

Levinud eksiarvamused ja praktilised soovitused

Ära kasuta SE-d sama tähendusega kui SD — need mõõdavad erinevat asju.
Kui näitad graafikul vigu, märgi selgelt, kas viga on SD või SE; SE võib andmeid "liiga täpselt" näidata ja eksitada vaatlejat, kui eesmärgiks on kujutada andmepunkte ise.
Kui valimi suurus on väike (<30) ja populatsiooni jaotuse kohta pole teavet, kasutage t-jaotust ja olge ettevaatlikud eeldustega.

Kokkuvõttes on standardviga oluline statistiline tööriist, mis aitab hinnata, kui täpne on valimi statistika (eriti keskmise) kui hinnang populatsiooni kohta. Õige kasutamine nõuab selgust eelduste, valimi suuruse ja õige valemi osas.

Valimi puhul, mis on valimisse võetud erapooletu normaaljaotusega veaga, näitab ülaltoodud joonis nende valimite osakaalu, mis jäävad vahemikku 0, 1, 2 ja 3 standardhälvet tegelikust väärtusest kõrgemale ja madalamale.

Kuidas leida keskmise standardviga

Üks võimalus keskväärtuse standardvea leidmiseks on võtta palju valimeid. Kõigepealt leitakse iga valimi keskmine. Seejärel leitakse nende valimite keskmiste keskmine ja standardhälve. Kõigi valimite keskmiste standardhälve on keskmise standardviga. See võib olla palju tööd. Mõnikord on liiga raske või maksab liiga palju raha, et võtta palju valimeid.

Teine võimalus keskväärtuse standardvea leidmiseks on kasutada võrrandit, mis vajab ainult ühte valimit. Keskmise standardviga hinnatakse tavaliselt kogu grupi valimi standardhälbe (valimi standardhälve) jagatuna valimi suuruse ruutjuurega.

S E x ¯ = s n {\displaystyle SE_\bar {x}\ ={\frac {s}{\sqrt {n}}}} $SE_{\bar {x}}\ ={\frac {s}{\sqrt {n}}}$

kus

s on valimi standardhälve (s.t. populatsiooni standardhälbe valimis põhinev hinnang) ja

n on mõõtmiste arv valimis.

Kui suur peab valim olema, et keskväärtuse standardvea hinnang oleks lähedal kogu rühma tegelikule keskväärtuse standardveale? Valimis peaks olema vähemalt kuus mõõtmist. Siis on valimi keskmise standardviga 5% piires keskmise standardveast, kui oleks mõõdetud kogu rühma.

Parandused mõnedel juhtudel

On olemas teine võrrand, mida saab kasutada, kui mõõtmiste arv on 5% või rohkem kogu grupist:

On olemas spetsiaalsed võrrandid, mida tuleb kasutada, kui proovis on vähem kui 20 mõõtmist.

Mõnikord on proov pärit ühest kohast, kuigi kogu rühm võib olla laiali. Samuti võib mõnikord proovi teha lühikese aja jooksul, kui kogu rühm hõlmab pikemat aega. Sellisel juhul ei ole valimi arvud sõltumatud. Siis kasutatakse spetsiaalseid võrrandeid, millega püütakse seda korrigeerida.

Kasulikkus

Praktiline tulemus: Kui valimis on rohkem mõõtmisi, saab keskmist väärtust kindlamalt määrata. Siis on keskväärtuse standardviga väiksem, sest standardhälve jagatakse suurema arvuga. Et aga keskmise väärtuse määramatus (keskväärtuse standardviga) oleks poole suurem, peab valimi suurus (n) olema neli korda suurem. See tuleneb sellest, et standardhälve jagatakse valimi suuruse ruutjuurega. Et määramatus oleks kümnendiku võrra suurem, peab valimi suurus (n) olema sada korda suurem!

Standardvigu on lihtne arvutada ja neid kasutatakse palju, sest:

Kui mitme üksiku suuruse standardviga on teada, siis saab paljudel juhtudel hõlpsasti arvutada mingi suuruse funktsiooni standardviga;
Kui väärtuse tõenäosusjaotus on teada, saab selle abil arvutada hea ligilähedase täpse usaldusvahemiku; ja
Kui tõenäosusjaotus ei ole teada, võib usaldusvahemiku hindamiseks kasutada teisi võrrandeid.
Kui valimi suurus muutub väga suureks, näitab keskse piirväärtuse teoreemi põhimõte, et valimis olevad arvud on väga sarnased kogu rühma arvudega (neil on normaaljaotus).

Suhteline standardviga

Suhteline standardviga (RSE) on standardviga jagatud keskmisega. See arv on väiksem kui üks. Korrutades selle 100%-ga, saadakse see protsentuaalselt keskmisest. See aitab näidata, kas määramatus on oluline või mitte. Näiteks vaadeldakse kahte leibkonna sissetuleku uuringut, mille mõlema tulemuseks on valimi keskmine 50 000 dollarit. Kui ühe uuringu standardviga on 10 000 dollarit ja teise standardviga on 5000 dollarit, siis on suhtelised standardvead vastavalt 20% ja 10%. Väiksema suhtelise standardveaga uuring on parem, sest selle mõõtmine on täpsem (mõõtemääramatus on väiksem).

Tegelikult otsustavad inimesed, kellel on vaja teada keskmisi väärtusi, sageli, kui väike peaks olema ebakindlus enne, kui nad otsustavad teavet kasutada. Näiteks USA riiklik tervisestatistika keskus ei esita keskmist väärtust, kui suhteline standardviga ületab 30%. NCHS nõuab ka, et hinnangu esitamiseks oleks vähemalt 30 vaatlust. ^[]

Näide

Näiteks on Mehhiko lahe vees palju meriahvenaid. Et teada saada, kui palju kaalub keskmiselt 42 cm pikkune meriahven, ei ole võimalik mõõta kõiki 42 cm pikkuseid meriahvenaid. Selle asemel on võimalik mõõta mõningaid neist. Neid kalu, mida tegelikult mõõdetakse, nimetatakse prooviks. Tabelis on esitatud kahe 42 cm pikkuse meriahvena proovi kaal. Esimese valimi keskmine (keskmine) kaal on 0,741 kg. Teise proovi keskmine (keskmine) kaal on 0,735 kg, mis erineb veidi esimesest proovist. Kõik need keskmised on veidi erinevad keskmisest, mis tuleneks iga 42 cm pikkuse meriahvena mõõtmisest (mis ei ole niikuinii võimalik).

Keskmise mõõtemääramatuse abil saab teada, kui lähedal on valimite keskmine sellele keskmisele, mis saadakse kogu rühma mõõtmisel. Keskmise määramatust hinnatakse kui valimi standardhälvet, mis jagatakse proovide arvu ruutjuurega miinus üks. Tabelist on näha, et kahe valimi keskmiste määramatused on väga lähedal üksteisele. Samuti on suhteline määramatus keskväärtuse määramatus jagatud keskväärtusega, korrutatuna 100%-ga. Selle näite puhul on suhteline mõõtemääramatus 2,38% ja 2,50% kahe valimi puhul.

Teades keskmise määramatust, saab teada, kui lähedal on valimi keskmine sellele keskmisele, mis saadakse kogu rühma mõõtmisel. Kogu grupi keskmine on a) valimi keskmise pluss keskmise määramatuse ja b) valimi keskmise miinus keskmise määramatuse vahel. Selles näites on kõigi 42 cm pikkuste meriahvenate keskmine kaal Mehhiko lahes esimese proovi põhjal eeldatavasti 0,723-0,759 kg ja teise proovi põhjal 0,717-0,753 kg.

Näites kasutatud meriahvena (tuntud ka kui punane trummel, Sciaenops ocellatus) näide.

Küsimused ja vastused

K: Mis on standardviga?

V: Standardviga on statistika valimijaotuse standardhälve.

K: Kas standardvea mõistet võib kasutada standardhälbe hinnangu kohta?

V: Jah, terminit standardviga võib kasutada selle standardhälbe hinnangu (hea oletuse) kohta, mis on võetud kogu grupi valimi põhjal.

K: Kuidas saab hinnata kogu rühma keskmist?

V: Kogu rühma mingi osa (mida nimetatakse valimiks) keskmine on tavaline viis kogu rühma keskmise hindamiseks.

K: Miks on kogu rühma mõõtmine keeruline?

V: Kogu rühma mõõtmine on sageli liiga raske või liiga kulukas.

K: Mis on keskmise standardviga ja mida see määrab?

V: Keskmise standardviga näitab, kui lähedal on valimi keskmine kogu rühma keskmisele. See on viis teada saada, kui kindel võib olla valimi keskmises väärtuses.

K: Kas keskväärtuse standardhälbe tegelik väärtus on reaalsete mõõtmiste puhul tavaliselt teada?

V: Ei, kogu rühma keskmise standardhälbe tõeline väärtus ei ole reaalsete mõõtmiste puhul tavaliselt teada.

K: Kuidas mõjutab valimi mõõtmiste arv hinnangu täpsust?

V: Mida rohkem mõõtmisi on valimis, seda lähemal on hinnang kogu rühma tõelisele arvule.

Otsige