Normaaljaotus on tõenäosusjaotus, mida sageli nimetatakse ka Gaussi jaotuseks, kuna selle omadusi uuris ja kirjeldas Carl Friedrich Gauss. Normaaljaotus on pidev tõenäosusjaotus ja väga oluline paljudes teadus- ja insenerivaldkondades. Normaaljaotused moodustavad sama üldvormiga jaotuste perekonna — erinevused tekivad peamiselt asukoha ja skaala parameetrite kaudu: jaotuse keskmine (μ) määrab jaotuse asukoha ning standardhälve (σ) määrab jaotuse laiuse ehk skaala. Dispersioon (variancs) on σ² (dispersioon).

Valem (tõenäosustiheduse funktsioon)

Ühemuutujaline normaaljaotus parameetritega μ (keskmine) ja σ > 0 (standardhälve) on määratud tihedusega

f(x) = 1 / (σ √(2π)) · exp( − (x − μ)² / (2 σ²) ).

See funktsioon on sümmeetriline keskpunkti μ ümber ja selle integraal kogu reaalsel teljel on 1. Dispersioon (varianss) on σ² ja jaotuse kuju määrab σ: väikse σ puhul on kõver teravam, suures σ puhul laiem.

Põhiomadused

  • Sümmeetria: normaaljaotus on sümmeetriline asukoha μ suhtes — keskmine, mediaan ja mood langevad kokku (kõik võrduvad μ-ga).
  • Keskmine ja variatsioon: E(X)=μ, Var(X)=σ².
  • Kõverus ja rippumine: jaotuse kumerus (skewness) on 0, kurtosis (neli-) on 3 (sarnasuse tõttu tihti võrreldakse ekseenlist kurtosis´i suhtes).
  • Empiiriline reegel (68–95–99.7): ligikaudu 68% väärtustest jääb vahemikku μ±σ, 95% μ±2σ ja 99.7% μ±3σ.

Standardne normaaljaotus (Z-jaotus)

Standardne normaaljaotus ehk Z-jaotus on erijuht, millel μ = 0 ja dispersioon σ² = 1 (st σ = 1). Selle tihedusfunktsioon on

φ(z) = 1 / √(2π) · exp( − z² / 2 ).

Standardse normaaljaotuse kumulatiivfunktsiooni tähistatakse tavaliselt Φ(z) ja see annab tõenäosuse P(Z ≤ z). Praktiliselt arvutatakse tõenäosusi standardiseerimise abil: kui X ~ N(μ, σ²), siis Z = (X − μ) / σ ~ N(0,1). See võimaldab kasutada ühte tabelit (Z-tabel või tarkvara) eri juhtude lahendamiseks.

Kuidas leida tõenäosusi

Tõenäosuse leidmiseks liigutatakse algne muutuja standardse normaaljaotuse vormi läbi Z-skoori teisenduse:

Z = (X − μ) / σ.

Näiteks P(a ≤ X ≤ b) = Φ((b−μ)/σ) − Φ((a−μ)/σ), kus Φ on standardse normaaljaotuse kumulatiivfunktsioon. Φ-i arvutamiseks kasutatakse Z-tabeleid, statistilist tarkvara või ligikaudu veaga seotud erffunktsiooni: Φ(x) = 1/2·[1+erf(x/√2)].

Näited ja rakendused

Paljud mõõdetavad nähtused ja vead järgnevad ligikaudu normaaljaotusele tänu keskse piirväärtuse teoreemile, mis ütleb, et juhuslike, sõltumatute mõjude summana tekkiv suurus läheneb normaaljaotusele (tingimusel, et tingimused on rahuldavad). Näited:

  • Inimeste pikkused ja kehakaalud populatsioonil (piiratud tingimustel) — sageli ligikaudu normaaljaotunud.
  • Mõõtmisvead instrumentides — paljud väiksed, sõltumatud vead summeeruvad.
  • Intelligentsuse testide skoorid (nähtustes, kus skoorid on standardiseeritud kui IQ) — lähtub sageli normaaljaotusest.
  • Toodete mõõtmed tootmises (tolerantsid) — kui mitmed väiksed tegurid kogunevad, võib tulemus olla normaaljaotusega.
  • Bioloogilised mõõtmised (nt vererõhu jaotused teatud populatsioonis) — mõnikord ligikaudu normaaljaotused.

Praktiline näide

Kui näiteks täiskasvanute pikkused on ligikaudu normaaljaotunud keskmise μ = 175 cm ja standardhälbega σ = 7 cm, siis tõenäosus, et juhuslikult valitud isik on kõrgem kui 185 cm, on P(X > 185) = 1 − Φ((185−175)/7) = 1 − Φ(10/7) ≈ 1 − Φ(1.4286) ≈ 0.076 (ligikaudu 7.6%).

Muud tähelepanekud

  • Oluline eeldus: tegelikud andmed on sageli ainult ligikaudselt normaalsed; enne normaliteedi eeldamist tuleks kontrollida hajuvusdiagrammi, histogrammi või teha testid (nt Shapiro–Wilk).
  • Mitmemõõtmeline normaaljaotus: üldistus mitmele muutujale annab multivariatiivse normaajaotuse, mida iseloomustavad vektorkeskmine ja korrelatsioonide/kovariatsioonide maatriks.
  • Funktsionaalsed vormid: normaaljaotusel on sulgevi omadusi (nt lineaarne kombinatsioon normaalsest juhuslikust suurusest on samuti normaalne) ja sellega saab määrata moment-generaatorfunktsiooni ning karakteristikufunktsiooni, mis on kasulikud teoreetiliste ja praktiliste arvutuste puhul.

Normaaljaotus on seega fundamentaalne tööriist statistikas ja juhuslike protsesside modelleerimisel — nii teoreetilistes tõestustes (nt keskmine piirväärtus) kui ka praktilistes rakendustes (andmete analüüs, kvaliteedikontroll, hüpoteeside testimine jne).