Zipfi seadus
Zipfi seadus on matemaatilise statistika abil sõnastatud empiiriline seadus, mis on nime saanud selle esmakordselt välja pakkunud keeleteadlase George Kingsley Zipfi järgi.
Zipfi seadus ütleb, et suure kasutatava sõnade valimi puhul on iga sõna sagedus pöördvõrdeline selle järjekohaga sagedustabelis. Seega on sõna number n sagedus võrdeline 1/n.
Seega esineb kõige sagedasem sõna umbes kaks korda sagedamini kui teine sõna, kolm korda sagedamini kui kolmas sõna jne. Näiteks ühes inglise keele sõnade valimis moodustab kõige sagedamini esinev sõna "the" peaaegu 7% kõigist sõnadest (69 971 sõna veidi üle 1 miljoni). Zipfi seaduse kohaselt moodustab teisel kohal olev sõna "of" veidi üle 3,5% sõnadest (36 411 esinemist), millele järgneb sõna "and" (28 852). Vaid umbes 135 sõna on vaja, et moodustada pool suure valimi sõnadest.
Sama seos esineb paljudes teistes, keelega mitteseotud edetabelites, näiteks eri riikide linnade rahvastikureitingutes, ettevõtete suurustes, sissetulekute edetabelites jne. Jaotuse ilmnemist linnade edetabelites rahvaarvu järgi märkas esmakordselt Felix Auerbach 1913. aastal.
Ei ole teada, miks Zipfi seadus kehtib enamiku keelte puhul.
Küsimused ja vastused
K: Mis on Zipfi seadus?
V: Zipfi seadus on empiiriline seadus, mis väidab, et sõna sagedus suures valimis on pöördvõrdeline selle järjekohaga sagedustabelis.
K: Kes pakkus välja Zipfi seaduse?
V: Zipfi seaduse pakkus esimesena välja keeleteadlane George Kingsley Zipf.
K: Kuidas seletab Zipfi seadus sõnade sagedust inglise keele sõnade valimis?
V: Zipfi seaduse kohaselt esineb kõige sagedasem sõna inglise keele sõnade valimis umbes kaks korda sagedamini kui teine sõna, kolm korda sagedamini kui kolmas sõna jne. See suundumus jätkub, kui sõna järjekoht väheneb.
Küsimus: Kui suure osa kõigist sõnadest moodustab kõige sagedamini esinev sõna ühes ingliskeelsete sõnade valimis?
V: Ühes inglise keele sõnade valimis moodustab kõige sagedamini esinev sõna ("the") peaaegu 7% kõigist sõnadest.
K: Milline on suhe poolte valimi moodustamiseks vajalike sõnade arvu ja nende sõnade sageduse vahel?
V: Zipfi seaduse kohaselt on vaja ainult umbes 135 sõna, et kajastada poole valimi sõnadest suures valimis.
K: Millised teised järjestused näitavad Zipfi seadust?
V: Sama seos, mida Zipfi seadus kirjeldab sõnade sageduse puhul, esineb ka muudes pingereas, mis ei ole seotud keelega, näiteks eri riikide linnade elanike, ettevõtete suuruse ja sissetulekute pingereas.
K: Kes on märganud jaotuse ilmnemist linnade edetabelites rahvaarvu järgi?
V: Jaotuse ilmumist linnade rahvastiku järgi koostatud edetabelites märkas esmakordselt Felix Auerbach 1913. aastal.