Valim
Statistikas on valim osa üldkogumist. Valim on hoolikalt valitud. See peaks esindama kogu üldkogumit õiglaselt, ilma eelarvamusteta. Valimit on vaja seetõttu, et populatsioonid võivad olla nii suured, et kõikide isikute loendamine ei ole võimalik või otstarbekas.
Seetõttu algab probleemi lahendamine statistikas tavaliselt valimiga. Valimi moodustamine tähendab, et valitakse, milliseid andmeid võtta hilisemaks analüüsiks. Oletame näiteks, et uuringu jaoks tuleks analüüsida järve reostust. Sõltuvalt sellest, kust veeproovid võeti, võivad uuringud anda erinevaid tulemusi. Üldreeglina peavad proovid olema juhuslikud. See tähendab, et ühe indiviidi valimise võimalus või tõenäosus on sama suur kui mis tahes teise indiviidi valimise võimalus.
Praktikas võetakse juhuslikud valimid alati täpselt määratletud menetluse abil. Protseduur on reeglite kogum, paberile kirjutatud ja täpselt järgitud sammude jada. Isegi sellisel juhul võib valimisse jääda mõningane kallutatus. Võtame näiteks valimi koostamise probleemi, et ennustada valimisküsitluse tulemust. Kõigil teadaolevatel meetoditel on omad probleemid ja valimistulemused erinevad sageli valimi põhjal tehtud prognoosidest. Kui te kogute arvamusi telefonide abil või kohtudes inimestega tänaval, on valimis alati eelarvamusi. Seetõttu ei ole sellisel juhul kunagi võimalik täiesti neutraalne valim. Sellistel juhtudel mõtleb statistik, kuidas mõõta kallutatuse suurust, ja selle hindamiseks on võimalusi.
Sarnane olukord tekib siis, kui teadlased mõõdavad füüsikalist omadust, näiteks metallitüki kaalu või valguse kiirust. Kui me kaalume objekti tundlike seadmetega, siis saame pisut erinevaid tulemusi. Ükski mõõtmissüsteem ei ole kunagi täiuslik. Me saame rea hinnanguid, millest igaüks on mõõtmine. Need on näidised, millel on teatav veaaste. Statistika on mõeldud vigade kirjeldamiseks ja selliste andmete analüüsimiseks.
On olemas eri tüüpi proovid:
Piiripolitsei otsib illegaalseid narkootikume spetsiaalselt koolitatud koeraga: Kui nad kontrollivad iga kümnendat autot, võtavad nad erapooletu proovi.
Stratifitseeritud valimi võtmine
Kui populatsioonil on ilmseid alampopulatsioone, siis tuleb igast alampopulatsioonist võtta proovid. Seda nimetatakse stratifitseeritud valimiks. Kihistatud valimit nimetatakse ka kihistatud juhuvalimiks. Stratifitseeritud valimit esitatakse sageli proportsioonina, näiteks protsendina (%).
Oletame, et eksperimendi eesmärk on uurida täiskasvanute sissetulekuid. On selge, et kõrgkooli lõpetanute sissetulekud võivad erineda mitteõppijate sissetulekutest. Oletame nüüd, et kõrgkooli lõpetanud meeste arv on 30% kõigist täiskasvanud meestest (kujuteldavad arvud). Siis te korraldaksite, et 30% kogu valimist oleksid juhuslikult valitud meessoost kõrgkooli lõpetajad ja 70% kogu valimist oleksid meessoost mitte-eriala lõpetajad. Korrake seda protsessi naiste puhul, sest naissoost lõpetajate osakaal erineb meeste omast. See annab täiskasvanud elanikkonna valimi, mis on stratifitseeritud soo ja kõrghariduse järgi. Järgmine samm oleks jagada iga alampopulatsioon vanuserühmade kaupa, sest (näiteks) lõpetajad võivad keskmises eas saada rohkem sissetulekut võrreldes mitteõppijatega.
Teist tüüpi kihiline valim käsitleb varieeruvust. Siin võetakse suuremad valimid muutlikumatest alampopulatsioonidest, nii et koondstatistika, nagu keskmised ja standardhälbed, oleks usaldusväärsem.
Küsimused ja vastused
K: Mis on statistikas näidis?
V: Statistikas on valim osa üldkogumist, mis on hoolikalt valitud nii, et see esindaks kogu üldkogumit õiglaselt ja erapooletult.
K: Milleks on valimeid vaja?
V: Valimeid on vaja, sest populatsioonid võivad olla nii suured, et kõigi üksikisikute loendamine ei ole võimalik või otstarbekas. Seetõttu algab probleemi lahendamine statistikas tavaliselt valimi võtmisega.
K: Kuidas on valim esindatud?
V: Kui valimit käsitletakse andmekogumina, esitatakse seda sageli suurte tähtedega, näiteks X ja Y, kusjuures selle elemendid esitatakse väikse tähtedega (nt x3) ja valimi suurus esitatakse tähega n. Kui valimit käsitletakse andmekogumina, esitatakse seda sageli suurtähtedega.
K: Millised peaksid olema valimid?
V: Üldreeglina peavad valimid olema juhuslikud, mis tähendab, et ühe indiviidi valiku võimalus või tõenäosus on sama suur kui võimalus valida mõni teine indiviid. Praktikas võetakse juhuslikud valimid alati täpselt määratletud protseduuri abil.
K: Kas valimisse võib jääda kallutatust?
V: Isegi kui valimi moodustamiseks kasutatakse täpselt määratletud menetlusi, võib valimisse jääda mõningane kallutatus, mis tuleneb näiteks sellest, kes vastab telefonikõnedele või kes kõnnib teatud tänavatel, kui kogutakse arvamusi valimisküsitluse prognoosimiseks. Sellistel juhtudel võib olla raske saada täiesti neutraalseid valimeid, kuid statistikud saavad mõõta, kui palju kallutatust jääb alles.
K: Kas on olemas erinevaid valimeid?
V: Jah, on olemas eri liiki valimid, sealhulgas täielikud valimid, mis sisaldavad kõiki elemente, millel on antud omadused, ja erapooletud/representatiivsed valimid, mille puhul valitakse elemendid täielike valimite hulgast, sõltumata nende omadustest. Valimi moodustamise viis ja selle suurus mõjutavad seda, kuidas andmeid vaadeldakse.