Dale–Challi loetavuse valem: sõnavara-põhine lugemisraskuse mõõdik
Dale–Challi loetavuse valem: sõnavara-põhine lugemisraskuse mõõdik — lihtne arvutus klassitaseme määramiseks, õpikute hindamiseks ja automaatseks tekstianalüüsiks autoritele ja õpetajatele.
Dale-Challi valem on üks viis, kuidas ennustada, kui raske on teksti lugeda. See on loetavuse test. Algupäraselt põhines Dale–Challi lähenemine sõnavara tuntuse hindamisel: uuriti, kas tekstis kasutatud sõnad kuuluvad autorite poolt koostatud tuttavate sõnade nimekirja. Selle põhjal sai hinnata teksti sõnavara‑raskust. Valem ei ole siiski mõeldud üksnes sünaktilise ehk lauseehitusliku keerukuse otseseks mõõtmiseks — selle peamine fookus on sõnavara ja lausepikkuse mõjudel loetavusele.
Üks esimestest loetavuse‑testidest, Dale‑Challi meetod, kasutas sõnavara nimekirja (tuntud sõnad). Nimekirjas loetletud sõnade arvu võrreldes kogu teksti sõnadega kasutati loetavuse hindamiseks. Meetodit rakendati USA koolipiirkondades õpikute ja õppematerjalide sobivuse hindamiseks klassitaseme järgi. 1995. aastal avaldasid autorid ajakohastatud sõnade nimekirja, mis kajastas keele muutusi ja kaasaegsema sõnavara levikut.
Kuidas valem täpsemalt töötab
Dale–Challi valem ühendab kahte põhikomponenti:
- teksti % keerulisi sõnu — ehk sõnad, mis EI kuulu tuttavate sõnade nimekirja;
- keskmine lausepikkus (sõnade arv lauses).
Tavapärane valem (Dale–Chall, 1995) on järgmine:
Raw score = 0.1579 × (% difficult words) + 0.0496 × (average sentence length)
Kui % keerulisi sõnu on suurem kui 5%, lisatakse tulemusele veel 3.6365 parandustermin, et korrigeerida loetavuse raskema taseme mõju.
Arvutamise sammud
- Loenda teksti kõik sõnad ja kõik täislauseed (või laused, nagu määratletud automaatses analüüsis).
- Loenda sõnad, mida ei leita Dale‑Challi tuttavate sõnade nimekirjast — need on „keerulised” sõnad.
- Arvuta % keerulistest sõnadest = (keeruliste sõnade arv / kogu sõnade arv) × 100.
- Arvuta keskmine lausepikkus = (kõik sõnad / laused).
- Asenda need väärtused valemisse ja lisa vajadusel 3.6365, kui % keerulisi sõnu > 5%.
- Tulemuseks saadud „raw score” teisendatakse hinnanguliseks klassitasemeks vastavalt standardsele tabelile (näiteks: 4.9 ja alla = 4. klass või madalam; 5.0–5.9 ≈ 5.–6. klass; 6.0–6.9 ≈ 7.–8. klass; 7.0–7.9 ≈ 9.–10. klass; 8.0–8.9 ≈ 11.–12. klass; 9.0+ ≈ kolledži tase).
Lihtne näide
Oletame: tekstis 100 sõna, neist 12 on nimekirjas mittetuntud (keerulised) sõnad → % keerulisi = 12%. Lauseid on 5 → keskmine lausepikkus = 20 sõna.
Raw score = 0.1579 × 12 + 0.0496 × 20 = 1.8948 + 0.992 = 2.8868. Kuna % keerulisi > 5, lisame 3.6365 → lõpppunkt = 6.5233, mis vastab umbkaudselt 7.–8. klassi tasemele.
Rakendused ja automaatika
Põhimõtteliselt on lihtne kasutada sõnavara nimekirja osana arvutipõhisest loetavuse mõõtmisest: nimekiri toimib otsingutabelina ja automaatne loendamine annab vajalikud sisendandmed valemi jaoks. Paljud tekstitöötlus‑ ja analüüsitööriistad toetavad Dale–Challi või selle variatsioonide arvutamist, kui neile anda tuttavate sõnade loend ja tekst.
Piirangud ja tähelepanekud
- Dale–Challi meetod on algselt välja töötatud inglise keele jaoks ja tugineb eng sõnavara nimekirjale; sama nimekiri ei sobi otse teistesse keeltesse — täpseks kasutamiseks tuleb koostada või kohandada kohaliku keele tuntud sõnade loend.
- Valem ei mõõda teksti sisu keerukust, teemakäsitluse nõudlikkust, teksti loogilist ülesehitust ega lugeja eelteadmisi. Need aspektid võivad loetavust tugevalt mõjutada.
- Automaatne arvutus võib valetada kääne‑, liitsõnade, tuletiste või erialaterminite puhul, kui need ei lange nimekirja lihtsate sõnade hulka, ning võib valehäälestuse tõttu üle‑hinnata raskust.
- Lausetel ja sõnadel on kvaliteedi ja mõtte edastamise seisukohalt oluline roll; seetõttu on soovitatav kombinatsioon automaatsetest mõõdikutest ja toimetaja/ülevaataja inimlikust hinnangust.
Soovitused teksti lihtsustamiseks
- Kasutage võimalusel tuttavaid ja lühemaid sõnu.
- Lühendage lauseid ja jagage pikki lõike väiksemateks osadeks.
- Kontrollige teksti eesmärki ja sihtrühma — kohandage sõnavara vastavalt lugejate eelteadmistele.
- Kui töötate eesti keeles, kaaluge kohaliku „tuttavate sõnade” nimekirja koostamist enne Dale–Challi meetodi rakendamist.
Kokkuvõttes on Dale–Challi valem kasulik tööriist, et hinnata peamiselt sõnavara‑põhist loetavust ja selle suhtelist sobivust eri klassitasemetele, kuid see ei asenda terviklikku toimetamist ega lugejakeskset testimist. Uuendatud sõnade nimekirjad (näiteks 1995. aasta versioon) aitavad mudelit kaasaegsemaks teha ja parandavad tulemuste relevantsust.
Seotud leheküljed
- Loetletavuse testide loetelu
- Tekstiline raskus
Küsimused ja vastused
K: Mis on Dale-Challi valem?
V: Dale-Challi valem on viis, kuidas ennustada teksti lugemisraskust.
K: Mida mõõdab Dale-Challi valem?
V: Dale-Challi valemiga mõõdetakse tekstis kasutatud sõnade raskusastet.
K: Kas Dale-Challi valemiga mõõdetakse lause struktuuri raskust?
V: Ei, Dale-Challi valemiga ei mõõdeta lause struktuuri (süntaksi) raskust.
K: Kuidas Dale-Chali valem töötab?
V: Dale-Chali valem kasutab sõnavara nimekirja, et lugeda kirjakohas loetletud sõnade arvu, ja seejärel rakendab valemit, et anda raskusaste.
K: Milleks kasutati Dale-Chali valemit?
V: Dale-Chali valemit kasutati USA koolipiirkondades õpikute hindamiseks klassitaseme järgi.
K: Kas Dale-Chali valemit ajakohastati?
V: Jah, 1995. aastal avaldasid Dale-Chali valemi autorid ajakohastatud sõnade nimekirja.
K: Kas Dale-Chali valemit on lihtne kasutada arvutipõhise loetavuse mõõtmise osana?
V: Jah, Dale-Chali valemit on lihtne kasutada arvutipõhise loetavuse mõõtmise osana, sest loetelu on korraldatud otsetabelina ja loetletud sõnade protsentuaalne osakaal tekstis annab andmed valemi jaoks ning kasutajale esitatakse klassifikatsioon.
Otsige