Kontrollitud loomulikud keeled (CNL) on ehtsatele emakeeltele sarnanevad, ent teadlikult lihtsustatud ja piiritletud keelevariandid. Neid kujundatakse grammatika, sõnavara ja semantiliste konstruktsioonide rangemate reeglite abil, et vähendada mitmetähenduslikkust ja üldist keerukust. Eesmärk on muuta tekstid selgemaks nii inimestele kui ka masinatele.
Tüübid ja eesmärgid
Kontrollitud keeli võib jagada kahte peamist gruppi:
- Lihtsustatud või tehnilised keeled — mõeldud peamiselt inimlugemiseks ja tõlkeprotsessi toetamiseks. Nende eesmärk on parandada dokumentide järjepidevust, kergendada tõlget ja vähendada tõlkevigu. Näited: ASD Simplified Technical English (ASD-STE100), Caterpillar Technical English ja IBM Easy English.
- Formaalselt määratletud CNL-id — kujundatud nii, et iga lause oleks deterministlikult tõlgitav formaalsesse keelde (nt esimese astme loogikasse). Selliseid keeli kasutatakse, kui on vaja automaatset semantilist analüüsi, teadmiste esitamist või automaatset järeldamist.
Peamised disainielemendid
- Piiratud ja kontrollitud sõnavara — lubatud on ainult kokkulepitudterminid ja tähendused.
- Sintaktilised reeglid — nt lühikesed laused, kindlad lauseliigid, isikuliste asesõnade kasutuse piiramine.
- Stiili- ja terminireeglid — standardtermide eelistamine ja vältida mitut sünonüümi sama kontseptsiooni jaoks.
- Semantilised piirangud — konstruktsioonid, mida saab üheselt kaardistada formaalsetesse representatsioonidesse (nt predikaadid, argumendid).
Kirjutamise juhised (näited)
Lihtsustatud keelte kirjutusreeglid on sageli praktilised ja kergesti mõistetavad. Näited tüüpilistest soovitustest:
- kirjuta lühikesi ja lihtsaid lauseid;
- kanna eelistust tegusõnaliste lausete kasuks ja väldi liigset passiivset vormi;
- kasuta isikunimesid (nt "John Smith") asemel ebaselgete asesõnade nagu "teda" liigset kasutamist;
- kirjelda selgelt, kes midagi teeb (agent) ja mida tehakse (tegevus), välja arvatud juhul, kui on vaja rõhutada tegevuse tulemust või olekut.
Praktilised näited
Ambiguus lause: "Ta andis rahalise toetuse õpetajale, kes oli teda toetanud." — siit võib olla ebaselge, kes keda toetas.
Kontrollitud keele versioon: "Jane Smith andis õpetajale rahalise toetuse. Õpetaja oli varem Jane Smithi toetanud." — laused on lühemad ja suhe selgem.
Töövood ja tööriistad
Kontrollitud keelte kasutamiseks on loodud abivahendid nagu kirjutamisjuhendid, sõnaraamatud, keelekontrolli tarkvara ja redaktorid, mis märgistavad reeglite rikkumisi ning pakuvad automaatseid ümberkirjutusi. Formaalsemate CNL-ide puhul on olemas parserid, mis tõlgivad laused formaalsetesse andmestruktuuridesse või loogikaväljenditesse, võimaldades automaatset otsingut, valideerimist ja järeldamist.
Kasutusalad
- tehnilised käsiraamatud ja remontjuhised (õhuliin, sõjavägi, tööstus) — kus selgus ja vigadeta tõlgendamine on eluliselt tähtsad;
- automaatne tõlge ja lokaliseerimine — standardtermid kiirendavad ja parandavad masintõlget;
- teadmiste modelleerimine ja reeglipõhine süsteemide koostamine — CNL-id võimaldavad esitada ärareegleid ja nõudeid masinloetaval kujul;
- õigusaktide ja lepingute selgitamine — lihtsustamine aitab vältida tõlgenduslikke vaidlusi;
- haridus ja juhendmaterjalid — kergemini mõistetavad tekstid keeleõppijatele ja erialavälistele lugejatele.
Eelised ja piirangud
- Eelised: vähendab ambiguiteti, parandab järjepidevust, lihtsustab tõlget, võimaldab automaatset analüüsi ja kvaliteedikontrolli.
- Piirangud: väljendusrikkuse vähenemine, mõnikord ebaloomulik või liiga formaalne stiil, alguses nõuab kirjutajate koolitust ning sõnavara ja reeglite haldamist.
Lühike ajalugu ja tuntud näited
Kontrollitud keelte idee arenes välja praktilistest vajadustest — esmalt tehnilises dokumentatsioonis ja hiljem ka teadmiste esindamises. Tuntud näidetena võib nimetada ASD Simplified Technical English (ASD-STE100), Caterpillari spetsiaalseid juhendeid ja IBM-i Easy English ning formaalsemaid süsteeme nagu Attempto Controlled English (ACE), mis võimaldavad lauseid tõlkida formaalsesse loogikasse.
Kokkuvõttes on kontrollitud loomulikud keeled kasulik tööriist, kui eesmärgiks on üheselt mõistetav tekst nii inimeste kui ka masinate jaoks. Õige rakenduse korral vähendavad need vigu, parandavad efektiivsust ja lihtsustavad automatiseeritud töötlemist, kuid nõuavad distsipliini ja hoolikat reeglite haldamist.