Transkriptsioon on teksti teisendamine mõnelt teiselt andmekandjalt.

See võib olla inimkõne teisendamine kirjalikku, masinakirjasesse või trükitud vormi. Kuid see võib tähendada ka raamatute skaneerimist ja digitaalsete versioonide koostamist. Transkribeerija on isik, kes teeb transkriptsioone.

Transkriptsiooni, mis läheb helilt kirjapildile, tuleb eristada translitereerimisest, mis loob ühest kirjapildist teise kirjapildi, mille eesmärk on võimalikult otseselt vastata originaalkirjale.

Standardsed transkriptsiooniskeemid keelelisteks eesmärkideks on rahvusvaheline foneetiline tähestik (IPA) ja selle ASCII-ekvivalent SAMPA. Vt ka foneetiline transkriptsioon

Selles tabelis IPA on näide Venemaa endise presidendi nime foneetilisest transkriptsioonist, mis on inglise keeles tuntud kui Boriss Jeltsin, millele järgnevad erinevates keeltes aktsepteeritud hübriidvormid. Pange tähele, et "Boris" on pigem translitereerimine kui transkriptsioon ranges mõttes.

Samu sõnu transkribeeritakse erinevates süsteemides tõenäoliselt erinevalt. Näiteks Hiina pealinna mandariinikeelne nimi Peking on tänapäeva üldkasutatavas süsteemis Hanyu Pinyin, kuid ajalooliselt olulises Wade Giles'i süsteemis kirjutatakse see Pei-Ching.

Praktilist transkriptsiooni saab teha ka mittealfabeetilisse keelde. Näiteks ühes Hongkongi ajalehes on George Bushi nimi translitereeritud kahe hiina tähega, mis kõlab nagu "Bou-sū". (布殊), kasutades märke, mis tähendavad "kangas" ja "eriline". Samamoodi laenatakse jaapani keelde palju sõnu inglise ja teistest Lääne-Euroopa keeltest ning need transkribeeritakse, kasutades katakanat, ühte jaapani silbistikku.

Transkriptsiooni liigid ja eristused

Keeltes ja päringutes teostatakse transkriptsiooni mitmel eesmärgil, mistõttu on kasulik eristada peamisi tüüpe:

  • Ortograafiline (kirjapildi) transkriptsioon — sõnade ümberkirjutus vastavas sihtkeele tavapärase ortograafia reeglite järgi. Kasutatakse meedias, ajakirjanduses ja igapäevases kirjas. See võib sisaldada häälduse lihtsustatud kujusid, mis on laiale lugejaskonnale arusaadavamad.
  • Foneetiline transkriptsioon (IPA jne) — keskendub häälikutele ja hääldusele. See võib olla lai (broad transcription), kus kajastatakse vaid kuulsaid erisusi, või kitsa (narrow transcription), mis kasutab diakriitilisi märke ja täpsemaid detaile. Selliseks töös kasutatakse sageli IPA.
  • Translitereerimine — kujutab endast ühe kirjapildi teisendamist teise, säilitades võimalikult palju originaalse graafilise kuju ja järjestust. See ei pruugi alati peegeldada täpset hääldust (vt translitereerimisest).
  • Funktsionaalne või praktiline transkriptsioon — lihtsustatud häälduse esitus, mida kasutatakse subtiitrites, kohtukuludes, heliskirjades või automaatse kõnetuvastuse treenimiseks.

Foneetilised süsteemid ja standardid

Rahvusvaheline foneetiline tähestik (IPA) on kõige üldisem ja ühemõttelisem vahend häälduse märkimiseks akadeemilises ja õppecontextis. Selle eeliseks on võime kirjeldada hääldusi täpselt ning katta kõiki maailma häälikuid. Kuna IPA kasutab erilisi sümboleid, eksisteerivad ka ASCII-põhised variandid (nt SAMPA ja X-SAMPA), mis sobivad arvutipõhiseks töötlemiseks.

Mitte-foneetilised, aga laialdaselt kasutatavad süsteemid hõlmavad rahvuste ja keelte spetsiifilisi romaniseerimissüsteeme:

  • Hiina: Hanyu Pinyin (standardeeritud mandariini romaniseerimine) ja ajalooline Wade–Giles;
  • Jaapani: Hepburni romaniseerimine ning transkriptsioon, mis tugineb katakanale (silbeline märkesüsteem, mida kasutatakse võõrsõnade esitamiseks ja laenude märkimiseks);
  • Araabia ja teised kirjutussüsteemid: erinevad transliteratsiooni- ja transkriptsioonistandardid, mis püüavad tasakaalustada täpsust ja kasutusmugavust.

Näited ja probleemkohad

Üks näide vastuolulisusest on isikunimede või paikade transkriptsioon. Nagu artiklis mainitud, võib Venemaa presidendi nimi Boriss Jeltsin esineda mitmes erinevas kujus sõltuvalt, kas kasutatakse transliteratsiooni, lihtsalt rahvusliku ortograafia traditsiooni või foneetilist kirjutust. Sarnane on Hiina pealinna puhul: Peking vs Beijing — esimene on ajalooline ja traditsiooniline eesti/nimekujude rida, teine põhineb Pinyinil ja peegeldab lähedasemalt mandariini hääldust (vt Hiina ja mandariinikeelne tekst).

Praktilise näitena toob artikkel esile Hongkongi ajalehe variandi George Bushi nime kohta, kus kasutatakse kahte hiina märki ning heli kujutatakse kui "Bou-sū" (布殊) — see näitab, et transkriptsioon või transliteratsioon võib kombineerida fonoloogilist lähtepunkti ja tähendust või lihtsat häälduse kujutust, sõltuvalt sihtrühmast ja eesmärgist.

Rakendused ja praktilised kaalutlused

  • Akadeemiline keeltekirjandus ja fonoloogia kasutavad IPA-d täpseks häälduse dokumenteerimiseks.
  • Meedia ja rahvusvahelised suhtluskanalid kasutavad sageli lihtsustatud ortograafilisi variante, mis on lugejale tuttavamad.
  • Automaatne kõnetuvastus, sõnaraamatud ja keeletehnoloogia vajavad ühtseid, masinloetavaid transkriptsiooniskeeme (nt SAMPA, X-SAMPA või Pinyin), et andmeid töödelda ja firmadevahelisi andmekogumeid integreerida.
  • Õiguslikus ning meditsiinilises dokumentatsioonis nõutakse tihti sõna-sõnalt ja kontrollitavat transkriptsiooni (nt kohtuvideod, patsientide ankeedid).

Kokkuvõte

Transkriptsioon on lai mõiste, mis hõlmab nii helikandjate ümberkirjutust kirjalikku vormi kui ka kirjalike andmete teisendamist erinevate andmekandjate vahel. Täpne valik transkriptsiooniskeemi sõltub eesmärgist: kas tähtis on häälduse täpsus (kasutatav IPA), graafilise kujutise vastavus (translitereerimine, vt translitereerimisest) või lugejasõbralikkus (ortograafiline vorm).

Erinevad keeled ja kultuurid on välja arendanud oma norme ning tihti leidub sama termini mitu korrektset kujutist, mis peegeldavad ajaloolisi, praktilisi või keelelisi kaalutlusi.