HUGO geeninomenklatuuri komitee (HGNC) määrab igale teadaolevale inimgeenile unikaalse ja tähendusrikka nime. Komitee töötab koos valdkonnaekspertidega ja järgib selgeid nomenklatuurieeskirju, et geneetika- ja meditsiinikirjanduses ning andmebaasides oleksid nimed järjekindlad ja arusaadavad. HGNC annab igale geenile pika nime ja lühendi (mida nimetatakse sümboliks).
Mida HGNC täpselt teeb?
- Heaks kiidab unikaalse lühisümboli (nt 3–6 tähemärki), mis on mõeldud üheainsa inimese geeni tähistamiseks.
- Õpetusega täisnimi — iga geeni juurde on määratud selgitav, tähendusrikas pikk nimetus.
- HGNC‑identifikaator — iga geeni juures on püsiv number (näiteks vormis HGNC:XXXXX), mis aitab andmeid usaldusväärselt siduda eri andmebaaside vahel.
- Varasemate nimede ja sünonüümide nimekiri — kui geenil on ajaloolisi või alternatiivseid nimesid, märgitakse need ära, et oleks lihtne leida vajalikku informatsiooni vanematest allikatest.
- Ristviited teiste andmebaasidega — HGNC kirjed sisaldavad linke sellistele andmebaasidele nagu Entrez Gene, Ensembl ja UniProt, et lihtsustada andmete ühendamist.
Miks on standardiseeritud nimed olulised?
Traditsionaalsed geeninimed ja lühendid pole harva ühegeenspetsiifilised, mis tekitab segadust nii teadusuuringutes kui ka kliinilises praktikas. Näiteks võib lühend CAP (kokkuvõtlikult "kromosoomiga seotud valk") viidata mitmele eri geenile — näiteks BRD4, CAP1, LNPEP, PTPLA, SERPINB6 ja SORBS1. HGNC heakskiidetud sümbolid on unikaalsed ja iga sümbol kuulub ainult ühele geenile, mis vähendab valevõrdlusi ja eksitusi andmetöötluses, meditsiinilistes aruannetes ning teaduspublikatsioonides.
Nimed, vormistus ja soovitused
- HGNC‑i heakskiidetud sümbolid koosnevad üldiselt suurtest ladina tähtedest ja numbritest (ilma mittestandardsete sümboliteta) ning on mõeldud lühikeseks, järjepidevaks tähiseks.
- Teadusartiklites on tavaks inimgeeni tähistamisel kasutada sümbolit kaldkirjas (itaalikas) ning vastava valgu nimetamisel sama sümbolit rasvkirjas või tavakirjas — selle täpne vormistus võib sõltuda ajakirja stiilist.
- HGNC püüab tagada nime stabiilsuse: sümboleid ei muuda ilma kaalukate põhjusteta, kuid vajaduse korral (näiteks vigase või eksitava nime tõttu) võib toimuda ümbernimetamine kooskõlastatult ekspertidega.
Kellele ja kuidas HGNC teenus kasulik on?
HGNC nomenklatuur on oluline nii teadlastele, arstidele, geneetikutele kui ka andmeanalüüsi spetsialistidele. Mõned praktilised kasutusvaldkonnad:
- publikatsioonid ja andmevahetus — ühtne sümbolite kasutamine lihtsustab tulemuste võrdlemist;
- kliinilised raportid ja geneetilised testid — selged nimed vähendavad eksitusi patsiendiandmetes;
- bioinformaatika ja andmeintegraatorid — püsivad HGNC‑IDd võimaldavad siduda ja koondada andmeid erinevatest allikatest;
- õppe- ja teavitustöö — ühtne nomenklatuur aitab õppijatel ja laiema publiku mõistmisel.
Kuidas HGNC nimed tekivad?
Uue geeni nimepanekuks uurib HGNC olemasolevat kirjandust ja konsulteerib uurimisgruppide või valdkonnaekspertidega. Nimepanek peab järgima selgeid reegleid (nt vältida segadust tekitavaid lühendeid või kaubamärkidega kattuvaid nimesid) ning arvestama geneetilise info püsivuse ja loogikaga geneetiliste perekondade sees. Kui on vaja teha muudatusi, püüab komitee tagada sujuva ülemineku, dokumenteerides varasemad nimed ja viidates põhjustele.
Kust ja kuidas otsida HGNC infot?
HGNC andmebaas on avalikult kättesaadav veebis, kus saab otsida geeni nime, sümbolit või HGNC‑ID järgi, vaadata varasemaid sünkronüüme ja leida ristviiteid teiste andmeallikatega. Andmete massallalaadimine ja API‑liidesed võimaldavad integreerida HGNC teabe tööstusliku või uurimuse töövooga.
Kokkuvõtlikult: HGNC‑i töö toob selgust geneetilisse nomenklatuuri, vähendab eksitusi ja lihtsustab teadmiste jagamist meditsiini ning teaduse eri valdkondades.