Andmestruktuurid: määratlus, tüübid, toimimine ja näited

Õpi andmestruktuuride põhialuseid: definitsioon, tüübid, toimimine ja praktilised näited koos optimeerimisnõuannetega programmeerimiseks ja probleemilahenduseks.

Autor: Leandro Alegsa Loodud: 21. veebruar 2022 Uuendatud: 8. november 2025

Arvutiteaduses on andmestruktuur viis väärtuste ja teabe organiseerimiseks ja hoidmiseks nii, et seda saaks hiljem efektiivselt kasutada. Lihtsamalt öeldes on andmestruktuur reeglistik ja konkreetne paigutus andmete salvestamiseks mälus või teisel salvestusmeedial. Andmestruktuurid erinevad abstraktsetest andmetüüpidest selle poolest, kuidas neid reaalselt rakendatakse: abstraktne andmetüüp kirjeldab, milliseid operatsioone saab andmete peal teha, aga andmestruktuur on selle abstraktsiooni konkreetne realiseerimine. Andmestruktuurid realiseeritakse sageli koos algoritmide ja mäluhaldusmeetoditega, mis tagavad vajaliku jõudluse. Seda rolli võib hästi näha loendi (abstraktne andmetüüp) ja lingitud loendi (andmestruktuur) vahelises seoses. Nimekiri sisaldab väärtuste või infobittide jada. Seotud loendis on iga infosõlme vahel "osuti" või "viide", mis osutab järgmisele (ja topeltlingitud loendi puhul ka eelmisele) elemendile — see võimaldab liikuda loendis edasi või tagasi. Parima andmestruktuuri valimine probleemi lahendamisel on oluline osa programmeerimisest. Andmestruktuur on süstemaatiline viis andmete säilitamiseks ja nendele operatsioonide (nt lisamine, kustutamine, otsimine, läbikäimine) efektiivseks tegemiseks.

Tüübid ja nende omadused

Massiiv (array) — elementide järjestatud ja kontsentreeritud salvestus; kiire juhuslik ligipääs (O(1)), aga väärtuste lisamine või kustutamine keskele võib olla kallis (O(n)). Sobib, kui teada eeldatav suurus või kui vajalik kiire indekseeritud ligipääs.
Lingitud loend (linked list) — sõlme-põhine struktuur, kus iga element hoiab väärtust ja viidet järgmisele (või eelnevale) elementidele; lihtne lisada või eemaldada elemendid (O(1) juhul kui viide on olemas), aga juhuslik ligipääs on aeglane (O(n)).
Pinu (stack) — LIFO (last-in, first-out) reegli järgi; operaatorid: push, pop, peek. Tihti implementeeritud massiivina või lingitud loendina.
Järjekord (queue) — FIFO (first-in, first-out); operaatorid: enqueue, dequeue. Kasulik ülesannetes nagu tööde järjekorrad ja sündmuste käsitlemine.
Tärn- ja hulgapuu (tree, e.g. binary tree, BST, heap) — hierarhiline struktuur, kus sõlmedel võivad olla alam-sõlmed; binaarpuu jaotab andmed vasakule/paremale, heap tagab maksimaalse/minimaalse elemendi kiireks leidmiseks.
Hajutustabel (hash table) — võtme-põhine otsingutabel, mis kasutab hajutisfunktsiooni (hash) ja lahendab kollisioonid; keskmine ligipääs O(1), halbade hajutiste või kehva kollisioonihaldusega võib märkimisväärselt halveneda.
Graf (graph) — sõlmed (tipud) ja servad (ühendused); sobib võrkude, sõltuvuste ja marsruutide modelleerimiseks. Esindatakse tavaliselt naabrusloendite või naabrusmaatriksi abil.

Põhitegevused ja keerukus

Tavalised operatsioonid andmestruktuuride peal on: lisamine, kustutamine, otsimine, järjest läbitungimine (traversal) ja ligipääs indeksile. Iga struktuuri puhul tuleb arvestada nende operatsioonide ajalis-ruumilist keerukust (Big O). Mõned tüüpilised näited:

Massiiv: ligipääs O(1), otsimine O(n), sisestus/kustutus keskele O(n).
Lingitud loend: lisamine alguses O(1), otsimine O(n), juhuslik ligipääs O(n).
Hajutustabel: keskmine otsing/lisamine O(1), halvim O(n) sõltuvalt kollisioonidest.
Binaarne otsingupuu (tasakaalustamata): sisestus/otsing O(h), kus h on puu kõrgus; tasakaalustatud puudes (AVL, Red-Black) on see O(log n).
Heap: sisestus O(log n), maksimumi/või minimumi leidmine O(1), eemalduse korral O(log n).

Kasutusjuhtumid ja valikukriteeriumid

Andmestruktuuri valikul arvesta järgmiste küsimustega:

Millised operatsioonid peavad olema kiireimad? (otsing, lisamine, kustutamine, ligipääs indeksi järgi)
Kas andmete hulk muutub dünaamiliselt või on fikseeritud?
Kui tähtis on mälu kasutuse efektiivsus ja andmete järjestus?
Kas vajad mitut samaaegset ligipääsu või tahad immutabiilset struktuuri (nt funktsionaalset programmeerimist toetavad struktuurid)?

Näiteks, kui pead kiiresti otsima võtme järgi, vali hajutustabel või tasakaalustatud otsingupuu. Kui vajad LIFO-käitumist, kasuta pinu. Kui modelleerid võrgusõlmede suhteid, on graf vajalik koos sobiva esitusviisiga (naabrusloend vs -maatriks).

Praktilised näited

Implementatsioon: pinu saab lihtsasti realiseerida massiivina (fikseeritud suurus) või lingitud loendina (dünaamiline). Kui palju push/pop operatsioone ja mälupiiranguid on, määrab valiku.
Puud ja traversaalid: binaarse puu jaoks kasutatakse sageli rekursiivset või iteratiivset läbikäiku — inorder, preorder, postorder — sõltuvalt sellest, millist järjekorda andmete töötlemiseks vaja on.
Graafialgoritmid: BFS (laiusepõhine otsing) kasutab järjekorda, DFS (sügavuspõhine otsing) kas pinu (rekursiivne või iteratiivne). Need algoritmid näitavad, kuidas andmestruktuurid ja algoritmid koos töötavad.

Hea praktika

Kasuta standardseid ja hästi testitud raamatukogusid, kui need olemas on — enamik programmeerimiskeeli pakub optimeeritud andmestruktuure.
Hinda jõudlust reaalse töökoormuse alusel (profiling), mitte ainult teoreetiliste hinnangute põhjal.
Säilita lihtsus: ära optimeeri enne kui vajalik — selgus ja hooldatavus on tähtsal kohal.
Pane tähele mälu- ja konkulentsiaspekte, kui töötad mitme lõimega või suurte andmemassiividega.

Kokkuvõttes on andmestruktuurid programmeerimise ja algoritmide keskne osa: õige valik suurendab rakenduse efektiivsust ja lihtsustab lahenduse ehitamist. Hea arusaam erinevatest tüüpidest, nende omadustest ja kompromissidest aitab leida sobivaima lahenduse konkreetsele probleemile.

Põhilised andmestruktuurid

Array

Lihtsaim andmestruktuuri tüüp on lineaarne massiivi. Tuntud ka kui ühemõõtmeline massiivi. Massiivis hoitakse mitut sama tüüpi väärtust (täisarv, ujukesed, string jne). Juurdepääs elementidele massiivi sees on väga kiire. Massiiv on tavaliselt fikseeritud suurusega. Pärast seda, kui massiivi suurus on alguses kindlaks määratud, ei pruugi olla võimalik massiivi suurust suurendada ilma uue suurema massiivi loomiseta ja kõigi väärtuste kopeerimiseta uude massiivi. Arvutiteaduses on massiivi andmestruktuur või lihtsalt massiiv andmestruktuur, mis koosneb elementide (väärtuste või muutujate) kogumist, millest igaüht identifitseerib vähemalt üks massiivi indeks või võti. Massiiv salvestatakse nii, et iga elemendi positsiooni saab arvutada selle indeksitupli põhjal matemaatilise valemi abil.

Näiteks 10 täisarvulise muutuja massiivi, mille indeksid on 0 kuni 9, võib salvestada 10 sõnana mäluaadressidel 2000, 2004, 2008, 2036, nii et indeksiga i elemendi aadressiks on 2000 + 4 × i.

Kuna maatriksi matemaatilist mõistet saab esitada kahemõõtmelise ruudustikuna, nimetatakse kahemõõtmelisi massiive mõnikord maatriksiteks. Mõnel juhul kasutatakse arvutustehnikas massiivi tähistamiseks terminit "vektor", kuigi matemaatiliselt on korrektsem ekvivalent pigem tuplid kui vektorid. Massiivide abil rakendatakse sageli tabeleid, eriti otsingutabeleid; sõna tabel kasutatakse mõnikord massiivide sünonüümina.

Massiivid on üks vanimaid ja tähtsamaid andmestruktuure, mida kasutatakse peaaegu igas programmis. Neid saab kasutada ka paljude teiste andmestruktuuride, näiteks loetelude ja stringide rakendamiseks. Nad kasutavad tõhusalt ära arvutite adresseerimisloogikat. Enamikus kaasaegsetes arvutites ja paljudes välismäluseadmetes on mälu ühemõõtmeline sõnade massiivi, mille indeksid on nende aadressid. Protsessorid, eriti vektorprotsessorid, on sageli optimeeritud massiivioperatsioonideks.

Massiivid on kasulikud, sest elementide indeksid saab arvutada töö ajal. Muu hulgas võimaldab see omadus ühe iteratiivse avaldusega töödelda suvaliselt palju massiivi elemente. Sel põhjusel peavad massiivi andmestruktuuri elemendid olema ühesuurused ja kasutama ühesugust andmeesitust. Kehtivate indeksituplite hulk ja elementide aadressid (ja seega ka elementide adresseerimisvalem) on tavaliselt, kuid mitte alati, massiivi kasutamise ajal fikseeritud.

Mõiste massiivi all mõistetakse sageli massiivi andmetüüpi, mis on enamikus kõrgetasemelistes programmeerimiskeeltes pakutav andmetüüp, mis koosneb väärtuste või muutujate kogumist, mida saab valida ühe või mitme indeksi abil, mis arvutatakse töö ajal. Massiivi tüüpe rakendatakse sageli massiivi struktuuride abil; mõnes keeles võib neid siiski rakendada ka hash-tabelite, lingitud loendite, otsingupuude või muude andmestruktuuride abil.

Seotud nimekiri

Seotud andmestruktuur on teabe/andmete kogum, mis on omavahel seotud viidetega. Andmeid nimetatakse sageli sõlmedeks. Viiteid nimetatakse sageli linkideks või osutajateks. Edaspidi kasutatakse nende mõistete kohta sõnu sõlme ja osuti.

Seotud andmestruktuurides tuletatakse osutajaid ainult või võrreldakse neid võrdsuse suhtes. Seega erinevad seotud andmestruktuurid massiividest, mis nõuavad osutajate liitmist ja lahutamist.

Seotud loetelud, otsingupuud ja väljendipuud on kõik seotud andmestruktuurid. Need on olulised ka sellistes algoritmides nagu topoloogiline sorteerimine ja kogumiühenduste leidmine.

Stack

Korstnat on põhiline andmestruktuur, mida saab loogiliselt mõelda lineaarse struktuurina, mida kujutab endast reaalne füüsiline korstnat või virna, struktuur, mille ühes otsas, mida nimetatakse korstna tipuks, toimub elementide sisestamine ja kustutamine. Põhimõistet saab illustreerida, kui mõelda oma andmekogumile kui taldrikute või raamatute virnale, kust saab eemaldada asju ainult virnast ülemise elemendi. Seda struktuuri kasutatakse kogu programmeerimisel.

Korstna põhilist rakendust nimetatakse ka "Last In First Out" struktuuriks; siiski on olemas erinevaid variante korstna rakendustest.

Põhimõtteliselt on kolm operatsiooni, mida saab teha virnadega. Need on järgmised:

elemendi sisestamine ("lükkamine") virna
elemendi kustutamine ("popping") virnast.
virna ülemise elemendi sisu kuvamine ("piilumine")

Järjekord

Järjekord on abstraktne andmetüüp või lineaarne andmestruktuur, kus esimene element sisestatakse ühest otsast ("saba") ja olemasoleva elemendi kustutamine toimub teisest otsast ("pea"). Järjekord on "First In First Out" struktuur. "First In First Out" tähendab, et elemendid, mis pannakse järjekorda esimesena, tulevad esimesena välja ja elemendid, mis pannakse järjekorda viimasena, tulevad viimasena välja. Järjekorra näide on järjekorrad, kus inimesed ootavad. Esimene inimene järjekorras läheb esimesena ja viimane inimene järjekorras viimasena.

Elemendi lisamist järjekorda nimetatakse "järjekorda seadmiseks" ja elemendi eemaldamist järjekorrast nimetatakse "järjekorrast eemaldamiseks".

Graafik

Graaf on abstraktne andmetüüp, mis on mõeldud matemaatikast pärit graafi ja hüpergraafi mõistete rakendamiseks.

Graafi andmestruktuur koosneb piiratud (ja võimalik, et muutuv) hulk järjestatud paaridest, mida nimetatakse servadeks või kaaredeks, ja teatud üksustest, mida nimetatakse sõlmedeks või tipudeks. Nagu matemaatikas, öeldakse, et serv (x,y) näitab või läheb x-st y-sse. Sõlmed võivad olla osa graafistruktuurist või olla välised üksused, mida esindavad täisarvulised indeksid või viited. Graafi andmestruktuur võib seostada igale servale ka mingi serva väärtuse, näiteks sümboolse märgistuse või numbrilise atribuudi.

Puu

Puu on üks võimsamaid arenenud andmestruktuure. See esineb sageli arenenud teemades, nagu tehisintellekt (AI) ja disain. Üllataval kombel on puu oluline ka palju lihtsamas rakenduses - tõhusa indeksi pidamisel.

Puu kasutamisel on suur tõenäosus, et kasutatakse indeksit. Lihtsaim indeksitüüp on võtmeväljade sorteeritud loetelu. Puu on tavaliselt kindla struktuuriga. Binaarse puu puhul saab kasutada binaarset otsingut, et leida mis tahes element, ilma et oleks vaja vaadata iga elementi.

Puu andmetüüp on graafi tüüp, mis tähendab, et paljud algoritmid, mis on tehtud graafi läbimiseks, töötavad ka puu abil, kuid algoritmid võivad olla palju sarnased ja neil peab olema spetsiaalne algussõlm, st sõlme, millel ei ole teisi sõlmi, mis seda ühendavad.

Lihtsa järjestatud loendi probleem tekib siis, kui hakkate uusi elemente lisama ja peate loendit sorteerituna hoidma - seda saab teha küllaltki tõhusalt, kuid see nõuab mõningaid muudatusi. Lisaks ei ole lineaarset indeksit lihtne jagada, sest kogu indeks tuleb "lukustada", kui üks kasutaja seda redigeerib, samas kui puu ühe "haru" saab lukustada, jättes teised harud teistele kasutajatele redigeeritavaks (kuna neid ei saa mõjutada).

Hash tabel

Räsitabel on massiiv, kus iga indeks osutab räsiväärtusel põhinevale lingitud loendile. Hash-väärtus on väärtus, mis on määratud hash-funktsiooni abil. Hash-funktsioon määrab unikaalse väärtuse salvestatavate andmete põhjal. See võimaldab juurdepääsu andmetele konstantse ajaga, sest arvuti teab alati, kust otsida.

Küsimused ja vastused

K: Mis on andmestruktuur?

A: Andmestruktuur on väärtuste ja informatsiooni korraldus ja rakendamine arvutis nii, et seda oleks võimalik kergesti mõista ja sellega töötada.

K: Mille poolest erinevad andmestruktuurid abstraktsetest andmetüüpidest?

V: Andmestruktuurid on abstraktsete andmetüüpide rakendused konkreetses ja füüsilises keskkonnas.

K: Kuidas kasutavad andmestruktuurid algoritme?

V: Andmestruktuurid kasutavad abstraktsete andmetüüpide rakendamiseks konkreetses keskkonnas algoritme.

K: Kas te oskate tuua näite andmestruktuuri kohta?

V: Seotud nimekiri on näide andmestruktuurist, mis sisaldab "osutajat" või "viidet" iga infosõlme vahel.

K: Milleks on andmestruktuurid optimeeritud teatud operatsioonide jaoks?

V: Andmestruktuurid on sageli optimeeritud teatud operatsioonide jaoks, et parandada koodi tõhusust ja kiirust.

K: Miks on programmeerimisel oluline leida parim andmestruktuur?

V: Parima andmestruktuuri leidmine on programmeerimisel oluline, sest see võib probleemi lahendamisel oluliselt mõjutada koodi tõhusust ja kiirust.

K: Milline on andmestruktuuri määratlus lihtsustatult?

V: Andmestruktuur on süstemaatiline viis andmete salvestamiseks arvutis, et neid oleks lihtsam mõista ja nendega lihtsamalt töötada.

Seotud artiklid

Autor

AlegsaOnline.com Andmestruktuurid: määratlus, tüübid, toimimine ja näited Leandro Alegsa

URL: https://et.alegsaonline.com/art/25642

Kuidas seda artiklit tsiteerida

APA

Alegsa, L. (8. november 2025). Andmestruktuurid: määratlus, tüübid, toimimine ja näited. AlegsaOnline.com. https://et.alegsaonline.com/art/25642

MLA

Alegsa, Leandro. “Andmestruktuurid: määratlus, tüübid, toimimine ja näited.” AlegsaOnline.com, 8. november 2025, https://et.alegsaonline.com/art/25642

Chicago

Alegsa, Leandro. “Andmestruktuurid: määratlus, tüübid, toimimine ja näited.” AlegsaOnline.com. Uuendatud 8. november 2025. https://et.alegsaonline.com/art/25642

BibTeX

@misc{alegsaonline_25642,
  author = {Alegsa, Leandro},
  title = {Andmestruktuurid: määratlus, tüübid, toimimine ja näited},
  year = {2025},
  howpublished = {AlegsaOnline.com},
  url = {https://et.alegsaonline.com/art/25642},
  note = {Uuendatud: 8. november 2025; Language: et}
}

TXT

Leandro Alegsa. “Andmestruktuurid: määratlus, tüübid, toimimine ja näited.” AlegsaOnline.com. Uuendatud: 8. november 2025. https://et.alegsaonline.com/art/25642

Allikad

cs.cmu.edu : cs.cmu.edu
studytonight.com : studytonight.com/data-structures/queue-data-structure
interactivepython.org : interactivepython.org/courselib/static/pythonds/Graphs/graphintro.html
i-programmer.info : i-programmer.info/babbages-bag/477-trees.html