Sisu
· 1 Sissejuhatus
o 1.1 Füüsiliste ja loogiliste ketaste erinevus
o 1.2 Andmete lugemine ja kirjutamine
o 1.3 Mis on RAID?
o 1.4 Miks kasutada RAID-i?
o 1.5 Ajalugu
· 2 RAID-süsteemides kasutatavad põhimõisted
o 2.1 Caching
o 2.2 Peegeldamine: Rohkem kui üks koopia andmetest
o 2.3 Triibustamine: Osa andmetest on teisel kettal
o 2.4 Veaparandus ja vead
o 2.5 Hot spares: rohkem kettaid, kui vaja on
o 2.6 Triibu suurus ja tükisuurus: andmete jaotamine mitmele kettale
o 2.7 Ketta kokkupanek: JBOD, liitmine või laiendamine
o 2.8 Kettakloonimine
o 2.9 Erinevad seadistused
· 3 Põhitõed: lihtsad RAID-tasemed
o 3.1 Üldkasutatavad RAID-tasemed
§ 3.1.1 RAID 0 "ribadeerimine"
§ 3.1.2 RAID 1 "peegeldamine"
§ 3.1.3 RAID 5 "jaotatud pariteediga ribadeerimine"
§ 3.1.4 Pildid
o 3.2 Vähem kasutatud RAID-tasemed
§ 3.2.1 RAID 2
§ 3.2.2 RAID 3 "ribadeerimine spetsiaalse pariteediga"
§ 3.2.3 RAID 4 "ribadeerimine spetsiaalse pariteediga"
§ 3.2.4 RAID 6
§ 3.2.5 Pildid
o 3.3 Mittestandardsed RAID-tasemed
§ 3.3.1 Topeltpariteet / diagonaalpariteet
§ 3.3.2 RAID-DP
§ 3.3.3 RAID 1.5
§ 3.3.4 RAID 5E, RAID 5EE ja RAID 6E
§ 3.3.5 RAID 7
§ 3.3.6 Intel Matrix RAID
§ 3.3.7 Linux MD RAID draiver
§ 3.3.8 RAID Z
§ 3.3.9 Pildid
· 4 RAID-tasemete ühendamine
· 5 RAIDi tegemine
o 5.1 Tarkvara RAID
o 5.2 Riistvaraline RAID
o 5.3 Riistvaraga toetatud RAID
· 6 Erinevad terminid, mis on seotud riistvara riketega
o 6.1 Rikkumiste arv
o 6.2 Keskmine aeg andmete kadumiseni
o 6.3 Keskmine taastumisaeg
o 6.4 Parandamatu bitivigade arv
· 7 RAIDiga seotud probleemid
o 7.1 Plaatide lisamine hiljem
o 7.2 Seotud tõrked
o 7.3 Aatomsus
o 7.4 Taastamatud andmed
o 7.5 Kirjutamise vahemälu usaldusväärsus
o 7.6 Seadmete ühilduvus
· 8 Mida RAID saab ja mida ei saa teha
o 8.1 Mida RAID suudab teha
o 8.2 Mida RAID ei saa teha
· 9 Näide
· 10 viited
· 11 Muud veebisaidid
RAID on akronüüm, mis tähendab Redundant Array of Inexpensive Disks või Redundant Array of Independent Disks. RAID on termin, mida kasutatakse arvutitehnoloogias. RAIDi puhul tehakse mitmest kõvakettast üks loogiline ketas. Seda saab teha erinevatel viisidel. Igal meetodil, mis paneb kõvakettad kokku, on mõningaid eeliseid ja puudusi võrreldes üksikute, üksteisest sõltumatute ketastena kasutamisega.
Sissejuhatus ja põhikontseptsioonid
RAIDi põhiline idee on kombineerida mitu füüsilist ketast nii, et saavutada paremat jõudlust, suurem töökindlus või suurem salvestusmaht võrreldes üksikute ketaste kasutamisega. RAID ei asenda varundamist — ta keskendub peamiselt riistvara riketest või mõningatest andmekadu juhtudest taastumise parandamisele, mitte kasutaja eksituse või failisüsteemi korruptsiooni vastu kaitsmisele.
Füüsilised vs loogilised kettad
Füüsiline ketas on tõeline riistvaraline kõvaketas või SSD. Loogiline ketas on operatsioonisüsteemi või RAID-kontrolleri poolt nähtav ühendatud salvestusruum (näiteks üksik loogiline draiv, mis tegelikult koosneb mitmest füüsilisest kettast). RAID-iga kombineeritakse füüsilisi kettaid, et esitada need süsteemile kui üks või mitu loogilist ketast.
Andmete lugemine ja kirjutamine RAID-is
Erinevad RAID-tasemed ja -kontrollerid mõjutavad seda, kuidas andmeid lugeda ja kirjutada. Mõned RAID-konfiguratsioonid jagavad andmeid väiksemateks tükkideks (triibustamine) ja kirjutavad need paralleelselt mitmele kettale, mis võib parandada järjestikust ja paralleelset jõudlust. Teised konfiguratsioonid hoiavad täiskoopiaid (peegeldamine) või arvutavad pariteetbitid vigade tuvastamiseks ja parandamiseks.
Miks kasutatakse RAID-i?
- Andmete kadumise vähendamine, kasutades mitut koopiat või pariteeti (kui üks ketas ebaõnnestub, ei kao andmed kohe).
- Suurem salvestusmaht, kombineerides paljude väiksemate ketaste ruumi.
- Jõudluse parandamine — lugemis- ja kirjutusoperatsioonide paralleelne jaotamine.
- Paindlikkus — mõned RAID-süsteemid võimaldavad kettaid lisada või asendada ilma süsteemi seisatamata.
Kõiki neid eesmärke ei ole võimalik korraga maksimaalselt saavutada — valik sõltub eelistustest (turvalisus, jõudlus, hind).
Ajalooline taust
Enamik RAID-i käsitlevaid töid tugineb 1988. aastal koostatud klassifikatsioonile ja artiklitele, mis formaliseerisid erinevad RAID-tasemed ja -meetodid. Alates selle tehnoloogia laialdasemast levikust on RAID-süsteemide ehitamise hind langenud ja paljud kodused ning väiksemad seadmed toetavad tänu sellele RAID-funktsioone — näiteks meediakeskused muusika või filmide salvestamiseks.
RAID-süsteemides kasutatavad põhimõisted
- Caching — vahemälu kasutatakse lugemiste kiirendamiseks ja mõnikord kirjutuste viivitamiseks (write-back). Vahemälu kasutamine nõuab hoolt, sest toitekatkestuse või kontrolleri vea korral võivad vahemällu jäänud andmed kaduda.
- Peegeldamine — andmete kopeerimine täpselt mitmele kettale (näiteks RAID 1). Tagab kiire lugemise mitmelt kettalt ja hea kaitse ühe ketta rikke vastu, kuid salvestusruum on poolitatud (kaks 1 TB ketast annavad 1 TB kasutatavat ruumi).
- Triibustamine (striping) — andmete jaotamine tükkideks (stripes) ja kirjutamine mitmele kettale, et suurendada jõudlust (näiteks RAID 0).
- Pariteet — aritmeetiline kontrollsumma (näiteks XOR) kasutatakse vigade tuvastamiseks ja taastamiseks (nt RAID 5, RAID 6). Pariteet annab kaitse ühe või kahe ketta rikke vastu (sõltuvalt skeemist) ning kulutab osa salvestusruumist.
- Hot spare — varuketas, mis on süsteemis olemas ja võetakse automaatselt kasutusele, kui mõni tootlik ketas rikki läheb; see lühendab vigade avastamisest taastamiseni kuluvat aega.
- Triibu suurus — määrab, kui suured on üksikud andmetükid, mida triibustamisel kettade vahel jagatakse. Sobiva stripe size valik sõltub töökoormuse tüübist (suured järjestikulised failid vs palju väikseid IO-operatsioone).
- JBOD (Just a Bunch Of Disks) — ketaste loogiline ühendamine ilma RAID-i pariteedi või peegelduseta; näitab kettaid lihtsalt järjestusena või eraldi loogilistena.
- Kettakloonimine — ühe ketta täpne koopiategija (kasulik migratsiooniks või varundamiseks).
Põhitõed: levinumad RAID-tasemed
Siin on lühike ülevaade kõige enam kasutatavatest tasemetest:
- RAID 0 — triibustamine ilma pariteedi või peegeldamiseta. Suurendab jõudlust ja salvestusmahtu (kõik ketaste ruum on kasutatav), kuid ei paku andmete kadumise eest kaitset; ühe ketta rike põhjustab kogu loogilise draivi andmete kadu.
- RAID 1 — täispeegeldus (näiteks kaks ketast, mille vahel on identne koopia). Pakub head kaitset ühe ketta rikke vastu ja lihtsat taastamist; salvestusruum on 1/N (kus N on peegeldavate ketaste arv).
- RAID 5 — triibustamine ja jaotatud pariteet (vaja vähemalt 3 ketast). Suudab taluda ühe ketta riket ilma andmete kaotuseta; pariteedibittide tõttu on osa ruumist eraldatud vigade taastamiseks. Kirjutuste jõudlus võib olla pariteedi arvutamise tõttu veidi väiksem.
- RAID 6 — sarnane RAID 5-le, kuid kasutab topeltpariteeti ja suudab taluda kahe ketta korraga riket (vaja vähemalt 4 ketast). Suurem töökindlus suurte ketastega süsteemides, kuid kirjutuste overhead on suurem kui RAID 5-l.
Vähem levinud ja erilahendused
On olemas mitmeid vähem standardseid või patenteeritud RAID-variantseid (RAID-DP, RAID Z, Intel Matrix RAID, erinevad laiendatud pariteedi skeemid jmt), mida kasutatakse vastavalt tootja või failisüsteemi vajadustele. Linuxi MD-raid ja ZFS (RAID-Z) pakuvad tarkvaralisi võimalusi, millel on oma eelised, näiteks paremad kontrolle vigade vältimiseks.
Riistvara vs tarkvara RAID
Tarkvara RAID (näiteks Linux MD) realiseerib RAID-funktsionaalsuse opsüsteemi tasandil ilma eraldi kontrolleri riistvarata. See on sageli odavam, paindlikum ja lihtsam remontida, kuid võib mõjutada CPU koormust.
Riistvaraline RAID kasutab spetsiaalset kontrollerit, mis võib pakkuda kiirendatud pariteearvutusi, vahemälu ja paremat jõudlust, eriti kirjetöös. Riistvarakontrolleri rike võib aga muuta andmete taastamise keerulisemaks, kui kasutusel on väljaõppe- või patenteeritud metaandmete vormingud.
RAID-i tegemine ja haldamine
RAID-i ülesseadmisel tuleb arvestada järgmisi samme ja kaalutlusi:
- Kaalu töökoormust: kas rohkem lugemist, kirjutamist, järjestikulist või juhuslikku IO-d — see määrab sobiva taseme ja triibu suuruse.
- Vali sobivad kettad (eelistatavalt samasuguse mudeli/firmwar'iga, sest segasisaldus võib põhjustada ootamatuid käitumisi).
- Planeeri varundus. RAID ei asenda regulaarset varundamist välisele asukohale.
- Seadista monitooring (SMART, kontrolleri logid, häireteated) ja hot spare’id, kui võimalik.
- Testi taastamist ja kuhu kaua võtab taastumine aega — suuremate ketaste puhul võib rekonstrueerimine kesta tunde või päevi ning selle ajal on süsteem haavatav lisavigade suhtes.
RAID-iga seotud riskid ja piirangud
- Taastamisaeg (rebuild time) — suured ketad ja palju andmeid pikendavad aega, mil kettaid taastatakse; sel ajal on süsteem suurema riskiga (eriti RAID 5 puhul, kus teise ketta rike võib viia andmete kadumiseni).
- Seotud tõrked — ketaste mudelid võivad jagada vigu (nt sama tootmispartii probleemid); sellistel juhtudel võib mitu ketast rikneda üheaegselt.
- Parandamatud lugemisvead (UBER) — lugemisvigu (bit errors) võib tekkida taastamise käigus, mis takistab rekonstrueerimist. RAID ei garanteeri kaitset kõigi selliste vigade vastu.
- Kirjutamise vahemälu usaldusväärsus — write-back vahemälu suurendab jõudlust, kuid nõuab, et vahemälu kaitstaks (akutoite, kapoti või kontrolleri välise püsiva mälu abil), vastasel juhul võivad vahemällu jäänud andmed kaduda toitekärbe korral.
- Aatomsus ja failisüsteemi kooskõla — RAID ei taga andmete loogilist terviklikkust üle failisüsteemi (nt transaktsionaalsus). Failisüsteemid ja andmebaasid peavad samuti rakendama sobivaid meetmeid (journaling, snapshots) kriitiliste andmete kaitsmiseks.
- Seadmete ühilduvus — riistvarakontrolleri kasutamisel tuleb olla ettevaatlik, et kontrolleri ja ketaste metaandmed oleksid juhitavad ja et andmeid saaks vajadusel üle kanda teisele kontrollerile.
Mida RAID suudab ja mida mitte
MIDA RAID suudab teha:
- Pakkuda ketta rikete vastu teatud kaitset (sõltuvalt tasemest).
- Parandada lugemis- ja/või kirjutusjõudlust (sõltuvalt triibustamisest ja kontrolleri võimest).
- Anda suurema loogilise salvestusruumi mitmete ketaste ühendamisel.
MIDA RAID EI SAA teha:
- Ei asenda varundamist — kasutaja viga, pahavara või failisüsteemi korruptsioon võivad ikkagi kogu RAID-i korrumpeerida.
- Ei garanteeri kaitset kõigi vigade eest (nt topeltketta rike RAID 5 puhul, lugemisvead taastumise ajal jne).
- Ei lahenda logilist andmekadu või rakenduse tasandi vigu.
Parimad praktikad
- Tee regulaarseid varukoopiaid ja testi taastamise protseduure.
- Kasuta sobivaid RAID-tasemeid vastavalt vajadusele: kriitiliste andmete jaoks eelistada RAID 1 või RAID 6/RAID-DP; jõudluse huvides võib kaaluda RAID 10 (peegeldamine + triibustamine).
- Vali ühe tootja kettad ja sama seeria mudelid koos ajakohase firmware’iga, kui võimalik.
- Seadista monitooring ja häired (SMART, kontrolleriloggid) ning planeeri hot-spare’id.
- Arvesta taastamise ajaga ning kontrolli UBER ja MDT (mean time to data loss) statistikad.
Näide
Võtame lihtsa näite: väikese ettevõtte failiserver, kus on 4 × 2 TB ketast. Valides RAID 5 saab kasutada ligikaudu 6 TB (3 × 2 TB andmeid + 1 × 2 TB pariteediks), talutakse ühe ketta riket. Kui valite RAID 6, saab kasutada umbes 4 TB (2 × 2 TB andmeid + 2 × 2 TB topeltpariteediks) ning talutakse kuni kahe ketta korraga riket. RAID 10 (kaks peeglit, triibustatult) annaks 4 TB kasutusruumi (2 × 2 TB), hea jõudluse ja ühe või mitme ketta vea taluvuse sõltuvalt sellest, millised kettaid rikutakse.
Kokkuvõte
RAID on võimas tööriist salvestusruumi jõudluse, töökindluse ja skaleeritavuse parandamiseks, kuid sellega kaasnevad piirangud ja riskid. Õige RAID-taseme valik ning varukoopiate ja monitooringu kasutuselevõtt on hädavajalikud, et kaitsta olulisi andmeid reaalsetes olukordades. Enne RAID-i kasutuselevõttu mõelge oma prioriteetidele (turvalisus vs jõudlus vs hind) ja planeerige taastamise protsessid hoolikalt.
Enamik RAIDi käsitlevatest töödest põhineb 1988. aastal kirjutatud dokumendil.
Ettevõtted on kasutanud RAID-süsteeme oma andmete salvestamiseks alates selle tehnoloogia loomisest. RAID-süsteeme saab teha erinevatel viisidel. Alates RAID-süsteemi avastamisest on RAID-süsteemi ehitamise hind palju langenud. Sel põhjusel on isegi mõnedel kodus kasutatavatel arvutitel ja seadmetel RAID-funktsioonid. Selliseid süsteeme saab kasutada näiteks muusika või filmide salvestamiseks.














