Go to Top

Make it big! Data recovery voor grote data storage systemen

Data storage systemen zijn langzamerhand een eigen uniek en complex vakgebied gaan vormen. Een data opslag systeem kan voor de een iets anders betekenen dan voor de ander, dus hoe moeten we deze systemen dan definiëren? Een data storage systeem is de hardware waar de data is opgeslagen.

Dit kan bijvoorbeeld de server zijn van een klein bedrijf met een kantoor van tien of minder gebruikers. De harde schijven in die server waar de gebruikersinformatie is opgeslagen vormen het opslagsysteem. Bij grote ondernemingen is het storagesysteem vaak een grote SAN-systeemkast vol met harde schijven zijn die zo is ingedeeld dat er sprake is van redundantie en optimale prestaties.

De altijd veranderende technologie achter het opslagsysteem

De laatste jaren staan zowel SAN- als NAS-systemen voor een hoge betrouwbaarheid, maar wat is het verschil tussen de twee? Het grote verschil is dat een NAS-systeem direct gekoppeld is aan een TCP/IP netwerk, terwijl een SAN een opslagnetwerk is dat oorspronkelijk met SCSI Fibre Channel bekabeling servers aan schijven koppelt.

  • SAN-systemen (Storage Area Network) kunnen bestaan uit enorme systeemkasten of racks waarbij er honderden harde schijven in een rack kunnen zitten! Deze grote 50+ TB-storage systemen doen meer dan alleen het opstarten van honderden schijven. Deze systemen zijn ongelooflijk krachtige datawarehouses met veelzijdige softwareprogramma’s om meerdere disk arrays en verscheidene opslagconfiguraties te beheren en het systeem te allen tijde te controleren.
  • NAS-systemen (Network Attached Storage) zijn autonome apparaten met eigen besturingssysteem en bestandssysteem die hun aangesloten harde schijven beheren. De apparaten functioneren als bestandsservers en zijn er in verschillende soorten en maten om aan de meeste behoeften te kunnen voldoen.

Grootschalige dataopslag is niet altijd even haalbaar geweest voor kleine ondernemingen. SAN-systemen gebaseerd op SATA (Serial Advanced Technology Attachment) zijn een kosteneffectieve manier geworden om grote hoeveelheden data opslag te verstrekken. Deze units bieden vaak ook virtuele back-upsystemen voor tapes, waarbij RAID-array’s worden gezien als taperecorders waardoor tapes zelf overbodig worden.

Andere opslagtechnieken, DAS (Direct Attached Storage), Near-Line Storage (data op aangesloten verwisselbare media zoals tape library of optical jukebox) ), en CAS (content-addressed storage ). zijn allemaal methoden om data beschikbaar te maken en houden. De architecten achter verschillende manieren van dataopslag weten dat alleen een back-up niet goed genoeg is.

Back up supersnel onvolledig

In het informatierijke tijdperk van nu voldoet een nachtelijke incremental back-up of wekelijkse full back-up niet meer, deze raakt na een paar uur of zelfs al na een paar minuten verouderd.

In een groot datawarehouse is het back-uppen van almaar veranderende gegevens geen optie. De enige oplossing voor zulke gigantische systemen is het spiegelen van het opslagsysteem: identieke servers met precies dezelfde opslagruimte.

3 overwegingen bij het kiezen van een systeem

De omgeving waarin het storage systeem gaat functioneren moet zorgvuldig geanalyseerd worden. Natuurlijk willen zowel gebruikers als de storage systeem beheerders helemaal geen problemen tegenkomen, maar de harde werkelijkheid is dat er iedere dag dataverlies voorkomt, ondanks het invoeren van allerlei risico beperkende maatregelen. Veelal door toedoen van de mens.

Denk bij het bepalen van je opslagbehoeften aan deze dingen:

  • Hoelang kan je maximaal zonder data? Hoelang kunnen jij of je klanten zonder gegevens? Dit helpt bij het bepalen van de prestatie-eisen voor de apparatuur.
  • Kwaliteit van herstelde gegevens. Is het van belang dat oorspronkelijke data hersteld worden of voldoen oudere geback-upte gegevens? Dit is bepalend voor het gebruikte back-upplan.
  • Hoeveel data zullen jij en je klanten archiveren? Bij het herstellen van grote hoeveelheden gegevens zal het datatransport door een netwerk lang duren. Bij DAS-configuraties hangt de duur van dataherstel af van de apparatuur en de I/O-prestaties van de hardware.

Unieke plannen voor databescherming

Fabrikanten van opslagsystemen streven naar unieke methodes om grote hoeveelheden data te processen en tegelijkertijd redundantie om dataverlies te voorkomen  in geval van storingen.

Sommige grote SAN systemen hebben een complex systeem/ algoritme om data op block-level te organiseren, een eigen soort low-level filesysteem bovenop de RAID laag. Andere SAN’s hebben een intern logboek van transacties op blockniveau, zodat de controller van de SAN alle overschrijvingen op blocklevel naar de individuele schijven kan traceren. Dankzij dit logboek kan een SAN data herstellen bij onverwachte stroomstoringen of shutdowns.

Hoe kan beschikbaarheid verbeterd worden?

Sommige computerwetenschappers gespecialiseerd op het gebied van opslagsystemen hebben voorgesteld meer intelligentie toe te voegen aan de RAID-array-controller om deze bewust te maken van het bestandssysteem. Deze techniek zou meer mogelijkheden tot data recovery bieden bij een onverwachte dataramp, met als doel de array meer zelfherstellend te maken.

Idealiter een transparant bestandssysteem op  een heterogeen opslagsysteem waarbij verscheidene computers toegang hebben tot informatie zonder afhankelijk te zijn van het bestandssysteem van een specifiek (opslag)systeem. In bedrijven met meerdere hardware- en systeemplatformen zal een transparant bestandssysteem toegang tot data geven ongeacht door welk systeem de gegevens geschreven zijn.

Andere informatici benaderen het redundantieprobleem van een array op een andere manier. De RAID-methode wordt in veel systemen gebruikt, maar computerwetenschappers en –ingenieurs zoeken naar nieuwe manieren om data beter te beschermen in geval van defecten en storingen. Deze RAID-ontwikkeling streeft naar databescherming en redundantie zonder het inleveren van prestatievermogen.

Misschien heb je geen terabytes of petabytes aan gegevens, maar als er dataverlies lijkt te zijn, is elk bestand cruciaal.

Omgaan met storage systeem storingen

Rampen kun je niet altijd voorkomen, maar je kunt er wel voor zorgen dat de onderbreking in de service naar je klanten toe minimaal blijft.

Er zijn veel manieren om de invloed van systeemfouten te verminderen of zelfs te elimineren. Je kunt bijvoorbeeld redundantie toevoegen aan primaire opslagsystemen. Sommige methodes kunnen duur zijn en alleen voor grote bedrijven betaalbaar, zoals dubbele opslagsystemen of identieke servers, ook wel mirror sites genoemd. Als extra beveiliging voor je data kun je inzetten op uitgebreide back-upprocessen of snapshots van bestandssystemen waarbij er altijd een restore naar een checkpoint kan worden uitgevoerd.

Uit het verleden blijkt dat er zich meestal meerdere fouten voordoen wanneer een organisatie te maken krijgt met een dataverlies. Daarom is het kortzichtig om op slechts een recoveryprotocol te vertrouwen. Een succesvol georganiseerd dataopslagsysteem heeft meerdere wegen naar data en disaster recovery.

Wij hebben duizenden schrikverhalen over bij storage systeem storingen die uitmondden in een complete dataramp. In een poging een systeem te herstellen kunnen sommige acties data voorgoed corrupt maken.

4 manieren om dataverlies na een storing te beperken

Systeembeheerders kunnen verschillende dingen doen om  dataverlies, na een storing van het storage systeem, tot een minimum te beperken:

  • Offline opslagsysteem: forceer een array of schijf niet terug online wanneer de controller deze uitgeschakeld heeft. Een array of schijf terug online zetten kan het volume blootstellen aan een corrupt bestandssysteem.
  • Een defecte schijf rebuilden: bij het rebuilden van een enkele defecte schijf is het belangrijk de controller het proces af te laten maken. Gaat er tijdens dit proces een tweede schijf kapot of offline, breek het proces af en roep een professionele datarecovery-service in. Het vervangen van een tweede defecte schijf tijdens een RAID rebuild zal de data van de andere schijven wijzigen.
  • Opslagsysteemarchitectuur: zorg ervoor dat je de opbouw van je opslagsysteem zorgvuldig plant. We zijn veel gevallen tegengekomen waarbij meerdere configuraties in één array gebruikt werden, bijv. drie RAID-5-arrays (elk met zes schijven) striped in een RAID-0-configuratie. Zorg altijd voor een eenvoudige opslagconfiguratie en documenteer ieder onderdeel.
  • Tijdens een probleem: escaleert de situatie tot zover dat je de technische hulp van de OEM (Original Equipment Manufacturer) nodig hebt, vraag dan altijd of de data integriteit in gevaar is of dat de gegevens beschadigd kunnen raken. Is het antwoord hierop dat de data in gevaar zou kunnen zijn, stop waar je mee bezig bent en schakel een professionele datarecovery-dienst in.

 

 

 

, , , , , ,