Blogs I CSN Academy

Tiered Storage of toch all flash?

Geschreven door Manuel Speksnijder | 14-nov-2014 8:00:00

Bij het aanschaffen van een storage array is er altijd de afweging tussen kosten, capaciteit en performance. Midline SAS (MDL-SAS of SATA) drives leveren veel capaciteit voor weinig geld, maar leveren nagenoeg geen performance. Solid state (SSD of flash) drives leveren veel performance maar capaciteit kost veel geld. Veel bedrijven kiezen voor het gemiddelde, één tier SAS drives. Deze leveren redelijke performance, met een redelijke capaciteit en tegen een acceptabele prijs.

Automated Storage Tiering

Indien de totale capaciteit van de omgeving in de tientallen zo niet honderden terabytes loopt, kan het financieel aantrekkelijk zijn om automated storage tiering (AST) toe te passen. Bij AST zijn er twee of drie verschillende typen disken (storage lagen) in één array. Het array kiest zelf welk stuk van de data op welke storagelaag hoort. Indien je hierdoor de minder frequent gebruikte data op de goedkope MDL-SAS drives plaatst, kan dit een grote besparing opleveren.

Correcte sizing

Er zit echter een grote kanttekening aan deze oplossing en dat is het risico op verkeerde sizing. Stel dat 80% van de storage oplossing uit de trage MDL-SAS drives bestaat maar dat slechts 60% van de data statisch is. Dit zorgt er voor dat het array telkens de data moet schuiven tussen snelle en langzame tiers; dit komt de performance maar ook de voorspelbaarheid niet ten goede. Het kan immers zo zijn dat op maandag bepaalde data van snelle disken komt, maar op vrijdag diezelfde data van de trage disken komt. Voor het correct sizen van een getierde storage omgeving is het dus van belang om eerst exact te meten wat het gedrag van de data is.

Deduplicatie

Deduplicatie is een technologie die al heel lang bestaat, binnen de storage wereld. Het zorgt er voor dat gelijke data blokken maar één keer opgeslagen worden op disk. Deze technologie wordt met name in back-up to disk omgevingen veel toegepast. Dagelijks worden bij back-up namelijk grote hoeveelheden dezelfde data opgeslagen en deze worden dan uiteindelijk maar één keer op disk gezet. Het nadeel van deduplicatie is dat het ten koste gaat van performance. Dit is de reden dat het tot voor kort niet zoveel in primaire storage arrays werd toegepast. Want heb je ineens minder disken nodig voor de capaciteit dan heb je daarmee meer disken nodig voor de performance en dat lost financieel niets op.

All-flash

Indien we een storage array alleen voorzien van flash drives dan hebben we meestal meer dan genoeg performance (vaak zelfs veel te veel). Het is echter te kostbaar om alle (ook statische) data zomaar op deze dure disken te zetten.

Overdaad aan performance

Zodra we nu die overdaad aan performance gebruiken om de data te dedupliceren en te compressen wordt het interessant! We kunnen de hoeveelheid netto capaciteit die we nodig hebben aanzienlijk verkleinen. Veel van onze primaire data bevat namelijk dubbele blokken; denk hierbij aan al die virtuele machines die gebaseerd zijn op dezelfde template. Zijn we ook nog in staat om echt statische data weg te archiveren naar een andere storage oplossing met data management software, dan wordt het kostenplaatje nog beter. Met deze samenvoeging van technologieën kunnen we een storage array maken die veel performance levert, maar ook prijstechnisch zeer interessant blijft!