Big Data, Big fuzz

Cloud computing. Virtualisatie. Big data. Of het hypes zijn of niet: het zijn in ieder geval woorden, begrippen en technologieën die de laatste tijd volop aandacht hebben gekregen. Ook over big data hoor je veel, maar een groot aantal concrete projecten en oplossingen is er nog niet.

Tegenwoordig is een nieuwe server vaker een virtuele server dan een fysieke. Virtualisatie is de standaard geworden. Met cloud computing gaat het ook goed. Cloud-based servers, cloud-storage of cloud-based back-ups zijn misschien nog niet de standaard, maar voorlopig vormen cloud-based oplossingen een sterk groeiende markt.

Maar hoe komt het dat er nog niet veel concrete toepassingen zijn voor dat andere veelbesproken begrip: big data?

Definitie

Laten we eerst kijken naar de pure definitie van ‘big data’. De Engelse Wikipedia geeft er een die goed hanteerbaar is: “In information technology, big data is a collection of data sets so large and complex that it becomes difficult to process using on-hand database management tools or traditional data processing applications. The challenges include capture, curation, storage, search, sharing, analysis and visualization.”

Vrij vertaald: big data is een collectie van datasets, zó groot en complex dat traditionele applicaties er niet meer effectief mee om kunnen gaan. Want des te meer data, des te moeilijker te verwerken. En bij big data gaat het om écht heel veel data.

Vooral de genoemde uitdagingen zijn interessant:

  • het verzamelen van die grote hoeveelheden data (met welke tooling?);
  • deze conserveren (zodat ze hergebruikt kunnen worden? Voorkomen van het Diederik Stapel-effect?);
  • de data opslaan (op steeds grotere en duurdere opslagsystemen);
  • die grote hoeveelheden data zinnig delen (hoe vind je de andere geïnteresseerden en wát deel je?);
  • erin zoeken (zonder dat je uren zit te wachten op resultaten of duizenden hits moet doorploeteren om te vinden wat je precies zocht);
  • de data analyseren (met systemen die zoveel load aankunnen - en hoe lang moet je dáár dan wel niet op wachten?);
  • en ten slotte al die analyses visualiseren, zonder te vervallen in onoverzichtelijke, ellenlange tabellen of lijngrafieken.

YottaBytes

Ondertussen is de vraag: om hoeveel data gaat het bij big data? Zijn dat TeraBytes? PetaBytes? Of YottaBytes? En hoeveel bedrijven zijn er eigenlijk in Nederland die echt met big data-problemen kampen? Misschien is Nederland grotendeels te klein voor big data.

Ook al telt een dataomgeving geen YottaBytes, de problemen die rondom die data bestaan hoeven niet minder te zijn. Dat zien we bij al onze klanten: ook al hebben ze geen opslagsystemen van PetaBytes groot en ook al hebben ze niet allemaal ettelijke computerracks vol met servers, ze hebben een groeiende hoeveelheid data die niet meer goed met traditionele applicaties te beheren is.

Omdat het op de gangbare manier niet meer ging, zijn een heel aantal oplossingen ontstaan. Denk aan de optie om datavolumes dynamisch te vergroten, omdat ze anders steeds weer vollopen. Of aan limieten aan een name space van 16 PetaBytes, versus file limits van vier GigaBytes. En niet te vergeten de oplossingen voor back-up- en restore-perikelen, zoals snapshotting, VAAI en ODX of Changed Block Tracking.

Dus: ook al is big data voor veel (Nederlandse) bedrijven helemaal niet zo ‘big’: de uitdagingen zijn er niet minder om.

Hoog tempo

Wat in ieder geval vaststaat, is het volgende: opslagsystemen worden telkens omvangrijker en computers worden telkens sneller en krachtiger. Het fenomeen big data bestaat, omdat het tempo waarin de wereld erin slaagt data te genereren blijkbaar hoger is dan het tempo waarin de IT-wereld erin slaagt om die data op te slaan en te verwerken. Voor zowel de creatie als voor de opslag van big data geldt: we moeten er vooral voor zorgen dat we er niet in verdrinken.

Wat kan NET Services voor u doen?

Als u Big Data heeft die voldoet aan bovenstaande definitie dan willen wij u natuurlijk graag helpen met het selecteren van een passende Big Data oplossing. Maar ook als u (nog) geen echte Big Data heeft, maar wel uitdagingen rondom beheer en dergelijke, dan kunnen wij u ook goed helpen. Bij voorbeeld met onze diensten rondom data-analyse of concrete Data Management oplossingen.

Meer informatie

Wilt u meer weten over onze diensten en/of oplossingen? Stuur dan een e-mail naar info@csngroep.nl of bel 033 434 50 35. Of klik hier voor onze contactpagina en het contactformulier>>.