Nieuws

Big is beautiful

Een steeds vaker terugkerende term bij leveranciers van storageproducten en software voor BI en analyse is 'big data'.

Een steeds vaker terugkerende term bij leveranciers van storageproducten en software voor BI en analyse is ‘big data’. Over wat ‘big’ precies betekent bestaat weliswaar onenigheid, maar iedereen is het over twee dingen eens: big data hebben geweldige mogelijkheden, maar ze maken het leven van de IT-beheerder zelden eenvoudiger.

Bij big data denken veel mensen in eerste instantie aan beelden of videobestanden van enkele megabytes of meer. Maar het hoeft niet meteen dat soort bestanden te zijn. Typische voorbeelden van big data zijn de weerkundige gegevens die dagelijks worden verzameld om analyse en onderzoek op te verrichten. En er zitten ook gegevens bij die op zich misschien minder veelzeggend zijn, maar gecombineerd soms tot diepe inzichten kunnen leiden. Gegevens verzameld door RFID-lezers bijvoorbeeld, of de input van smart meters, de meters die het energieverbruik in detail meten en rapporteren en zo nodig ook kunnen ingrijpen.

Big business

Dat data tegelijk groter worden en toenemen, spreekt voor zich. Seismologische beelden, röntgenfoto’s, satellietfoto’s, schaalmodellen, genetische informatie, audio, video’s en films en last but not least opslag op bedrijfssystemen: ze dragen allemaal bij aan de huidige data-explosie. Een doorsnee bedrijf in de VS met minstens duizend werknemers beschikt vandaag gemiddeld over 200 terabytes aan opgeslagen digitale data, het dubbele van wat retailgigant Wal-Mart zo’n tien jaar geleden bewaarde.

Volgens Joe Tucci, CEO van EMC, neemt het digitale universum toe van 1,2 zettabyte vorig jaar, ofwel 1.800 biljard gigabyte, naar 35 zettabyte in 2020. “Al is er intussen een mentale shift aan de gang: van het opslaan van al die data naar de verwerking en de analyse ervan”, aldus Tucci. “Van een noodzakelijke kostenpost naar een investering.” Big data staat in veel gevallen namelijk gelijk aan big opportunity. In de retailsector kan de juiste interpretatie van big data leiden tot een margeverbetering van maar liefst 60 procent, berekende McKinsey onlangs.

 

Big data is niet alleen een opportuniteit, maar in veel gevallen ook een onontgonnen terrein.
De grootste gemene deler van de definities rond big data heeft het namelijk over grote gegevenssets die niet zo goed passen in de traditionele software die zich om gegevens bekommert: de relationele databases, de BI-software en de traditionele storage- en/of virtualisatiesoftware. Die kunnen deze grote gegevensverzamelingen ofwel helemaal niet verwerken, of doen er onfatsoenlijk lang over. Over de hierboven vermelde smart meters heeft Jim Goodnight, CEO van SAS Institute, zich ooit laten ontvallen: “Als elk huishouden zo’n smart meter had, zou er op aarde niet voldoende opslagruimte zijn om alle hiermee gegenereerde gegevens op te slaan.”

Big chaos

De uitdaging met big data heeft overigens niet alleen met de grootte van de gegevenssets te maken, of met het steeds stijgend aantal gegevens dat elke organisatie moet opslaan, vervolledigt analistenbureau Gartner, maar ook met de diversiteit van de gegevens, en met de snelheid waarmee enerzijds de hoeveelheid informatie groeit en anderzijds de informatie kan worden verwerkt. Wie een van deze aspecten verwaarloost, dreigt vroeg of laat in een ‘big data chaos’ terecht te komen, waarschuwt Gartner nog.

Maar bewustwording alleen volstaat niet, aldus nog Mark Beyer, research vice president bij Gartner: “Zowel de huidige disciplines als de beschikbare technologie voor informatiebeheer schieten tekort als het op het verwerken van de big data aankomt.” Anders gesteld: weinig bedrijven hebben de visie of de expertise om big data correct te behandelen, en die happy few hebben beschikken wellicht niet over de geschikte technologie om hun visie te realiseren.

Cloud

Ook de leveranciers zijn zich bewust van de uitdagingen die big data met zich meebrengen, en van de tekortkomingen in hun eigen softwareaanbod om hiermee om te kunnen. Daarom heeft Teradata bijvoorbeeld Aster Data overgenomen, een klein bedrijf dat echter als zeer strategisch voor Teradata wordt omschreven, precies om die expertise in het analyseren van big data. Of, zoals Gartner het uitdrukt: in het vinden van patronen binnen die big data, waarmee de organisatie betere businessbeslissingen kan nemen.

Tegelijk lijkt Big Data ook een beetje een clash te worden tussen de traditionele BI-leveranciers enerzijds en die van pure dataopslag anderzijds. Want het beheer van data en de analyse ervan komt steeds dichter bij mekaar. Zo nam een storageleverancier als EMC onlangs Greenplum over, een specialist in het snel en efficiënt verwerken en analyseren van grote hoeveelheden data. En het lijfde ook Isilon in, dat zich richt op zogenaamde scale-out NAS of netwerkopslag, dat schaalbaar is tot meer dan 15?petabyte in één enkel bestandssysteem.
 
Of hoe de aankondigingen in big data zich geleidelijk aan zullen opvolgen. Het feit dat, helemaal in de lijn van cloud computing, grote hoeveelheden data in eigen beheer of door anderen (respectievelijk de private of public cloud) beheerd en geanalyseerd kunnen worden, geeft het fenomeen de wind in de zeilen. Of hoe big data alleen maar bigger zullen worden.
 

Gerelateerde artikelen

Volg ons

69% korting + 3 maanden gratis

69% korting + 3 maanden gratis

Bezoek NordVPN

Business