Slim gebruik van bestaande technologie kan datacenters een stuk efficiënter maken, zowel wat prijs als wat energiekost betreft.

 
Machine learning, big data analytics, AI-onderzoek: onderzoek naar baanbrekende technologieën staat op het punt de hele IT-wereld de toekomst in te katapulteren. Eén flessenhals blijft: de hardware. Om vliegensvlug veel bewerkingen uit te voeren op grote hoeveelheden data, voorzien datacenters bliksemsnel geheugen met heel snelle toegangstijden. Ze gebruiken daarvoor DRAM-technologie: de zelfde technologie waaruit ook het RAM-geheugen uit je laptop bestaat.
 
DRAM is extreem snel met een latency (of wachttijd) van enkele nanoseconden en lees- en schrijfsnelheden van meer dan 10 gigabyte per seconde. Geen enkele andere technologie kan daar aan typen. Het NAND-geheugen waaruit SSD’s bestaan heeft een traditionele latency van enkele tientallen microseconden met lees- en schrijfsnelheden die in het beste geval tegen de 3 GBps aanleunen, terwijl een harde schijf zelfs niet in dezelfde categorie meespeelt: bij een HDD spreek je over een latency van microseconden en transfersnelheden van amper enkele honderden megabytes per seconde.
 
Als je betaalt voor een krachtige server met daarin een straffe Xeon-processor die je ingewikkelde applicatie moet draaien, dan wil je niet dat al die pk’s moeten wachten totdat de nodige gegevens gevonden zijn op de harde schijf op SSD. Daar komt de DRAM dus op de proppen.
 

Dure technologie

DRAM is echter erg duur en bovendien vluchtig. De data er in moet constant vernieuwd worden en dat vraagt elektriciteit. Die honger naar stroom zorgt dan weer voor meer warmte, waardoor DRAM niet alleen zelf duurder is in gebruik maar ook de kosten voor koeling de lucht in jaagt.
 
NAND-flash is veel goedkoper, niet vluchtig, veel zuiniger (ongeveer 95 procent) en wordt veel minder warm, maar is zoals gezegd te traag. Onderzoekers van MIT bouwden nu echter een nieuw type server gebruik makend van bestaande opslagmedia die vooral vertrouwt op NAND-geheugen, maar toch niet moet onder doen voor de warmere en duurdere DRAM-variant.
 
Ze ontwikkelden een cache-server voor het NAND-geheugen die ze BlueCache noemden. Een BlueCache-node bestaat uit 1 TB aan NAND-flash (een SSD dus), bijgestaan door 8 GB aan DRAM: ongeveer evenveel als in een traditionele laptop. De DRAM houdt bij waar op de SSD gegevens precies zijn opgeslagen. 8 GB volstaat om de locatie van 1 TB aan gegevens bij te houden. Een combinatie van nodes en een slim softwarenetwerk dat de instructies van een programma om toegang te krijgen tot data optimaliseert, zorgt voor een server die in de praktijk vrijwel evengoed presteert als een DRAM-server, maar veel minder kost, veel minder energie verbruikt en minder warm wordt.
 
BlueCache is niet altijd fantastisch: de dataset moet groot genoeg zijn om het gebruik er van te rechtvaardigen. Met een relatief kleine dataset is het een beter idee om gegevens alsnog te integraal te cachen in de DRAM. Hoe groter de dataset, hoe groter de voordelen van BlueCache. Omdat de besparingen zo groot zijn, is het echter een goed idee om te kijken waar de BlueCache-architectuur past. Er zijn voldoende scenario’s waar het systeem meerwaarde biedt en terzelfdertijd voordeliger is.