8x data duurzaam beheren: Belangrijke overwegingen voor opslag en -verwerking zijn thema’s van Data Expo – Op de komende Data Expo gaat er weer veel aandacht uit naar duurzaamheid. In de Jaarbeurs Utrecht kun je op woensdag 11 en donderdag 12 september essentiële kennis opdoen, technologische mogelijkheden verkennen en nuttige contacten leggen om nieuwe stappen voorwaarts te zetten.
Rond het proces van digitale transformatie hangt een prettige zweem van duurzaamheid, naast betere efficiëntie natuurlijk. Fysieke processen worden digitaal, efficiënt ‘ergens in de cloud’ afgehandeld. Daardoor lijken ze minder energie en andere hulpstoffen te kosten. Door digitaal samen te werken, hoeft er ook minder te worden gereisd. Die argumenten kunnen kloppen, maar dan komt er wel wat bij kijken. We zetten de belangrijkste aandachtspunten voor duurzame data op een rij.
De term ‘duurzame data’ klinkt lekker compact, maar wat zijn duurzame data eigenlijk? Voor het gemak wordt onder de term een scala aan onderwerpen samengebracht die eigenlijk niet veel met elkaar te maken hebben. Ze variëren van energie-efficiëntie tot het zorgvuldig omgaan met privacygevoelige gegevens. Toch zijn het stuk voor stuk onderwerpen die van belang zijn om te voorkomen dat het proces van digitalisering een averechts effect krijgt.
Opslag en -verwerking
Een migratie naar cloudprocessen lijkt een duurzame stap vanuit milieuoogpunt. Het digitaliseren van processen en het overhevelen van de dataverwerking naar de cloud, zorgt dat bijvoorbeeld het energieverbruik van de processen buiten zicht raakt. Maar voor al die dataopslag en -verwerking zijn datacentra nodig en die staan bekend om hun enorme energie- en waterverbruik. Veel data-exploitanten streven er echter naar zo milieubewust mogelijk te werken. Ze maken gebruik van hernieuwbare energie en energiezuinige hardware. Door hun schaalgrootte zijn ze hoe dan ook efficiënter dan de klassieke datacenters ‘on premises’ bij bedrijven zelf of ‘het serverhok’ op kantoor. Maar niet alle datacentra volgen dezelfde koers bij het inrichten van duurzame processen. Tijdens het selecteren van een cloudprovider is het daarom belangrijk kritische vragen te stellen over de milieudoelstellingen en de toekomstplannen op dit gebied.
Hardware
Gegevens worden verwerkt op servers en die bepalen in belangrijke mate het energieverbruik in het proces. Ook de koeling in de serverruimte is een energieslurpend proces. Hardwareproducenten maken steeds kleinere en snellere componenten die daardoor – relatief – steeds minder energie verbruiken. Deze vervangen de oude apparatuur als het goed is. Maar wat gebeurt daarmee? De mate waarin apparatuur gerecycled kan worden, verschilt nogal per producent. Ook een onderwerp van gesprek dus met leveranciers.
Groene energie
Al worden nog zulke goede, besparende maatregelen gebruikt, toch is er energie nodig. Die kan maar het best uit hernieuwbare bronnen komen, als het streven naar duurzame data een hoge prioriteit heeft. Het gebruik van zonnepanelen en windenergie helpt de ecologische voetafdruk te verkleinen.
Datastromen
De manier waarop dataprocessen zijn ingericht kan veel gevolgen hebben voor de hoeveelheid energie die ervoor nodig is. Vooral het opvragen en wegschrijven van gegevens is verhoudingsgewijs een energieslurpend proces. Bij het programmeren van software kan het dus uitmaken, hoe vaak gegevens in het werkgeheugen moeten worden geladen. Ook de manier waarop processen aan elkaar worden gekoppeld, kan effect hebben op het energiegebruik van het geheel. Vraag een leverancier van software of een cloudprovider dus tijdens het selectieproces hoe er aandacht gegeven wordt aan het inrichten van duurzame datastromen.
Data-deduplicatie
Hoe meer gegevens worden opgeslagen, hoe groter de energiebehoefte. Het is daarom niet verstandig meer data op te slaan dan nodig is. In veel databestanden komen gegevens dubbel of zelfs in veelvoud voor. Er bestaat software die de gegevens voordat deze de opslag ingaan, analyseert op dubbeling. De kopieën worden eruit gehaald en vervangen door een verwijzing. Bij het terugroepen van de data uit de opslag vindt het omgekeerde proces plaats, zodat applicaties toch de kopieën vinden op de plek waar ze deze verwachten. Er bestaan nogal wat verschillen in de efficiëntie en nauwkeurigheid van deduplicatiesoftware. Punt van aandacht dus bij de selectie.
Data-opschoning
Het wissen van gegevens die niet meer nodig zijn, is ook een manier om duurzaam met data om te gaan. Veel bedrijven, maar ook particulieren, hebben de neiging gegevens te bewaren ‘omdat ze misschien nog wel eens van pas kunnen komen’. De Algemene Verordening Gegevensbescherming (AVG) stelt al wettelijke eisen aan de maximale termijn waarop persoonsgegevens bewaard mogen blijven. Maar het is verstandig software te gebruiken die aan alle data een bewaartermijn koppelt en deze na afloop daarvan automatisch verwijdert.
Datakwaliteit
Datalakes vol met gegevens die eigenlijk niet bij elkaar passen, zijn eigenlijk waardeloos. Het hergebruik van data is dan ook afhankelijk van een goede bewaking van de kwaliteit van de gegevens die in de opslag gaan. Bij veel digitale transitieprojecten is het rationaliseren en converteren van de data, het allergrootste pijnpunt.
Governance
Toezicht op het gebruik en beheer van data heeft minstens zoveel effect op de duurzaamheid als de technische voorwaarden voor duurzame data. Hoe is het verantwoording voor het gebruik en beheer van data geregeld? Is er voldoende aandacht voor de privacy? En hoe is de ethische omgang met data geborgd? Governance is niet een eenmalige exercitie maar een onderwerp dat permanent aandacht vergt omdat de omstandigheden in de maatschappij, de wetgeving en de techniek aan verandering onderhevig zijn.
Een bezoek aan Data Expo helpt je om antwoorden te vinden op al jouw datavraagstukken. Inschrijven als bezoeker is kosteloos en kan hier.
ITchannelPRO en CloudWorks zijn mediapartner van Data Expo