Frigør potentiale med dine data

Der ligger store værdier i gode testdata, men af hensyn til privatliv og persondataforordningen har vi ofte en begrænset tilgang til data. 

Syntetiske data kan løse denne udfordring og forene persondata og databehandling. Syntetiske data er genereret fra en Machine Learning model, som er dannet på produktionsdata. De syntetiske data vil dermed opføre sig som de originale data, men uden mulighed for at identificere personlig information, da der er tale om kunstigt konstruerede data og ikke bare anonymiserede data. 

Korrekt håndtering  af persondata er imidlertid bare den første af flere fordele ved at bruge syntetiske data.

64_health_insurance1.svg

GDPR-venlig

Data er genereret af en model og kan ikke henføres til fysiske personer.

64_end_user1.svg

Tilgængeliggør data

Åbner for indsigt, som før var utilgængelige af hensyn til persondataloven.

64_report_hours.svg

Øget datakvalitet

Giver ofte bedre datagrundlag end rene produktionsdata.

64_locked_file.svg

Bedre sikkerhed

Data er ikke personhenførbare og kan anvendes uden risiko.

Sådan gør vi det

 

01

Kortlægning

Vi kortlægger eksisterende systemer og finder behovet for syntetisering.

blobid0.jpg

02

Anonymisering

Vi fjerner alle identificerbare felter. Derudover fjernes sjældne tilfælde, som kan være genkendelige og lette at henføre til en fysisk person.

03

Syntetisering

Personer i de anonymisede data (se punkt 2) kan stadig identificeres, så vi træner derfor en Machine Learning model til at genere kunstige data baseret på anonymiserede data.

04

Tilgængelighed

De syntetiske data gøres tilgængelige i de systemer, hvor de skal bruges.

05

Opdatering

Produktionsdata ændrer sig løbende, hvorved de statiske data forældes. De syntetiske data opdateres derfor dagligt i en automatiseret proces.

Use cases

 



Syntetiske testdata

Syntetiske testdata handler om at tilbyde realistiske og dækkende testdata uden at gå på kompromis med persondataloven. Brug af produktionsdata til test er problematisk, specielt efter GDPR. Det har gjort det udfordrende at få fat på gode testdata, hvilket har øget behovet for syntetiske data. 

Se hvordan vi bygget et prisvindende syntetisk testdatamiljø hos NAV



Syntetisk analyseplatform

Data, som tidligere var underlagt streng adgangskontrol, kan nu gøres tilgængelig uden at udgøre en sikkerhedsrisiko. Syntetisk Analyseplatform syntetiserer datagrundlaget på en sådan måde, at det giver samme indsigt, men uden mulighed for at identificere personer. Det betyder, at man nu kan lave analyse på data, som ellers har været utilgængelige. Teknologien baserer sig på forskning fra MIT (Synthetic Data Vault). Deres model giver en lige så god eller bedre forudsigelse på syntetiske data som ved anvendelse af produktionsdata.

Download guide:

Syntetiske data afhjælper udfordringerne med persondata

Vi gennemgår her:
  • Hvorfor det er vigtigt at have en løsning for persondata. 
  • Hvilke løsninger, der findes.
  • Vores anbefaling.
  • Og så viser vi dig, hvordan Visma Consulting har løst persondata problematikken ved at bruge syntetiske testdata


Download guide

Øget datakvalitet

Test bredere

Ved test ønsker man at teste så mange repræsentative scenarier som muligt. Det kan man ikke altid ved brug af produktionsdata. Vores løsning har en selvbetjent klient for at generere mere data, hvilket gør det mere enkelt at teste edge-cases.

Levende testmiljø

Data ændrer sig hurtigt, og testdata bliver en forbrugsvare. En kopi af produktionsdata bliver derfor hurtigt forældet. Syntetiske testdata har derimod et levende testmiljø, som opdateres realistisk hver dag. 

Bedre sikkerhed

Ikke identificerbare data

Andre løsninger for at anonymisere data, som maskeringsløsninger, er sårbare for linkage attack (forsøg på at identificere fysiske person i anonymiserede data). Denne risiko eksisterer ikke med Syntetiske Testdata, da alle data er konstruerede og kunstige. En potentiel datalækage udgør dermed ingen sikkerhedsrisiko. 

Undgå produktionsdata i testmiljøet

Adgangskontrol og sikkerhed er ofte ikke lige så god i testmiljø som i produktionsmiljøet. Hvis produktionsdata bruges i testmiljøet, er man mere sårbar for dataangreb.


Reducerede omkostninger:

Automatisering

Generering af testdata er ofte en meget manuel proces, og det bliver hurtigt tidskrævende og dyrt, når strengere regler omkring persondata øger kravene til testdata. Vi automatiserer processen ved at generere og vedligeholde testdata.

Selvbetjeningsklient

Vores selvbetjeningsklient gør det enkelt at generere yderligere testdata efter behov. I et projekt med NAV i Norge sparede dette mere end to årsværk.

Vil du gøre en forskel med digitalisering? Det vil vi også.

 

 

Gør som en lang række aktører inden for stat og styrelser. Tag en snak med os og lad os sammen finde løsninger, der fremmer væksten og velfærden.

Udfyld formularen, eller kontakt os direkte.

christian-ajslev-visma.png
Christian Ajslev Lindgren

Senior Account Manager

contact-icon-phone.svg
+45 31449272
contact-icon-email.svg
christian.lindgreen@visma.com