2017-11-07 20 views
3

Ich habe eine AWS RDS (AuroraDB) und ich möchte die Daten auf der DB maskieren. Bietet Amazon einen Dienst zur Datenmaskierung?Datenmaskierung für Daten in AWS RDS

Ich habe RDS-Verschlüsselung gesehen, aber ich suche nach Datenmaskierung, weil die Datenbank vertrauliche Daten enthält. Ich möchte also wissen, ob es einen Service für die Datenmaskierung gibt oder gibt es ein anderes Tool, mit dem die Daten maskiert und manuell in die Datenbank eingefügt werden können?

Eine Liste der Tools, die für die Datenmaskierung verwendet werden können, wird am besten angenommen, wenn sie für meinen Fall verwendet werden. Weil ich diese Daten zum Testen maskieren muss, da die Original-DB sensible Informationen wie PII (Personal Identifiable Information) enthält. Ich muss diese Daten auch an meine Kollegen weitergeben, daher halte ich die Datenmaskierung für einen wichtigen Faktor.

Danke.

Antwort

0

Sie wissen, dass Sie keine Abfragen um die "maskierten" Felder erstellen können, oder? Die RDS-Verschlüsselung erfüllt die Anforderungen an die Verschlüsselung bei Nichtbeachtung der meisten gesetzlichen Vorschriften. Sie sollten sich darauf konzentrieren, zu verhindern, dass ein böswilliger Akteur überhaupt Zugang zu Ihrer Datenbank erhält, und nicht verhindern, dass diese Werte sehen, sobald sie Zugriff erhalten haben.

Das heißt, Sie können den AWS KMS-Dienst verwenden, um bestimmte Felder zu verschlüsseln, bevor Sie sie in die Datenbank einfügen.

1

Dies ist eine fantastische Frage und ich denke, dass Ihr proaktiver Ansatz zur Sicherung des wertvollsten Vermögens Ihres Unternehmens vielen Menschen Beachtung schenken sollte, insbesondere wenn Sie die Daten mit Ihren Kollegen teilen. Es ist eine unbestreitbar gute Methode, die Angriffsflächen zu reduzieren, indem man nur die Personen sieht, die sie sehen müssen. Standard-Cyber-Sicherheit Methoden sind nicht mehr genug imo, durch zahlreiche Angriffe demonstriert/Menschen verlieren Laptops/Usbs mit sensiblen Daten auf. Wir sind schließlich nur Menschen. Da die DSGVO im Mai nächsten Jahres in Kraft treten wird, muss jedes Unternehmen mit Kunden in der EU Datenschutz durch Design demonstrieren, und Anonymisierungstechniken wie Maskierung wurden als Mittel genannt, um dies zu zeigen.

HINWEIS: Ich habe ein berechtigtes Interesse an dieser Antwort, weil ich an einem solchen Dienst arbeite, von dem Sie sprechen.

Wir haben festgestellt, dass abhängig von Ihrem genauen Anwendungsfall die Größe des Datensatzes und der Inhalt von Ihrer Maskierungsmethode abhängen. Wenn Ihr Datensatz über minimale Felder verfügt und Sie wissen, wo sich die PII befinden, können Sie Standardabfragen ausführen, um sensible Werte zu ersetzen. d.h. John -> XXXX. Wenn Sie einige menschliche Lesbarkeit beibehalten möchten, gibt es Bibliotheken wie Python's Faker, die zufällige Gebietsschema basierte PII generieren, die Sie mit Ihren sensiblen Werten ersetzen können. (PHP Faker, Perl Faker und Ruby Faker existieren auch).

HAFTUNGSAUSSCHLUSS: Gerade Maskierung garantiert keine absolute Privatsphäre. Stellen Sie sich jemanden vor, der Personen aus einem maskierten Netflix-Datensatz durch Querverweise mit zeitgestempelten IMDB-Daten oder Guardian-Reportern identifying a Judges porn preferences from masked ISP data identifiziert.

Die Maskierung wird mühsam, da Ihr Datensatz in Feldern/Tabellen zunimmt und Sie vielleicht verschiedene Zugriffsebenen für verschiedene Mitarbeiter einrichten möchten. d. h. Datenwissenschaftler erhalten leicht anonymisierte Daten, Marketing erhält Zugang zu stark anonymisierten Daten. PII in Freitextfeldern ist ärgerlich und allgemein zu verstehen, welche Daten in der Welt verfügbar sind, die Angreifer zum Querverweis verwenden könnten, ist eine große Aufgabe.

Die service i'm working on zielt darauf ab, all diese Probleme durch Automatisierung des Prozesses mit NLP-Techniken und ein gutes Verständnis von Anonymisierung Mathe zu lindern. Wir bündeln dies mit einem Web-Service und möchten den AWS-Marktplatz auf den Markt bringen.Daher würde ich gerne mehr über Ihren Anwendungsfall erfahren. Wenn Sie einen frühzeitigen Zugriff wünschen, sind wir im Moment in einer privaten Betaversion, lassen Sie es mich wissen.

0

Wenn Sie Daten mit CSV- oder JSON-Dateien exportieren oder importieren (d. H. Mit Ihren Kollegen teilen), können Sie FileMasker verwenden. Es kann als AWS Lamdbda-Funktion zum Lesen/Schreiben von CSV/JSON-Dateien auf S3 ausgeführt werden. Es ist noch in der Entwicklung, aber wenn Sie jetzt eine Beta versuchen möchten, dann kontaktieren Sie mich. Haftungsausschluss: Ich arbeite für DataVeil, den Entwickler von FileMasker.

Verwandte Themen