Hadoop können nur einfache Schwärzung durch Modifizieren HDFS Konfiguration, zum Beispiel unterstützen: Es gibt eine Kartennummer A: "1234-5678-8765-4321"
, kann sie durch regex erkannt werden und dann durch einen vordefinierten Ausdruck ersetzt, wie: "XXXX-XXXX-XXXX-XXXX"
, wie unten gezeigt:Wie komplexe Redaktion implementieren?
Meine Frage ist, kann es die Nummer A zu übertragen: "1234-5678-XXXX-4321"
eher als der vordefinierte Ausdruck?
Unklar, was Sie fordern für die Wiederverwendung. Mapreduce-Code? –
@ cricket_007 Entschuldigung für die unklare Beschreibung ... Die Frage ist über Hadoop Redaktion. Dies ist die Unterdrückung von sensiblen Daten, die oft auf Protokolle, Bienenstock/Impala-Abfrage, Farbton verwendet werden, um jegliche Lecks von sensiblen Informationen zu verhindern. – user3692015
Ich verstehe, was Redaktion ist, aber Sie sollten die relevanten Tags zu der Frage hinzufügen, um mehr Menschen die Frage zu sehen. Farbton bietet dieses Redaction-Feature, nicht Kern hadoop –