2016-10-09 2 views
1

Hadoop können nur einfache Schwärzung durch Modifizieren HDFS Konfiguration, zum Beispiel unterstützen: Es gibt eine Kartennummer A: "1234-5678-8765-4321", kann sie durch regex erkannt werden und dann durch einen vordefinierten Ausdruck ersetzt, wie: "XXXX-XXXX-XXXX-XXXX", wie unten gezeigt:Wie komplexe Redaktion implementieren?

enter image description here

Meine Frage ist, kann es die Nummer A zu übertragen: "1234-5678-XXXX-4321" eher als der vordefinierte Ausdruck?

+0

Unklar, was Sie fordern für die Wiederverwendung. Mapreduce-Code? –

+0

@ cricket_007 Entschuldigung für die unklare Beschreibung ... Die Frage ist über Hadoop Redaktion. Dies ist die Unterdrückung von sensiblen Daten, die oft auf Protokolle, Bienenstock/Impala-Abfrage, Farbton verwendet werden, um jegliche Lecks von sensiblen Informationen zu verhindern. – user3692015

+0

Ich verstehe, was Redaktion ist, aber Sie sollten die relevanten Tags zu der Frage hinzufügen, um mehr Menschen die Frage zu sehen. Farbton bietet dieses Redaction-Feature, nicht Kern hadoop –

Antwort

1

können Sie () verwenden Muster zu packen und $1 $2 ... $n sie in den Ausdruck ersetzen enter image description here

+0

wow ... Ich habe etwas gelernt. Danke vielmals! – user3692015

+0

noch eine Frage ... Diese Redaktion wird von einem Online-Test-Tool durchgeführt. Die definierten Redaktionsregeln werden jedoch in die Konfigurationsdatei eingefügt, und diese .xml-Datei kann die von Ihnen definierten Regeln möglicherweise nicht ausführen. @ ozw1z5rd – user3692015

+0

Ich werde das morgen überprüfen. – ozw1z5rd