2017-05-11 2 views
1

Dataproc hat keine integrierte Integration mit Apache Ranger und Apache Sentry. Was ist die empfohlene Art der Benutzerautorisierung in Hive?Hive-Autorisierung in Dataproc

Ich bin ein Neuling bei Dataproc, Ihre Antworten werden wirklich helfen.

Antwort

1

Das ist eine gute Frage.

Wie einige Hintergrundinformationen lautet das Gesamtziel von Cloud Dataproc (und anderen Cloud-Diensten), dass die Sicherheit/IAM auf dem einzelnen Produkt verfügbar ist. In vielen Fällen wechseln Kunden, die viel von Hive verwenden, zu BigQuery mit spezifischen Steuerelementen.

Auf Clusterebene wird Ihr Cluster unter einem Dienstkonto ausgeführt und Sie können switch the service account von Ihrem Cluster verwenden. Dies bedeutet, dass Sie den Zugriff eines Clusters auf Dinge beschränken können, auf die das Dienstkonto zugreifen kann - GCS-Buckets usw. Dadurch wird festgelegt, dass der jeweilige Cluster nur auf bestimmte Ressourcengruppen zugreifen darf.

Von der Benutzerebene aus können Sie den Zugriff auf Dataproc über die Dataproc IAM roles freigeben. Wenn Sie jedoch wissen, dass jemand Zugriff auf einen Cluster hat, kann er effektiv alles nutzen, auf das der Cluster Zugriff hat.

Normalerweise sehen wir, wie Kunden eine Reihe von Projekten und Dienstkonten erstellen, um ihre Sicherheitsanforderungen zu trennen. Beispielsweise kann ein Kunde drei Projekte erstellen, eines für den Verkauf, eines für das Marketing und eines für die Entwickler. Für alle diese Konten sind verschiedene Berechtigungen festgelegt. Daher ist die Verwendung von Cloud Dataproc inhärent beschränkt.

Mit diesem gesagt, war dies ein Schwerpunkt für längerfristige Verbesserung.

(Disclaimer - bin der Cloud Dataproc PM)

+0

Okay .... danke für die Klärung dieser @ James – rish0097

Verwandte Themen