2016-11-15 3 views
1

Ich unterrichte einen Kurs über Datenwissenschaft und ich bin nicht vertraut mit Tools wie Tableau. Ein Student sagte, dass Tableau einen extrem effizienten Komprimierungsalgorithmus hatte, was für mich irgendwie schockierend war. Ich habe mir Tableau als eine Art Metabase vorgestellt, mit der Daten visualisiert und untersucht wurden.Hat Tableau eine interne Datenbank oder benötigt eine externe Datenbank

So sind die wichtigsten Fragen sind:

1) Ist tableau speichern Daten, oder wie funktioniert es Daten speichern?
2) Sind diesem Betrag Grenzen gesetzt?
3) Gibt es irgendwelche Kenntnisse/Benchmarks für den Komprimierungsalgorithmus oder die Abfragegeschwindigkeit?

Antwort

1

Worauf sie sich am wahrscheinlichsten beziehen, ist der Tableau Data Extract.

Tableau Desktop verfügt über keine integrierte Datenbank, sondern stellt eine Verbindung zu verschiedenen Datenquellen (Dateien, Datenbanken usw.) her. Nach dem Verbinden mit einer Datenquelle kann Tableau diese Daten in eine Tableau-Datenextraktdatei "extrahieren", die sowohl komprimiert als auch in einem Spaltenspeicherformat dargestellt wird.

Ich bin mir nicht sicher, was Sie mit "Gibt es Grenzen für diese Menge?". Beachten Sie, dass der Tableau-Datenextrakt als tatsächliche Datei (.tde) gespeichert wird.

Ich stelle mir vor, dass der Algorithmus/Code proprietär von Tableau ist und nicht etwas, das Sie selbst überprüfen könnten.

Hier ist eine gute Referenz für Sie mehr über TDes zu erfahren:
https://www.tableau.com/about/blog/2014/7/understanding-tableau-data-extracts-part1

+0

Natürlich ist ein Extrakt ** eine effiziente komprimierte Datenbank für schnelle Abfragen optimiert (und verhält sich wahrscheinlich am besten im RAM). Die praktischen Grenzen werden daher entweder auf der Festplatte oder auf dem RAM liegen. –

+0

So funktioniert das nicht. Tableau fragt den Extrakt weiterhin ab und speichert das Ergebnis dieser Abfrage im RAM - nicht den gesamten Extrakt. – Nicarus

0

Im Allgemeinen Tableau Daten nicht speichert, sondern weist sie durch Bezugnahme auf eine oder mehrere Datenquellen nur --read - - Lassen Sie die Daten im Ruhezustand, geben Sie Abfragen aus und rendern Sie die Abfrageergebnisse anschließend visuell. Es funktioniert mit Dutzenden von typischen Datenquellen.

Diese Architektur hat Vorteile. Wenn sich die Daten ändern, kann das Diagramm einfach aktualisiert werden, um das Ergebnis zu sehen. Sie können Daten von mehreren Quellen ohne ETL kombinieren

Die fast Ausnahme ist, wenn Sie einen Tableau-Datenextrakt erstellen, wie Nicarus erklärte. Stellen Sie sich Auszüge als persistente, zwischengespeicherte Kopien einer Teilmenge der ursprünglichen Datenquelle vor. Die echten Daten sind noch extern, es gibt nur eine lokale Kopie für die Geschwindigkeit

Verwandte Themen