Ich versuchte mit Apache-Drill eine einfache Join-Aggregat-Abfrage ausführen und die Geschwindigkeit war nicht wirklich gut. Meine Testabfrage war:Apache Drill schlechte Leistung
Wo Fakten über 422.000 Zeilen und Produkt hat 600 Zeilen. Die Gruppierung kommt mit 4 Zeilen zurück.
Zuerst habe ich diese Abfrage auf SqlServer getestet und habe ein Ergebnis in etwa 150ms zurück.
Mit Drill habe ich zuerst versucht, eine Verbindung direkt zu SqlServer und führen Sie die Abfrage, aber das war langsam (ca. 5 Sekunden).
Dann habe ich versucht, die Tabellen in JSON-Dateien zu speichern und von ihnen zu lesen, aber das war noch langsamer, also versuchte ich Parkett-Dateien.
Ich habe das Ergebnis im ersten Lauf in etwa 3 Sekunden zurück. Der nächste Lauf war etwa 900 ms und dann war es etwa 500 ms.
Aus dem Lesen, macht dies keinen Sinn und Bohrer sollte schneller sein! Ich versuchte "REFRESH TABLE METADATA", aber die Geschwindigkeit änderte sich nicht.
Ich habe dies auf Windows ausgeführt, über die Drill-Befehlszeile.
Irgendeine Idee, wenn ich etwas zusätzliche Konfiguration oder etwas brauche?
Danke!