Beim Erstellen der Partitionstabelle in der Struktur ist es zwingend erforderlich, immer die letzte Spalte für die Partitionsspalte auszuwählen. Wenn ich 1. Spalte als Partition wähle, kann ich keine Daten filtern, gibt es eine Möglichkeit, die erste Spalte für die Partition zu wählen?Hive erste zu berücksichtigende Spalte in der Partitionstabelle
Antwort
Wenn Sie im Hive eine Tabelle partitionieren möchten, müssen Sie die Partitionsspalte während der Erstellung der Tabelle zuerst definieren. & während die Daten in Tabelle bevölkern Sie wie folgt angeben müssen:
"IN partitioned_table PARTITION INSERT (Status) SELECT id, name, Status von temp_tbl"
auf diese Weise Sie verwenden, können auf der letzten Spalte partitionieren basierend nur. wenn Sie auf der Basis der ersten Spalte partitionieren möchten. Sie müssen dafür einen Mapreduce-Job schreiben. das ist die einzige verfügbare Option.
Ich vermute, das Problem, das Sie konfrontiert sind, ist, dass Sie bereits Tabelle "Quelle" in Ihrem lokalen System oder hdfs haben und Sie es in partitionierte Tabelle hochladen möchten. Und Sie möchten, dass die erste Spalte in der Quelltabelle in der Struktur partitioniert wird. Da die Quelltabelle keine Header hat, können wir hier nichts machen, wenn wir versuchen, die Datei direkt in den Hive-Zielordner hochzuladen. Die einzige Alternative, die ich kenne, ist, dass Sie eine nicht partitionierte Tabelle in der Struktur erstellen, deren Struktur genau der Quelldatei entspricht. Laden Sie dann die Quelldaten zuerst in die nicht partitionierte Tabelle hoch und kopieren Sie dann die Daten von der nicht partitionierten Tabelle in die partitionierte Tabelle. create table source(eid int, ename int, esal int) partitioned by (dept string)
Ihre nicht partitioniert Tabelle die Quelldatei wie diese ist Nehmen wir an, wo Sie die Daten hochladen wie ist diese create table nopart(dept string, esal int,ename string, eid int)
dann verwenden Sie die dynamische Partition durch Befehl insert overwrite table source partition(dept) select eid,ename,esal,dept from nopart;
die Reihenfolge der Parameter ist der einzige Punkt hier.
- 1. Nachdem die Partitionstabelle
- 2. SQL Server-Partitionstabelle Leistung
- 3. Drucken Partitionstabelle - C-Programm
- 4. Locate REGEXP_REPLACE UDF Hive Zeichenfolge in einer Spalte zu ersetzen
- 5. Wie Name der Eingabedatei als Spalte in Hive-Abfrage erhalten
- 6. Funken Datenframe zu CSV erste Spalte
- 7. wie erste Spalte der Datentabelle als Hyperlink
- 8. Erlöschen aller Partitionen und der Partitionstabelle auf der externen Festplatte
- 9. Ways erste Spalte der Tabelle durch
- 10. Hive Elasticsearch zu Kibana: Keine Felder im Feld Verfügbar Spalte
- 11. Create Hive-Index für komplexe Spalte
- 12. Wie fügt man eine Spalte zu einer vorhandenen Array-Spalte in Hive an?
- 13. Freeze erste Spalte und Detail
- 14. eine Spalte in einer Tabelle in HIVE QL hinzufügen
- 15. Erste sichtbare Spalte im Datenblatt
- 16. Konvertieren Zeilennamen in die erste Spalte
- 17. Wie oledbdatareader zu zwingen, die erste Spalte der Datenbank in C# zu ignorieren?
- 18. BigQuery Abfrage erste verfügbare Spalte
- 19. Wie mehrwertig Feld in eine Spalte in hive
- 20. Erste SQLiteException: keine solche Spalte
- 21. HIVEQL/HIVE die häufigste Feld in einer Spalte
- 22. Wählen Sie unterschiedliche Werte aus jeder Spalte in Hive
- 23. Split eine Spalte basierend auf dem Trennzeichen in hive Editor
- 24. Erste Fehler versuchen hive Tabelle auszuwählen hcatalog von HAWQ mit
- 25. Wie richtet man die zweite Spalte der zweiten Zeile auf dieselbe erste Spalte oder erste Zeile in Bootstrap aus?
- 26. Teil von Dateinamen als eine Spalte in Hive Tabelle
- 27. Unix-Befehl, alles zu entfernen, nachdem erste Spalte
- 28. regex_extract in Hive
- 29. tokenize Funktion in Hive
- 30. Hive UDF, die verwenden Hive Tabelle