Ich habe Daten in einer Spalte, die unten wie folgt aussehen:Extrahieren von Text vor einem bestimmten Wort mit hive
- Avenue 1 HE1 345 HOUSE 123
FLAT 202 HRE2 D34 HOUSE 345.
DOOR 324 HA1 345 HOUSE 67
5.
Ich muss die Postleitzahl, die immer vor dem Haus kommt, in allen Fällen zwischen 6-7 Zeichen extrahieren. Es gibt immer einen Leerraum vor HAUS und zwischen der Postleitzahl und einer vor der Postleitzahl.
gewünschte Ausgabe:
- HE1 345
- HRE2 D34
- HA1 345
Ich habe versucht, SUBSTRING_INDEX zweimal mit nur diesen Bienenstock zu wissen, nicht die Funktion unterstützen . Ich bin ziemlich neu in Hive. Hilfe und jede Bezugnahme auf Material wird auch eine große Geste sein.
Vielen Dank im Voraus.
"Ich habe versucht, SUBSTRING_INDEX zweimal mit nur diesem Bienenstock zu wissen, nicht die Funktion unterstützen" https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF#LanguageManualUDF-StringFunctions –