Ich bin neu im Bereich der Big Data und begann gerade, Dinge zu lernen. Ich habe eine Tweets-Tabelle im Bienenstock und in seinem Textfeld enthalten viele Datensätze Hyperlinks. Ich möchte diese Hyperlinks entfernen, aber ich kann das nicht tun. Da charindex und andere sql-Funktionen zu diesem Zweck nicht im Bienenstock unterstützt werden, konnte ich auch nach vielen Suchvorgängen keine Anhaltspunkte finden. Ich habe versucht, es mit regexp_replace zu tun, aber es gibt mir 'Index außerhalb des Bereichs' Fehler, was bedeutet, dass ich nicht die richtige Regexp schreiben. Hier ist meine Abfrage SELECT text, regexp_replace (text, '(https.*)', '') FROM tweets;
jede Hilfe wäre willkommen.entfernen Sie Hyperlinks von Tweets mit Bienenstock
Antwort
regexp_replace
ist ein geeigneter Ansatz, aber Ihr regulärer Ausdruck würde als "ersetzt alles nach dem ersten Auftreten von https
mit einer leeren Zeichenfolge" interpretiert werden. In diesem Fall benötigen Sie die Klammer nicht, und Ihr Regexp-Muster muss das Muster der URL, die Sie entfernen möchten, vollständiger definieren, indem Sie wahrscheinlich nach dem ersten Leerzeichen nach https suchen. Beachten Sie, dass Regexps standardmäßig "gierig" sind, so dass ein Muster wie (mit einem Leerzeichen nach dem .*
) nach der längsten Zeichenfolge in text
sucht. Beginnen mit http Sand endet mit einem Leerzeichen. Ändern Sie dies durch Hinzufügen eines? zum Wildcard-Muster, wie https.*?
. Denken Sie auch daran, dass die URL in allen Fällen keinen Platz am Ende haben darf, möglicherweise auch nicht https, aber sicherlich auch eine //:
. Verwenden Sie eine Website wie ein Rubular, um an Ihrer Regexp zu arbeiten, und fügen Sie sie dann Ihrer Abfrage hinzu, wenn Sie damit arbeiten.
Schließlich ist es wahrscheinlich, dass Sie nicht einen Raum nach der Funktion, so dass statt regexp_replace (...
tun regexp_replace(...
- 1. PHP: Entfernen Sie alle Hyperlinks von bestimmten Domäne von Text
- 2. Woocommerce - Entfernen von Hyperlinks zu einzelnen Produktseiten
- 3. Bienenstock query Minimalwerte aus einer Tabelle entfernen
- 4. Twitter4j Wie bekomme ich twitter Tweets von Tweets Tweets
- 5. Wie entfernen Sie Hyperlinks aus einem Microsoft Word-Dokument?
- 6. Datensatz von Tweets mit Geolokalisierungsdaten
- 7. Entfernen von richtigen englischen Wörtern aus Tweets in R
- 8. Grabbing Tweets mit PHP
- 9. Get Tweets mit Fabric
- 10. Hyperlinks innerhalb von AfxMessageBox
- 11. Extract HyperLinks von Webseite mit R
- 12. Ersetzen URLS mit Hyperlinks
- 13. onMouseOver Hyperlinks mit
- 14. So entfernen Sie den gepunkteten Rahmen um aktive Hyperlinks in IE8 mit CSS
- 15. Wo finden Sie große Daten für Bienenstock?
- 16. Word-Makro - Entfernen Sie Hyperlinks von allen Links, die bestimmten Text enthalten
- 17. Erkennen eines Hyperlinks von jquery
- 18. . Net-Konsole App mit Hyperlinks?
- 19. Delaying Hyperlinks
- 20. Sammeln Tweets mit Benutzernamen und speichern sie mit Tweepy
- 21. presto + Bienenstock: CLUSTERED TABELLE
- 22. Bienenstock Leistung Union alle
- 23. wie Bienenstock im Debug-Modus laufen zu lassen
- 24. lesen Bienenstock Metadatenoptionen
- 25. Öffnen mehrerer Hyperlinks mit Greasemonkey
- 26. dynamisch aktualisieren ContentPlaceHolder von Hyperlinks
- 27. Fetch Tweets mit mehreren Operator
- 28. Erhalten von Tweets in MVC
- 29. TIMESTAMP im Bienenstock?
- 30. Schwein überschreiben Daten in Bienenstock mit LOAD
danke, mit dem zur Verfügung gestellt Rubular Bezug setzen sollte ich in der Lage war meine regulären Ausdruck zu verfeinern und entfernt erfolgreich die Hyperlinks. –