2016-04-24 6 views
0

Ich benutze Tweepy, um Twitter zu kratzen. Ich habe durch die Streaming-API geschaut und unter "Track" die möglichen Ergebnisse bei der Suche nach einem Tweet angezeigt.Kratzen Twitter für Hashtag mit Wort anstelle von genau passendem

https://dev.twitter.com/streaming/overview/request-parameters

Für den größten Teil scheint es die API nur exakte Übereinstimmungen zurückgeben, (und einige zusätzliche Fälle mit Pünktlichkeit direkt im Anschluss oder prefacing) Ich bin für Tweets mit # und in der folgenden Hashtag Absuchen eines bestimmten Wort, z pillow. Also, für dieses Beispiel würde Tweets Ich mag:

#pillow #mybedpillow #mypillowbed

Aber wenn ich die API-Tracking #pillow verwenden werde ich nur die genaue Übereinstimmung mit #pillow

bekommen Wenn ich pillow tun werde ich Get Tweets mit #pillow, aber kein Text folgt.

Der einzige Ansatz, den ich jetzt sehe, ist, zufällige Tweets zu streamen und sie dann nach den Hashtags zu filtern, die zu meinem Fall passen. Dies wird mich viel länger brauchen, um die Daten zu sammeln, die ich benötige. Irgendwelche Gedanken?

Antwort

0

Dieser Thread kann in Ihren Bemühungen hilfreich sein. Regex könnte eine Lösung für Ihr Problem sein: Best HashTag Regex

Verwandte Themen