2016-11-01 7 views
0

Ich habe eine große Tweets Daten von Tweepy gestreamt. Ich möchte die gelöschten Tweets von diesen Daten abrufen. Jeder Tweet extrahiert aus Tweepy hat eine eindeutige ID, ich habe API.get_status (ID) Methode verwendet, um den Tweet abrufen, wenn der Tweet erfolgreich abgerufen wird, dann ist es nicht gelöscht, wenn es eine Ausnahme auslöst nehme ich an, dass die Tweet ist gelöscht.Identifizieren Sie die gelöschten Tweets aus Tweepy-Daten

auth = OAuthHandler(ckey,csecret)   
auth.set_access_token(atoken, asecret) 
api = tweepy.API(auth) 
x = 570345457618006016 
try: 
    tweet = api.get_status(x) 
except Exception, e: 
    print "deleted Tweet", tweet.text 
    pass 

Aber in diesem Verfahren, bekomme ich oft die Tweets, die aufgrund der erhöhten Ausnahme nicht verwandt sind:

Failed to send request: HTTPSConnectionPool(host='api.twitter.com', port=443): Max retries exceeded with url: /1.1/statuses/show.json?id=570500313653776384 (Caused by NewConnectionError('<requests.packages.urllib3.connection.VerifiedHTTPSConnection object at 0x1fce3810>: Failed to establish a new connection: [Errno 111] Connection refused',)) 

Kann mir jemand eine Methode vorschlagen, die mich identifizieren die gelöschten Tweets von meinem Korpus helfen kann

Antwort

0

Sie haben den gleichen Weg mit alle Ausnahmen. Sie sollten sich mit denen, die von gelöschten Tweets gemacht werden, und denen, die durch das Ratenlimit verursacht werden, anders verhalten. Anstatt zwei Arten von Ausnahmen zu behandeln, können Sie jedoch vermeiden, das Ratenlimit zu erreichen.

Wenn Sie zu oft auf das Limit stoßen, wird Ihre Anwendung wahrscheinlich blockiert. Sie sollten daher anhalten, bevor Sie es drücken. Du darfst alle 15 Minuten 180 Anfragen stellen: Schlafe für 15 Minuten alle 180 Anfragen und dein Code wird gut funktionieren.

+0

Sie können auch [ 'wait_on_rate_limit'] (https://github.com/tweepy/tweepy/blob/master/tweepy/api.py#L44) zu' true' tweepy automatisch für die notwendige Menge warten müssen von Zeit. –

+0

Ich hatte schon Probleme mit dieser Option, hauptsächlich nichts zu tun. Vielleicht habe ich etwas falsch gemacht, vielleicht gab es ein Problem mit Tweepy. Infolgedessen vertraue ich es nicht. – Efferalgan

Verwandte Themen