2017-10-09 2 views
-2

Ich versuche, die Anhänger einer zufälligen Webseite in Instagram zu extrahieren. Ich habe versucht, Python in Kombination mit Beautiful Soup zu verwenden.Instagram Web Scraping Anhänger

Trotzdem habe ich keine Informationen auf Web-Seite erhalten, wo ich

def get_user_info(user_name): 
    url = "https://www.instagram.com/" + user_name + "/?__a=1" 
    try: 
     r = requests.get(url) 
    except requests.exceptions.ConnectionError: 
     print ('Seems like dns lookup failed..') 
     time.sleep(60) 
     return None 
    if r.status_code != 200: 
     print ('User: ' + user_name + ' status code: ' + str(r.status_code)) 
     print (r) 
     return None 
    info = json.loads(r.text) 
    return info['user'] 

get_user_info("wernergruener")  

Wie bereits erwähnt ich nicht bekommen die Anhänger der Seite zugreifen. Wie könnte ich das tun?

Cheers, Andi

+0

Ich habe versucht instagram für 'wernergruener' zu suchen und leer zu kommen. Ist das der genaue Name? –

Antwort

0

Mit API/JSON: nur

bin ich mit dem Instagram API nicht vertraut, aber es sieht nicht, wie es detaillierte Informationen über eine Person, die Anhänger zurückgibt, die Anzahl der Follower.

Sie sollten in der Lage sein, diese Informationen mit info["user"]["followed_by"]["count"] zu erhalten.

Mit rohen Seite/Schöne Suppe:

die Nicht-API Seite Unter der Annahme, zeigt die Informationen, die Sie über einen Anhänger einer Person wollen, werden Sie den rohen HTML herunterladen möchten (anstelle von JSON) und analysieren es mit schöner Suppe.

def get_user_info(user_name): 
    url = "https://www.instagram.com/" + user_name 
    try: 
     r = requests.get(url) 
    except requests.exceptions.ConnectionError: 
     print ('Seems like dns lookup failed..') 
     time.sleep(60) 
     return None 
    if r.status_code != 200: 
     print ('User: ' + user_name + ' status code: ' + str(r.status_code)) 
     print (r) 
     return None 
    soup = BeautifulSoup(r.text, 'html.parser') 
    # find things using Beautiful Soup 

get_user_info("wernergruener")  

Schöne Suppe hat einige der intuitivsten Dokumentation, die ich je gelesen habe. Ich würde dort beginnen: https://www.crummy.com/software/BeautifulSoup/bs4/doc/

Mit API/python-instagram:

Andere Leute haben schon eine Menge schweres Heben für Sie erledigt. Ich denke, python-instagram sollte Ihnen einen leichteren Zugang zu den gewünschten Informationen bieten.