2016-04-08 9 views
0

Ich blieb mit dem Pfad stecken, den ich verwenden muss, um einige GO-Begriffe zu erhalten. Als Beispiel können wir uns diese webpage ansehen. Ich möchte eine Liste mit allen GO-Bezeichnern aus dem Prozessteil der Tabelle erhalten. Das erste Problem, das ich habe, ist, dass "Prozess", "Funktion" und "Komponente" Teile der Tabelle alle unter dem gleichen Niveau sind, so weiß ich nicht, wie man nur die "Prozess" -Codes bekommt. Das zweite Problem ist, dass ich mit meinem tatsächlichen Weg überhaupt keine Codes bekomme, und ich habe erwartet, dass ich zumindest alle bekomme. Jede Hilfe wird geschätzt.Abrufen der Liste der Zeichenfolgen in Python mit Xpath

def getGOcodes(uniprot_id_list): 

    for uniprot_code in uniprot_id_list: 

     ebi_webpage = 'http://www.ebi.ac.uk/QuickGO/GProtein?ac='+uniprot_code 
     response = requests.get(ebi_webpage) 
     tree = html.fromstring(response.content) 

     path_molecular_GOcodes = '//*[@id="contentsarea"]/div[4]/div[3]/form/div[2]/table/tbody[2]/tr/td[5]/div/a/text()' 
     GOcodes = tree.xpath(path_molecular_GOcodes) 

     print GOcodes 
     return GOcodes 

Antwort