Ich blieb mit dem Pfad stecken, den ich verwenden muss, um einige GO-Begriffe zu erhalten. Als Beispiel können wir uns diese webpage ansehen. Ich möchte eine Liste mit allen GO-Bezeichnern aus dem Prozessteil der Tabelle erhalten. Das erste Problem, das ich habe, ist, dass "Prozess", "Funktion" und "Komponente" Teile der Tabelle alle unter dem gleichen Niveau sind, so weiß ich nicht, wie man nur die "Prozess" -Codes bekommt. Das zweite Problem ist, dass ich mit meinem tatsächlichen Weg überhaupt keine Codes bekomme, und ich habe erwartet, dass ich zumindest alle bekomme. Jede Hilfe wird geschätzt.Abrufen der Liste der Zeichenfolgen in Python mit Xpath
def getGOcodes(uniprot_id_list):
for uniprot_code in uniprot_id_list:
ebi_webpage = 'http://www.ebi.ac.uk/QuickGO/GProtein?ac='+uniprot_code
response = requests.get(ebi_webpage)
tree = html.fromstring(response.content)
path_molecular_GOcodes = '//*[@id="contentsarea"]/div[4]/div[3]/form/div[2]/table/tbody[2]/tr/td[5]/div/a/text()'
GOcodes = tree.xpath(path_molecular_GOcodes)
print GOcodes
return GOcodes