Ich sammle Autoreninformationen und Artikelinformationen für einen Suchbegriff in PubMed. Ich erhalte den Namen des Autors, das Jahr der Veröffentlichung und andere Informationen erfolgreich unter Verwendung von entrez_fetch
in rentrez
Paket. mein Beispielcode folgend:PubMed XML-Parsing mit entrez_fetch in rentrez
library(rentrez)
library(XML)
pubmedSearch <- entrez_search("pubmed", term = "flexible ureteroscope", retmax = 100)
SearchResults <- entrez_fetch(db="pubmed", pubmedSearch$ids, rettype="xml", parsed=TRUE)
First_Name <- xpathSApply(SearchResults, "//Author", function(x) {xmlValue(x[["ForeName"]])})
Last_Name <- xpathSApply(SearchResults, "//Author", function(x) {xmlValue(x[["LastName"]])})
PubYear <- xpathSApply(SearchResults, "//PubDate", function(x) {xmlValue(x[["Year"]])})
PMID <- xpathSApply(SearchResults, "//ArticleIdList", function(x) {xmlValue(x[["ArticleId"]])})
Trotz all die Informationen immer ich brauchte, ich herauszufinden, welche Autoren ein Problem habe, für die PMID. Dies liegt daran, dass die Länge der Autoren für jede PMID unterschiedlich ist. Wenn ich zum Beispiel Autoreninformationen für 100 Artikel wie in meinem Code analysiert habe, erhalte ich mehr als 100 Autorennamen und kann sie nicht mit der entsprechenden PMID verknüpfen. Insgesamt würde Ich mag einen Ausgangsdatenrahmen wie diese haben:
PMID First_Name Last_Name PubYear
28221147 Carlos Torrecilla Ortiz 2017
28221147 Sergi Colom Feixas 2017
28208536 Dean G Assimos 2017
28203551 Chad M Gridley 2017
28203551 Bodo E Knudsen 2017
Also diese Weise würde ich wissen, welche Autoren zugeordnet sind, mit denen PMID und für die weitere Analyse nützlich.
Nur für den Hinweis, dies ist ein kleines Beispiel für meinen Code. Ich sammle mehr Informationen mit XML
Parsing über entrez_fetch
in rentrez
Paket.
Dieses Problem nervt mich wirklich und ich würde wirklich jede Hilfe oder Anleitung schätzen. Vielen Dank für Ihre Bemühungen und Hilfe im Voraus.