2016-09-17 10 views
0

Ich habe Probleme beim Abrufen von SERP (Search Engine Result) von Yahoo zu Google Tabellen. Ich versuche auf dieser Seite href des allerersten Ergebnisses zu bekommen.Xpath oder Importxml in Google Tabellenblatt

Hier ist XPath:

//*[@id="yui_3_10_0_1_1474115100593_232"] 

Hier ist meine Frage: site:linkedin.com/company/ 1011vc.com,TenEleven Ventures

Google search results snapshot

Aber ich bin nicht href bekommen, die ich bin auf der Suche nach. Kann ich bei diesem Problem Hilfe bekommen? : '(

+0

kann jeder Hilfe bitte? Danke: '( –

+0

Siehe unten - Ich habe auch eine alternative Formel für Sie hinzugefügt –

Antwort

0

können Sie eigentlich nur Ihre XPath //h3/a/@href vereinfachen und dann wickeln Sie es in trim, um nur das erste Ergebnis zu geben - auch so weit wie die Formatierung - ich persönlich immer am Ende mit regexreplace, um das Stück, das ich will, und formatieren es als eine tatsächliche URL:

=REGEXREPLACE(TRIM(IMPORTXML(A1,"//h3/a/@href")),"(^.*linkedin.com%2fcompany%2f)(.*)(/RK.*)","http://linkedin.com/company/$2") 

Die regex grundsätzlich Gruppen die Abschnitte in 3 Teile - 1) Der Beginn des Strings, bis Sie das Teil erreichen, der linkedin aufführt - dargestellt als ^.*linkedin.com%2fcompany%2f da die Ergebnisse als die codierten URL-String zurück

2) die Wildcard-Wert für die eindeutige ID oder slug des Firmenprofil - (.*)

3) dann wird der Teil, nachdem es folgende so weiß es, wo zu stoppen: (/RK.*)

Mit RegExReplace, können Sie festlegen, dass Sie wollen, dass es die gesamte Zeichenfolge mit der 2nd Capture-Gruppe ersetzen - durch ein $2 vertreten - dann nur den Kreis kommen, ich reappend die erste Hälfte der endgültigen URL, so dass es nicht

codiert wird

enter image description here

0

Versuchen Sie folgendes:

string(//b[start-with(@id, "yui")]/ancestor::a[1]/@href) 
+0

Danke Gilles, scheint nicht zu funktionieren ... = IMPORTXML (A2, string (// a [text() = "Ten Eleven Ventures | LinkedIn" ]/@ href)) –

+0

die Abfrage für yahoo so etwas wie dies zu machen https://search.yahoo.com/search;_ylt=A0LEVzqFK91Xs9cAQn5XNyoA;_ylc=X1MDMjc2NjY3OQRfcgMyBGZyA3NmcARncHJpZAN5aHdhdkRSZlJMU2pDNW5heDYuT1ZBBG5fcnNsdAMwBG5fc3VnZwM0BG9yaWdpbgNzZWFyY2gueWFob28uY29tBHBvcwMwBHBxc3RyAwRwcXN0cmwDMARxc3RybAM2OARxdWVyeQNzaXRlJTNBbGlua2VkaW4uY29tJTJGY29tcGFueSUyRiUyMDEwMTF2Yy5jb20lMkNUZW5FbGV2ZW4lMjBWZW50dXJlcwR0X3N0bXADMTQ3NDExMjU1Nw--?p=site%3Alinkedin.com%2Fcompany%2F+ 1011vc.com% 2CTenEleven + Ventures & fr2 = sb-top & fr = sfp –

+0

POST entsprechend bearbeitet, war für google ^^ –

1

Sie sollten eine allgemeinere XPath auf einem Teil der Suche basiert, so etwas wie:

//h3/a[contains(@href, ventures)]/@href 
+0

waooow genial ... danke aloot ...:) –

Verwandte Themen