2017-07-06 2 views
2

I-Daten bin Extrahierung von this Link durch diese mitExtract/beseitigen doppelte Text in imacros

TAG POS=2 TYPE=a ATTR=CLASS:property-sticky-link&&TXT:* EXTRACT=TXT 

Aber das gibt mir

BHK Apartmentfor sale in1 BHK Apartmentfor sale inKalyan1 BHK Apartment1 BHK Apartmentfor sale in1 BHK Apartmentfor sale inKalyan1 BHK Apartmentfor sale in1 BHK Apartmentfor sale inKalyan1 BHK Apartmentfor sale in1 BHK Apartmentfor sale inKalyan1 BHK Apartment1 BHK Apartmentfor sale in1 BHK Apartmentfor sale inKalyan1 BHK Apartmentfor sale in1 BHK Apartmentfor sale inKalyan1 BHK Apartmentfor sale in1 BHK Apartmentfor sale inKalyan690 sqft 

aber was ich will ist nur 1 BHK Apartmentfor sale inKalyan nur einmal

so versuchte dies SET !VAR1 EVAL("var s=\"{{!EXTRACT}}\"; s.split(' ')[-7];") Und

SET !VAR1 EVAL("'{{!EXTRACT}}'.match(/?BHK.: (\\d+)/)[-7];") 

Aber diese funktionieren nicht.

Irgendeine Idee, wie man das macht.

Jede Hilfe würde sehr geschätzt werden.

Dank

Antwort

3

Ich würde lieber die Teile von einzelnen Tags extrahieren:

TAG XPATH=".//body/descendant::div[@class='propDBlock'][1]/descendant::a[@class='property-sticky-link']/h3" EXTRACT=txt 

Ergebnis: "1 BHK Apartment"

TAG XPATH=".//body/descendant::div[@class='propDBlock'][1]/descendant::h3/span[@class='noWrapLocality']" EXTRACT=txt 

Ergebnis: "zum Verkauf in"

TAG XPATH=".//body/descendant::div[@class='propDBlock'][1]/descendant::span[@class='localityFirst']" EXTRACT=txt 

Ergebnis: "Ambernath"

TAG XPATH=".//body/descendant::div[@class='propDBlock'][1]/descendant::b[@class='areaValue']" EXTRACT=txt 

Ergebnis: "600 sqft"

... dann können Sie sie separat verwenden (z. in verschiedenen Spalten der CSV-Datei) oder verketten sie über Javascript.

Sie können auch [{{LOOP}}] anstelle von [number] in XPATH verwenden.