Ich habe zwei Strings:Extrakt mehr Teile eines Strings mit R
data = "Product Number: #76 in c (See Top 10 products in this department)"
data1 = "Product Number: #321,222 in Thin Base Pizzas (See Top 10 products in this department)"
mit str_match() in R, was würde die Regex für die folgenden Ergebnisse sein?
str_match (Daten, regex) [1] [2] [3]
[1] "76 # in Fruchtsaft" "76" "Fruchtsaft"str_match (data1, regex) [1] [2] [3]
[1] "# 321222 in Thin Base-Pizzas" "321222" "Thin Base-Pizzas"
mehr Kontext bitte, müssen Regelmäßigkeit in der Struktur Ihrer Strings finden, um nützliche Antwort zu liefern. – snoram
bieten mehr Details –
Die Zahl nach # kann mehrere Ziffern und Koma als Tausendertrennzeichen haben ex: # 31,123. der Text nach "in" und vor "(Siehe" kann in der Länge variieren, hat aber keine Sonderzeichen Beispiel: "Thin base pizzas" Text "Artikelnummer: #" und der Text "(Siehe Top 10 Produkte in dieser Abteilung) "ändert sich nie. – 555