Ich versuche, das Alter (numerische Werte) von einem Vektor zu extrahieren, tryied folgendes aber vermöge arbeiteteNumerische Werte in R (von Freitext) Extrahierung
Beispiel: -
a <- "age-32 agge32 age 45 aage 56 agee 34"
b <- gsub("[Aa]g.e?"," age ",a)
sa <- strsplit(x=b, split="\\s")
age <- stringr::str_extract(sa, "(age?)(\\s[^\\s]+){1}")
(or)
age <- grep("(([^\\s]+\\s){0}(age)(\\s[^\\s]+){1})",sel,value = TRUE)
Wenn Sie alle Zahlen extrahieren möchten, versuchen Sie 'str_extract_all (a," \ \ d + ")'. – Lamia
Danke für das frühere Update, aber der freie Text enthält tatsächlich andere Ziffern wie Datum, Adresse eines Ortes, Pincode etc ... Ich möchte das Alter (Ziffern) extrahieren, dem das Zeichen wie "Alter | agge | Alter- | Alter | Alter "Beispiel: - ein <-" Alter-32 Alter32 Alter 45 Alter 56 Alter 34 24-06-2015 DoorNo1,27/7, 3. Straße, Wellington, Pin 2100067 " –
Entschuldigung mein Fehler, die Anforderung ist. Ich möchte nur das Alter (Ziffern) extrahieren, dem der Charakter folgt wie "Alter | agge | Alter- | Alter | Alter" ein <- "Vater Alter-52 Mutter agge42 Sohn Alter 9 Tochter Alter 6 Adresse ist Tür 23 20002, Doc 26-07-1999 Pincode 260074 "> str_extract (str_extract_all (a," (?> Alter | agg). +? \ d + ") [[1]]," \\ d + ") Ausgabe: [1] NA NA NA NA Erwartete Ausgabe ist: 52 42 9 6 .. Brauchen Sie Hilfe auf –