Ich habe etwas über Internet recherchiert und bis jetzt habe ich gerade Möglichkeiten gefunden, die ersten/letzten Buchstaben von Beobachtungen mit susbstr
zu entfernen, aber nicht einen Befehl, der wie CTRL + F-findandreplace wäre. Der Trick hier ist, dass ich nicht unbedingt weiß wo die Wörter die ich fallen lassen möchte!Wie entfernt man bestimmte Wörter aus Beobachtungen in Stata oder R?
My-Datensatz sieht wie folgt aus:
Hosp_code Hosp Hosplat Hosplon
RRK RRK - UNIVERSITY HOSPITALS BIRMINGHAM NHS FOUNDATION TRUST 52.453271 -1.9362835
RLU RLU - BIRMINGHAM WOMEN'S NHS FOUNDATION TRUST 52.453184 -1.9422432
5MX 5MX - HEART OF BIRMINGHAM TEACHING PCT 52.471575 -1.9367724
NO0 NO0 - HEALTHHARMONIE LIMITED 52.470965 -1.9243192
NLU NLU - SK:N (LASERCARE CLINICS LTD) 52.470838 -1.9220819
NXX NXX - SCRIVENS LTD 52.47148 -1.91341
AGL AGL - ADDITIONAL COMMUNITY MEDICAL SERVICES LTD 52.477343 -1.917197
5M1 5M1 - SOUTH BIRMINGHAM PCT 52.445922 -1.8928915
NQR NQR - PRIMECARE PRIMARY CARE 52.484113 -1.9173169
RXT RXT - BIRMINGHAM AND SOLIHULL MENTAL HEALTH NHS FOUNDATION TRUST 52.484113 -1.9173169
RRJ RRJ - THE ROYAL ORTHOPAEDIC HOSPITAL NHS FOUNDATION TRUST 52.421133 -1.9608273
RXK RXK - SANDWELL AND WEST BIRMINGHAM HOSPITALS NHS TRUST 52.48982 -1.9294268
RQ3 RQ3 - BIRMINGHAM CHILDREN'S HOSPITAL NHS FOUNDATION TRUST 52.485173 -1.8944604
RYW RYW - BIRMINGHAM COMMUNITY HEALTHCARE NHS TRUST 52.487323 -1.8858108
5PG 5PG - BIRMINGHAM EAST AND NORTH PCT 52.491369 -1.886036
NIT NIT - SOUTH DOC SERVICES LIMITED HQ 52.401796 -1.9620201
RR1 RR1 - HEART OF ENGLAND NHS FOUNDATION TRUST 52.477876 -1.8275305
NIS NIS - COVENTRY AND WARWICKSHIRE DIAGNOSTIC SERVICES LIMITED 52.462504 -1.8159336
NDT NDT - WEST MIDLANDS DIAGNOSTIC SERVICES LTD 52.462504 -1.8159336
5PF 5PF - SANDWELL PCT 52.523328 -2.0026388
TAJ TAJ - BLACK COUNTRY PARTNERSHIP NHS FOUNDATION TRUST 52.519255 -2.0188053
NEP NEP - TICCS ULTRASOUND LIMITED 52.510017 -1.8113152
NL7 NL7 - ASSURA VERTIS URGENT CARE CENTRES (BIRMINGHAM) 52.542091 -1.8778985
NNT NNT - ASSURA KINGSTANDING 52.542091 -1.8778985
5QW 5QW - SOLIHULL PCT 52.391695 -1.8081752
NR9 NR9 - JOHN TAYLOR HOSPICE COMMUNITY INTEREST COMPANY 52.527341 -1.8234016
RYK RYK - DUDLEY AND WALSALL MENTAL HEALTH PARTNERSHIP NHS TRUST 52.508312 -2.0844533
ich entfernen möchten: - Die ersten drei Buchstaben (z RRK -
) - jede Erwähnung von "LTD" "LTD "LIMITED" "HQ" "LLP" "TRUST" "FOUNDATION TRUST"
Jeder Vorschlag?
in R siehe 'gsub' – Batanichek
oder http://www.inside-r.org/packages/cran/stringr/docs/str_replace_all –
Nur aus Neugier, wo Sie Längen- und Breitengrad hat für NHS erhalten Organisationen? –