Ich habe die folgende Zeichenfolge in dem Objekt gespeichert sentence
:entfernen Urls von Strings
sentence <- "aazdlubtirol: RT @tradeDayTrades: sister articles \"$AAPL Dancing in a Burning Room\" January 2013 http://t.co/tkuCRfLy \" $AAPL vs $AAPL \" August 2011 http://t.co/863HkVjn"
Ich versuche gsub zu verwenden, URLs mit http
beginnen zu entfernen:
sentence <- gsub('http.*','',sentence)
jedoch es ersetzt alles nach http
:
aazdlubtirol: RT @tradeDayTrades: sister articles \"$AAPL Dancing in a Burning Room\" January 2013
Was ich will, ist:
aazdlubtirol: RT @tradeDayTrades: sister articles \"$AAPL Dancing in a Burning Room\" January 2013 \" $AAPL vs $AAPL \" August 2011
Ich versuche, die Urls zu bereinigen, so dass, wenn ein String http
enthält ich die URL entfernen möchten. Ich habe einige Lösungen gefunden, aber sie helfen mir nicht.
einen Raum zu Ihrem Ersatz Gruppe hinzufügen: (‚http *‘, ‚‘, Satz) 'gsub '. – Justin
@Justin große Antwort Ich versuchte 'Gsub ('http. * \\ s', '', Satz)' aber es funktioniert nicht. Vielleicht könnten Sie Ihre als Antwort hinzufügen. –
Ich finde es seltsam, dass '\\ s' nicht funktionieren würde, wo ein einzelner Raum ist. – jbaums