Ich habe eine Zeichenfolge mit vielen Wörtern und ich habe eine Textdatei, die einige Stopwörter enthält, die ich aus meiner Zeichenfolge entfernen muss. Sagen wir, ich habe einen StringEntfernen von Stoppwörtern aus einem String in Java
s="I love this phone, its super fast and there's so much new and cool things with jelly bean....but of recently I've seen some bugs."
Nach Stoppwörter zu entfernen, sollte Zeichenfolge wie:
"love phone, super fast much cool jelly bean....but recently bugs."
ich in der Lage gewesen, dies zu erreichen, aber das Problem, das ich bin vor, dass whenver gibt es neben Stoppwörter seine im String Entfernen nur die erste und ich erhalte Ergebnisse als:
"love phone, super fast there's much and cool with jelly bean....but recently seen bugs"
Hier meine stopwordslist.txt Datei ist: Stopwords
Wie kann ich dieses Problem lösen? Hier ist, was ich bisher getan haben:
int k=0,i,j;
ArrayList<String> wordsList = new ArrayList<String>();
String sCurrentLine;
String[] stopwords = new String[2000];
try{
FileReader fr=new FileReader("F:\\stopwordslist.txt");
BufferedReader br= new BufferedReader(fr);
while ((sCurrentLine = br.readLine()) != null){
stopwords[k]=sCurrentLine;
k++;
}
String s="I love this phone, its super fast and there's so much new and cool things with jelly bean....but of recently I've seen some bugs.";
StringBuilder builder = new StringBuilder(s);
String[] words = builder.toString().split("\\s");
for (String word : words){
wordsList.add(word);
}
for(int ii = 0; ii < wordsList.size(); ii++){
for(int jj = 0; jj < k; jj++){
if(stopwords[jj].contains(wordsList.get(ii).toLowerCase())){
wordsList.remove(ii);
break;
}
}
}
for (String str : wordsList){
System.out.print(str+" ");
}
}catch(Exception ex){
System.out.println(ex);
}
würde die Zeichenfolge erste Hilfe spalten? etwas wie "phrase.split (delims);" Sie können die unerwünschten Teile herausfiltern, bevor Sie sie wieder zusammennähen. Dies kann Ihr "Dies" und "sein" Problem lösen. –
[Genauere Frage ist hier] (http://stackoverflow.com/questions/22257598/best-way-to-remove-stop-words-from-files) – jsroyal