Extra-Matching, wenn findtext() für mehrere ocurrences mit

Ich versuche, mehrere Katakana Wörter (ein paar Buchstaben in einem Unicode-Bereich) in einem japanischen Dokument mit findtext mit dem folgenden Code zu finden:Extra-Matching, wenn findtext() für mehrere ocurrences mit

function highlightKatakana() { 

    var katakana = "[\u30A0-\u30FF]+"; 

    var doc = DocumentApp.getActiveDocument(); 
    var bodyElement = doc.getBody(); 
    var searchResult = bodyElement.findText(katakana); 

    while (searchResult != null) { 
    var thisElementText = searchResult.getElement().asText(); 
    Logger.log(thisElementText.getText()); 
    Logger.log("From " + searchResult.getStartOffset() + " to " + searchResult.getEndOffsetInclusive()); 
    searchResult = bodyElement.findText(katakana, searchResult); 
    } 
}

Für einen Grund, den ich nicht verstehe, wenn ich nach dem nächsten Vorkommen suche, es beginnt mit dem letzten Zeichen des vorherigen Vorkommnisses, und deshalb stimmt es wieder als ein Ein-Zeichen-Wort überein.

Hier ist ein Beispiel aus dem Protokoll ist, sollte es nur einmal entsprechen:

キンメダイ の切り身に包丁目を入れ (火通りをよくし, 味をしみ込みやすくするため), 熱湯をかけてすぐに氷水にとる (霜降り). von 0 bis 4

キンメダイの切り身に包丁目を入れ (火通りをよくし, 味をしみ込みやすくするため) 熱湯をかけ12 すぐにににる (霜降り). Von 4 bis 4

Da searchResult ein RangeElement mit nur get Methoden ist, Was sollte der richtige Weg sein, um die Funktion findText (searchPattern, from) zu verwenden?

Quelle

2016-04-13 Fernando Antúnez García

Es scheint, dass es ein Fehler ist hier, und die RangeElement den Index nicht zu Ende + 1-Position bewegen.

Sie könnten versuchen, durch „auffressen“ den Charakter mit einer anderen Suche, um dieses Werk ([\s\S] sollte von 1 Zeichen voran):

while (searchResult != null) { 
    var thisElementText = searchResult.getElement().asText(); 
    Logger.log(thisElementText.getText()); 
    Logger.log("From " + searchResult.getStartOffset() + " to " + searchResult.getEndOffsetInclusive()); 
    searchResult = bodyElement.findText("[\s\S]", searchResult); // <= HERE 
    searchResult = bodyElement.findText(katakana, searchResult); 
    }

Oder nutzen JS (ähnlich dem, was Tim schon sagt):

var katakana = /[\u30A0-\u30FF]+/g; 
var doc = DocumentApp.getActiveDocument(); 
while ((m=katakana.exec(doc.getBody().getText())) !== null) { 
    Logger.log("Matched: " + m[0] + ", from " + m.index + " to " + katakana.lastIndex); 
}

Quelle

2016-04-13 10:00:40

Versuchen Sie, diese

var re = /[\u30A0-\u30FF]+/g; 
var str = 'キンメダイの切り身に包丁目を入れ（火通りをよくし、味をしみ込みやすくするため）、熱湯をかけてすぐに氷水にとる（霜降り）。'; 
var m; 

while ((m = re.exec(str)) !== null) { 
    alert(m); 
}

Ausgang:

キンメダイ

Quelle

2016-04-13 08:58:05

Extra-Matching, wenn findtext() für mehrere ocurrences mit

Antwort

Verwandte Themen