Wie lösche ich Nicht-UTF8-Zeichen aus einer Ruby-Zeichenfolge? Ich habe eine Zeichenfolge, die zum Beispiel "xC2" enthält. Ich möchte dieses Zeichen aus der Zeichenfolge entfernen, so dass es ein gültiges UTF8 wird.Löschen Sie Nicht-UTF-Zeichen aus einer Zeichenfolge in Ruby?
Dies:
text.gsub!(/\xC2/, '')
gibt einen Fehler zurück:
incompatible encoding regexp match (ASCII-8BIT regexp with UTF-8 string)
Ich war auf der Suche text.unpack ('U *') und string.pack als gut, aber nicht überall.
Sie könnten http://stackoverflow.com/questions/11375342/stringencode-not-fixing-invalid-byte-sequence-in-utf-8-error/ nützlich –