Ich habe eine französische Seite, die ich analysieren möchte, aber in Probleme beim Konvertieren der (UFT-8) html nach Latin-1.PHP: Konvertieren von UTF-8 HTML
class Test extends PHPUnit_Framework_TestCase {
private static function fromHTML($str){
return html_entity_decode($str, ENT_QUOTES, 'UTF-8');
}
public function test1(){
//REMOVE THE SPACE between the '&' and 'nbsp'. SO won't
//let me write it without the space
$strFrom = 'Wanted& nbsp;: les Chasseurs de Tamriel';
$strTo = 'Wanted : les Chasseurs de Tamriel';
$strFrom = self::fromHTML($strFrom);
$this->assertEquals($strTo, $strFrom);
}
public function test2(){
$strFrom = 'Remplacement d’Almalexia';
$strTo = 'Remplacement d’Almalexia';
$strFrom = self::fromHTML($strFrom);
$this->assertEquals($strTo, $strFrom);
}
}
test2 vervollständigt fein:
Das Problem wird in dem folgenden phpunit Testfall gezeigt. test1 scheint fehl zu schlagen, da der Speicherplatz nicht korrekt ist. Wenn er in ascii konvertiert wird, endet er als unbekanntes Zeichen ().
Wie würde ich sicherstellen, dass beide Tests bestanden werden?
Warum gibt es ein Leerzeichen zwischen dem '&' und 'nbsp;' Versuchen Sie das zu beheben? – Nate
Weil ich es nicht ohne das Leerzeichen schreiben kann, wie SO es in ein Leerzeichen umwandelt, wenn ich nicht – Yacoby
schreibe es als "& nbsp;". – Bombe