Ich möchte etwas Text in der Datenbank mit den Django ORM Wrappern speichern. Das Problem ist, dass dieser Text durch das Abschaben von externen Websites generiert wird und oft scheint es, dass sie mit der falschen Kodierung aufgelistet sind. Ich möchte die rohen Bytes speichern, damit ich meine Codierungserkennung im Laufe der Zeit verbessern kann, ohne die Kratzer zu wiederholen. Aber Django scheint alles als Unicode speichern zu wollen. Kann ich das irgendwie umgehen?Wie behandelt man Unicode einer unbekannten Kodierung in Django?
1
A
Antwort
1
Sie können beispielsweise Daten speichern, die in base64 codiert sind. Oder versuchen Sie, HTTP-Header aus dem Browser zu analysieren, vielleicht ist es einfacher, von dort die richtige Kodierung zu bekommen.
1
Erstellen Sie eine Datei mit den Daten. Verwenden Sie einen Django models.FileField
, um einen Verweis auf die Datei zu halten.
Nein, es beinhaltet nicht eine Tonne I/O. Wenn Ihre Datei klein ist, werden 2 oder 3 E/A's hinzugefügt (das Verzeichnis gelesen, der iNode gelesen und die Daten gelesen).
Verwandte Themen
- 1. Wie behandelt man Unicode im Format \ uXXXX?
- 2. C/C++ plattformübergreifende Unicode-Kodierung
- 3. Wie behandelt man Web-Crawler in Django?
- 4. Wie behandelt man das Datum in Django?
- 5. Django, wie man pk und Objekt in einer Funktion behandelt
- 6. Wie behandelt man die Unicode-Zeichenfolge in URL in Python3?
- 7. Wie behandelt man Unicode-Werte in JSON-Strings?
- 8. Wie behandelt man Unicode-Zeichenfolgen in C/C++?
- 9. URL-Kodierung HTML in Django
- 10. Java --- Wie behandelt man die Deserialisierung einer unbekannten Anzahl von Byte []? - Java
- 11. Wie behandelt man KeyEvents in einer DataGridViewCell?
- 12. Unicode-Fehler in Django
- 13. Wie behandelt R Unicode/UTF-8?
- 14. Wie erkennt man die Kodierung einer Datei in Python?
- 15. Wie speichert man eine Datei in der richtigen Kodierung?
- 16. Wie behandelt Django mehrere Benutzer
- 17. Wie behandelt man Ausnahmen mit einer SqlDataSource
- 18. Wie behandelt man Ausnahmen?
- 19. Wie Datenbankausnahmen in Django behandelt werden
- 20. reproduzieren Unicode-Fehler in Django
- 21. Wie erstellt man eine Textdatei mit mehr als einer Kodierung?
- 22. Wie behandelt man Assets (CSS, JS usw.) mit Django?
- 23. Unicode-Fehler in Django-Admin
- 24. Django Admin Unicode in URLField
- 25. Wie behandelt man System.Data.Entity.Validation.DbEntityValidationException?
- 26. Array einer unbekannten Länge in C#
- 27. Wie man Methode mit unbekannten Parametern erzeugt?
- 28. django + unicode constant errors
- 29. Wie konvertiert man eine Kodierung in UTF-8 in Go?
- 30. Wie man EOFException behandelt?
Einige Prozent der Seiten codieren einfach ihre Daten oder haben eine inkonsistente Codierung auf der Seite. Ich möchte immer noch die Rohdaten speichern, damit ich zurückgehen und es genau sehen kann. – lacker