Um es zu wiederholen, was andere gesagt haben zu lesen.
- Es ist oft der Fall, dass str.length() = str.getBytes (!) .length(). Viele Betriebssysteme verwenden eine Codierung mit variabler Länge (wie UTF-8, UTF-16 or Windows-949).
- Verwenden Sie OutputStream.close Methoden, um sicherzustellen, dass alle Daten korrekt geschrieben werden.
- Verwenden Sie den Rückgabewert der InputStream.read, um zu sehen, wie viele Bytes gelesen wurden. Es gibt keine Garantie, dass alle Daten auf einmal gelesen werden.
- Be careful bei Verwendung der String-Klasse für die Codierung/Decodierung.
String-Kompression/Dekompression Methoden
private static byte[] compress(String str, Charset charset) {
ByteArrayOutputStream buffer = new ByteArrayOutputStream();
try {
OutputStream deflater = new GZIPOutputStream(buffer);
deflater.write(str.getBytes(charset));
deflater.close();
} catch (IOException e) {
throw new IllegalStateException(e);
}
return buffer.toByteArray();
}
private static String decompress(byte[] data,
Charset charset) {
ByteArrayOutputStream buffer = new ByteArrayOutputStream();
ByteArrayInputStream in = new ByteArrayInputStream(data);
try {
InputStream inflater = new GZIPInputStream(in);
byte[] bbuf = new byte[256];
while (true) {
int r = inflater.read(bbuf);
if (r < 0) {
break;
}
buffer.write(bbuf, 0, r);
}
} catch (IOException e) {
throw new IllegalStateException(e);
}
return new String(buffer.toByteArray(), charset);
}
public static void main(String[] args) throws IOException {
StringBuilder sb = new StringBuilder();
while (sb.length() < 10000) {
sb.append("write the data here \u00A3");
}
String str = sb.toString();
Charset utf8 = Charset.forName("UTF-8");
byte[] compressed = compress(str, utf8);
System.out.println("String len=" + str.length());
System.out.println("Encoded len="
+ str.getBytes(utf8).length);
System.out.println("Compressed len="
+ compressed.length);
String decompressed = decompress(compressed, utf8);
System.out.println(decompressed.equals(str));
}
(Beachten Sie, dass, da diese im Speicher Ströme sind, bin ich nicht being strict darüber, wie ich öffnen oder schließen.)
definieren „tut funktioniert nicht gut ". –