2012-03-27 6 views
1

Zuerst sah ich diese Frage (Getting A File's Mime Type In Java), aber die ausgewählte Antwort ist nur ein Link.MIME-Typ-Erkennungsbibliothek für Java

Ich bin auf der Suche nach einer Möglichkeit, um den MIME-Typ einer Datei in Java zu bestimmen, und ich brauche ein Tool, das viele verschiedene Arten entdecken kann, weil ich einen Webcrawler mache und es viele verschiedene MIMEs behandelt .

Ich habe JMimeMagic verwendet und erscheint einfach und gut, aber ist Beta und es gibt einige Abstürze. Apache Tika macht eine Menge Dinge, einschließlich MIME-Erkennung, ist aber groß. Das Gleiche gilt für einige andere Bibliotheken.

Ich möchte wissen, ob es einige MIME-Erkennung spezifische Bibliothek (wie JMimeMagic, aber funktioniert) und das kann eine Menge von MIME-Typen erkennen, und nicht nur die Dateierweiterung verwenden. Wenn nicht, sind die größeren Bibliotheken wie Apache Tika die richtige Wahl?

Antwort

1

Apache Tika ist die bisher umfassendste Wahl. Ich würde vorschlagen, damit zu gehen.

+0

Ich kannte Tika vorher nicht, aber eine kurze Lektüre auf der Seite lässt mich denken, dass Tika weder umfassend noch angemessen für diesen Fall ist. Es scheint verwendet zu werden, um Inhalt aus einem ziemlich begrenzten Satz von Dateitypen zu extrahieren, nicht um den Mime-Typ einer Datei zu bestimmen. Im Vergleich zu "Magic" und speziell JMimeMagic, die viele hundert Arten unterstützen. Ich habe JMimeMagic vorher angeschaut und stimme zu, dass es zu kaputt ist, um es in einem Produktionssystem zu verwenden. –

+0

Ich habe Tika persönlich für einen ähnlichen Anwendungsfall benutzt und fand es ziemlich gut und empfehle dringend, es zu benutzen. – Drona

+0

Tika, neben Mime-Typ-Erkennung, macht viele andere Dinge. Es unterstützt die meisten Dateitypen. Es wird für die Mime-Erkennung und Inhaltsanalyse im Lucene-Projekt des Apache verwendet. – Drona