2012-05-16 5 views
18

Ich würde gerne mit Algorithmen experimentieren, die Muster in Daten erkennen. Ich beschäftige mich mit vielen Arten von Sequenzen (Bildpixel, Texteingabe, Benutzerbewegung), und es würde Spaß machen, Pattern Recognition zu verwenden, um zu versuchen, aussagekräftige Daten aus verschiedenen Datensätzen zu ziehen. Wie der Großteil des Webs sind meine Daten meist auf Text oder Integer-Key basiert.Mustererkennungsalgorithmen in Node.js oder PHP?

Gibt es irgendwelche Klassen, die den grundlegenden Rahmen für das Überprüfen/Erstellen von Mustern für PHP oder Nodejs geben?

+3

Ist PHP/JS das richtige Werkzeug dafür? – webbiedave

+3

@webbiedave, da ich PHP und node.js Anwendungen bereits auf diesen Daten arbeiten. Es ist das * Recht-genug * Werkzeug für leichtes Arbeiten. Vielleicht wäre C besser, aber meine Anwendungen sind nicht in C. – Xeoncross

+0

Ich denke auch, dass beide Sprachen wegen der kein Thread-Modell vollständig saugen würde. Ich würde zum Beispiel so etwas wie Java verwenden. Auch ich denke, das ist ein ziemlich hartes Problem und wahrscheinlich noch nicht gelöst ..? – Alfred

Antwort

11

Ich habe noch nie eine einzelne Bibliothek gefunden, die verschiedene Analysemuster einkapselt. Sie können jedoch leicht spezifische Lösungen finden.

N-Gram-Analyse kann zum Beispiel mit dieser PHP-Erweiterung erfolgen: http://pecl.php.net/package/TextCat

Es gibt mehr Bayes-Implementierungen als auch, sogar Tutorials.

Ich habe noch nie Kohonen-Netze oder selbstorganisierende Karten in PHP implementiert gefunden, aber mehrschichtige Perceptrons sind trivial. IA kann Musteranalysen ziemlich gut durchführen.

Es gibt Projekte, die PHP an OpenCV binden (eine Bibliothek für Echtzeit-Bild-/Videoanalyse). Derzeit ist die einzige Implementierung, die ich kenne, die Erkennung von menschlichen Gesichtern in Bildern. Die Quelle ist geöffnet https://github.com/infusion/PHP-Facedetect, so sollte es einfach sein, andere OpenCV-Güte zu binden (OpenCV kann eine Menge Zeug mit Bildern machen).

PHP selbst wird interpretiert, die meisten schweren Lösungen für die Musteranalyse werden unter dieser Einschränkung nicht gut funktionieren. Aus diesem Grund sind die meisten Lösungen in PHP in C als Erweiterung geschrieben.

+0

Diese beiden Projekte sind ein guter Anfang, aber ich suche nach fortgeschritteneren/vollständigen Beispielen, einschließlich anderer Formen der Textverarbeitung neben einem grundlegenden [Bigramm-Filter] (https://gitorious.org/textus/php-language-detection) (Textkatze). – Xeoncross

+0

Ich stimme der letzten Aussage zu. Wenn Sie versuchen, einige schwere Berechnungen mit PHP durchzuführen, möchten Sie vielleicht untersuchen, wie Sie es in C machen und dann eine benutzerdefinierte Erweiterung erstellen. – afuzzyllama

3

für maschinelles Lernen Sie sich anschauen sollten eine Sprache verwenden, die mehr ‚zu Hause‘ ist, wie es einfacher sein würde, das Modell zum Ausdruck bringen ..

der Quellcode für die neue Zum Beispiel ‚Machine Learning für Hacker‘ Buch, in R geschrieben in Github https://github.com/johnmyleswhite/ML_for_Hackers

Und dann finden, gibt es auch die Google Prediction API, die zum experimentieren https://developers.google.com/prediction/docs/developer-guide

0

gut ist ich weiß, dies ist eine alte Frage, aber da es kam der Anfang einer Google-Abfrage, es t hought sollte es einen Verweis auf die Knotenbindungen für opencv, node-opencv enthalten.