2017-05-09 4 views
-3

Ich bin ein derzeit auf der Suche bei einem meiner Aufgaben bei der Arbeit, und ich bin am überlegen einige bestimmten Ideen und neue Ansätze zu lösen, um es anzuwenden, so dass ich hoffe wirklich, dass ich bekommen kann Hilfe von den Experten auf dem Gebiet :-).Wollen Maschine Lernalgorithmus zur Analyse komplexer Daten

Ich führe gerade eine Analyse eines komplexen Datensatzes historischer Daten durch, der die Beziehung zwischen den Kosten für den Bau einer Offshore-Plattform und den erkannten Ressourcen für das aktuelle Feld darstellt (alternativ kann der Mittelwert der Jahresproduktion verwendet werden). Jeder Datenpunkt verfügt über eine Reihe von Parametern wie geographische Herkunft, Art des Hauptkohlenwasserstoffs, Wassertiefe, Entfernung zur nächsten Infrastruktur, Art der Plattform usw. (insgesamt 10 Parameter). Die Idee ist, eine Trendlinie zu konstruieren, die verwendet werden könnte, um die Kosten der zukünftigen Felder vorherzusagen, da die Produktion/Ressourcen der letzteren immer gemeldet werden.

Eine allgemeine Trend ist, so dass die Kosten, wenn die Ressourcen/Produktionserhöhung steigen. So kann eine gewisse Linearität leicht im Modell beobachtet werden, jedoch ist die einfache lineare Regression in diesem Fall zu dumm, da wir viele verschiedene Informationen im Datensatz haben.

Ich habe Grad meines Master in angewandter Mathematik mit Spezialisierung in numerischen Methoden und PDEs, aber was ich bin vor ist jetzt ein ziemlich gemeinsames statistisches Industrie-Problem. Ich nehme auch an, dass diese Aufgabe ein perfekter Kandidat ist, der durch die Anwendung von Algorithmen des maschinellen Lernens gelöst werden kann, da immer mehr Datenpunkte hinzugefügt werden und die Kurve/Trendlinie dazu verwendet werden kann, die Kosten zukünftiger Felder vorherzusagen Produktion/Ressourcen und Natur (Parameter). Allerdings bin ich völlig neu in diesem Bereich, so dass jeder Kommentar, Informationen usw. von Ihnen hoch :-)

Vielen Dank im Voraus geschätzt werden würde

+1

Willkommen bei Stackoverflow. Zuerst - siehe http://stackoverflow.com/help/how-to-ask - sollten Sie eine spezifische Frage haben, um eine spezifische Antwort zu erhalten, kann diese Frage geschlossen werden, da sie auf der Grundlage von Meinungen basiert. Obwohl wir versuchen werden, Ihnen zu helfen – gusto2

Antwort

0

Diese Frage ist IMHO sehr breit und nicht wirklich spezifisch, so dass Sie kann breit eine nicht spezifische Antwort bekommen.

Ich glaube, Sie haben einen schönen Anwendungsfall für die Implementierung von maschinellem Lernen. Gute Arbeit.

würde ich empfehlen, einige „How-to“ Ressourcen zu erhalten, die sehr praktisch und pragmatisch ist. Ich habe es wirklich genossen this ML course und es könnte Ihnen zeigen, wo Sie anfangen und wie entlang praktischen Ansatz, wie Teilungsdaten zum Lernen, Test und Kreuzvalidierung Sets, Normalisierung, Regularisierung, abgeleitet Merkmale, um fortzufahren ... etc.

Im Allgemeinen - Sie haben bereits festgestellt, dass Ihr Problem aussieht wie eine überwachte Maschine mit mehreren Funktionen lernen. Die lineare Regression funktioniert möglicherweise nicht vollständig (wie Sie bereits erwähnt haben), Sie können versuchen, ein komplexeres Modell zu erstellen, jedoch nicht zu kompliziert. Ich würde mit einem polynomialen Modell mit regulierten Parametern beginnen und sehen, ob einige abgeleitete Merkmale nicht passender wären.

Aber nur Sie können sehen, wie Ihre Daten aussehen und was mit dem Modell beginnen könnte :) Viel Glück

+0

Vielen Dank für Ihre Antwort! Ich stimme völlig zu, dass die Frage zu weit gefasst ist, und ich habe nicht erwartet, eine genaue Antwort darauf zu bekommen. Ich wollte nur jemanden, der mir den richtigen Weg zeigt. Und ich denke, Stack Overflow ist nur der beste Ort, wo ich diese Art von Rat bekommen kann. Ich werde mich definitiv für den Kurs in der Kurszeit einschreiben! Also nochmal, vielen Dank für deinen Kommentar –