2017-01-31 4 views
0

Für meine Masterarbeit verwende ich neben einer Python-Pipeline ein 3rd-Party-Programm (SExtractor), um mit astronomischen Bilddaten zu arbeiten. SExtractor nimmt eine Konfigurationsdatei mit zahlreichen Parametern als Eingabe, die (nach einigen Zwischenschritten) die Statistik meiner Daten beeinflusst. Ich habe schon viel zu viel Zeit damit verbracht, mit den Parametern herumzuspielen, also habe ich ein wenig in das maschinelle Lernen hineingeschaut und ein grundlegendes Verständnis gewonnen.Maschinelles Lernen zur Parameteroptimierung

Ich frage mich jetzt: Ist es sinnvoll, einen maschinellen Lernalgorithmus zu verwenden, um die Parameter des SExtractors zu optimieren, wenn die einzige Methode, um die Leistung oder Qualität der Parameter zu beurteilen, ist mit den endgültigen Statistiken des Analysenlaufs (das dauert mindestens eine Stunde auf meiner Maschine) und es gibt mehr als 6 Parameter, die die Statistik beeinflussen.

Als Beispiel habe ich 2 verschiedene Versionen der Statistiken, auf die ich mich beziehe, aus leicht unterschiedlichen Versionen von Sextractor-Parametern aufgenommen. Die rote Linie im linken Bild ist der Medianwert der Standardabweichung (wie es sein sollte). Die blaue Linie ist der Median der Standardabweichung, wenn ich sie erhalte. Die richtigen Bilder zeigen die Unterschiede der Objekte in den 2 Datensätzen.

Ich weiß, dass dies eine sehr spezifische Frage ist, aber da ich neu im maschinellen Lernen bin, kann ich nicht wirklich beurteilen, ob das möglich ist. Es wäre also großartig, wenn mir jemand vorschlagen könnte, dass dies ein sinnloses Unterfangen ist und mich auf das Recht hinweisen. Example 2Example 1

+1

Ich denke, Sie sollten diese Frage auch auf [Cross Validated] (http://stats.stackexchange.com/) stellen. – Thomas

+0

@Thomas, danke für den Tipp. Ich wusste nicht einmal, dass es ein solches Forum gibt. –

+0

Haben Sie eine "Grundwahrheit" für die Statistiken, die Sie erhalten möchten? – ginge

Antwort

0

Sie können eine fundierte Vermutung basierend auf den Daten, die Sie bereits haben, versuchen. Sie versuchen, die Parameter so zu optimieren, dass der Median der Standardabweichung den gewünschten Wert hat. Sie könnten verschiedene Modelle annehmen und versuchen, die Parameter basierend auf dem Modell und den geschätzten Daten zu schätzen. Aber ich denke, Sie sollten ein gutes Verständnis von maschinellem Lernen haben, um dies zu tun. Mit gut verstehe ich einen Undergraduate-Kurs.

Verwandte Themen