2016-12-22 4 views
0

Ich bin neu in Machine Learning und Statistik (nun, ich habe Mathe in meiner Universität gelernt, aber das war vor 10-12 Jahren) Könnten Sie bitte die Bedeutung des folgenden Satzes von 4 Seite erklären (in einem Buch 5 Seite) aus dem Buch hier (https://www.researchgate.net/publication/227612766_An_Empirical_Comparison_of_Machine_Learning_Models_for_Time_Series_Forecasting):Was bedeutet "Vektor auf 1 erhöht"?

die Multilayerperceptron (oft einfach neuronales Netz) genannt ist vielleicht die populäre Netzwerk-Architektur heute im Einsatz sowohl für die Klassifikation und Regression (Bischof [5]). Der MLP wird wie folgt gegeben: N H y = v0 + j = 1 X vj g (wj T x ') (1) , wobei x' ist der Eingangsvektor x, ergänzt mit 1 , dh x '= (1, xT) T, wj ist das Gewicht Vektor für j th versteckter Knoten, v0, v1,. . . , vN H sind die Gewichte für den Ausgangsknoten und y ist der Netzwerkausgang. Die Funktion g repräsentiert die Ausgabe des versteckten Knotens, und es wird im Sinne einer Quetschfunktion angegeben (und das ist, was wir verwendet haben) die logistische Funktion: g (u) = 1/(1 + exp (-u)). Ein ähnliches Modell in der Ökonometrie Literatur ist

Zum Beispiel haben wir ein Vektor x = [0,2, 0,3, 0,4, 0,5] wie ich es tun verwandeln ax 'Vektor vermehrt auf 1 x' erhalten = (1, x)

+0

x '= [1.0, 0.2, 0.3, 0.4, 0.5] (muss möglicherweise transponiert werden, wenn Sie einen Spaltenvektor benötigen) –

+0

danke, also, wenn x' = (1, x-transponiert) - transponiert, nach Formel haben wir eine Doppeltransponierung und bekommen in der Folge einen Zeilenvektor \t x '= [1.0, 0.2, 0.3, 0.4, 0.5] –

+0

Ist es richtig? –

Antwort

1

Dies ist Teil des Isomorphismus zwischen Matrizen und Gleichungssystemen. Was Sie im Moment haben, ist eine Reihe entspricht einem rechtsseitigen Ausdruck, wie

w1 = 0.2*x1 + 0.3*x2 + 0.4*x3 + 0.5*x4 
w2 = ... 
w3 = ... 
w4 = ... 

Wenn wir das System lösen wollen, müssen wir die Matrix erhöhen. Dazu muss der Koeffizient jeder Variablen addiert werden. Sie sind trivialerweise alle Einsen:

1*w1 = 0.2*x1 + 0.3*x2 + 0.4*x3 + 0.5*x4 
1*w2 = ... 
1*w3 = ... 
1*w4 = ... 

... und das ist, wo wir die erweiterte Matrix erhalten. Wenn wir die Variablen nach Position annehmen - w nach Zeile, x nach Spalte - bleiben nur die Koeffizienten in einer schönen Matrix übrig.