Ich habe einen Adapter, dessen Ziel ist, Forward-Iterator für Paar Werte pair<FeatureVector, Label>
bereitzustellen. In meiner internen Darstellung speichere ich Daten wie vector<pair<vector<strings>, Label>>
.Elegante Möglichkeit, Flattern Iterator für Vektor von Vektoren
So während Iterationen, muss ich es glätten und jedes einzelne string
, wandeln die kurzen Satz wie ist „heute Öltropfen massiv“, zu FeatureVector
In rohen Variante Ich habe so etwas wie:
{
{"Oil drops massively","OPEC surge oil produciton","Brent price goes up" -> "OIL_LABEL"},
{"France consume more vine", "vine production in Italy drops" -> "VINE_LABEL"}
}
und ich muss wandeln es in:
{
vectorize("Oil drops massively") -> "OIL_LABEL",
vectorize("OPEC surge oil produciton") -> "OIL_LABEL", ... ,
vectorize("vine production in Italy drops") -> "VINE_LABEL"
}
vectorize()
-> es ist eine Umwandlung von Satz spärlich Vektor so "Oil drops on NYSE" -> {0,1,0..0,1,0..0,1}
Der einfachste Weg wird sein, neue Vektor zu erstellen und es mit allen Daten zu initialisieren und dann Iteratoren zu verwenden, aber das ist ziemlich Ressource havy Betrieb, also idealerweise möchte ich diese Art der Konvertierung über jeden erfolgen Iteration. Was ist der eleganteste Weg für eine solche Umwandlung?
Dies ist eine vereinfachte Version der Datenstruktur zum Speichern von Textkorpus. Iteratoren müssen später bei der Klassifizierer-Initialisierung verwendet werden, die 2 Iteratoren benötigen: begin
und end
, die logisch der gleichen ist wie in vector
.
Wie genau müssen Sie iterieren?'for (:)' Schleife nur eine nach der anderen? – Yakk
Sie müssen jede 'string' im' vector' in einen 'FeatureVector' umwandeln oder Sie müssen den' vector' in einen 'FeatureVector' konvertieren? –
NathanOliver
Was ist 'FeatureVector'? Sie müssen was in was platt machen? – Barry