2014-11-15 5 views
5

Ich versuche Vowpal Wabbit und bin dabei, herauszufinden, die Dateiformate für Training und Test erforderlich. Ich habe nach der Anleitung von https://github.com/JohnLangford/vowpal_wabbit/wiki/Tutorial und sehen, dass die folgenden das Format Trainingsdaten:Vowpal Wabbit Training und Test Datenformate

0 | price:.23 sqft:.25 age:.05 2006 
1 2 'second_house | price:.18 sqft:.15 age:.35 1976 
0 1 0.5 'third_house | price:.53 sqft:.32 age:.87 1924 

Für die Testdaten, ich habe nicht die Etiketten oder keine Ausgaben, sondern nur die Eigenschaften. Wie würde ich das schreiben? Ich habe versucht, nur die Funktionen wie folgt einzuschließen:

price:.23 sqft:.25 age:.05 2006 
price:.18 sqft:.15 age:.35 1976 
price:.53 sqft:.32 age:.87 1924 

Aber das gibt mir Ausnahmen, da es nicht das richtige Format ist. Ich habe auch versucht, die folgend und alle gib mir nur 0'en als Ergebnisse:

| price:.23 sqft:.25 age:.05 2006 
| price:.18 sqft:.15 age:.35 1976 
| price:.53 sqft:.32 age:.87 1924 

0 0 0 | price:.23 sqft:.25 age:.05 2006 
0 0 0 | price:.18 sqft:.15 age:.35 1976 
0 0 0 | price:.53 sqft:.32 age:.87 1924 

Wer das Format, das ich für sein Ziel sollte, zu wissen, nur die Eigenschaften? Danke für die Hilfe.

Antwort

6

Das Bar-Symbol (|) muss auch für die Prognosen im Format:

| price:.23 sqft:.25 age:.05 2006 
| price:.18 sqft:.15 age:.35 1976 
| price:.53 sqft:.32 age:.87 1924 

Wenn Sie die richtigen Etiketten nicht enthalten, vw den Test nicht Verlust berechnen kann, natürlich. Um die Vorhersagen zu erhalten, verwenden Sie vw -d test_set.vw -t -p predictions.txt. Der Trainingssatz im Tutorial (mit nur drei Beispielen) ist zu klein, um ein vernünftiges Modell zu trainieren.

+0

Danke Martin. Leicht zu merkende Regel: denke an das linke '|' Symbol in jeder Beispielzeile, als das Trennzeichen zwischen 1) was du vorhersagen willst (was leer sein kann) auf der linken Seite, und 2) was bekannt ist (Eingabemerkmale), auf der rechten Seite. – arielf

+0

Wie lade ich ein vorhandenes Modell, das ich während des Trainings ausgegeben habe? Ich möchte dieses Modell sowie einige Testdaten verwenden, um die Vorhersagen in eine Datei auszugeben. – intl

+1

@intl Wie beschrieben in https://github.com/JohnLangford/vowpal_wabbit/wiki/Tutorial 'vw -i house.model -t -d test.data -p Vorhersagen' –

Verwandte Themen