Ich habe den 250G Dump von Freebase Daten heruntergeladen. Ich möchte meine Entwicklung nicht auf die Big Data übertragen. Ich möchte eine kleine Teilmenge der Daten extrahieren (kann eine kleine Domäne oder einige 10 Persönlichkeiten und ihre Informationen sein). Diese kleine Teilmenge wird meine Iterationen schneller und einfacher machen.Eine Teilmenge Daten von Freebase für schnellere Entwicklungsiteration extrahieren
Was ist der beste Ansatz zum Partitionieren der Freebase-Daten? Gibt es einen von Google/Freebase bereitgestellten Teilmengen-Download?
festlegen müssen Obwohl Sie mit ziemlicher Sicherheit wollen/common/Thema Aliase, etc und/type/object für name, es gibt viel mehr, was Sie wahrscheinlich auch wollen. Wenn Sie sich für die Film-Domain interessieren, möchten Sie wahrscheinlich auch Schauspieler, Ehepartner, Geburtsdaten, Nationalitäten usw., also werden Sie einige der Eigenschaften von dem eingeschlossenen Typ/Personen/Person wollen. Grundsätzlich ist wahrscheinlich alles, was ein eingeschlossener Typ von einem der Zieltypen ist, von potentiellem Interesse. –
zgrep $ '\ tns/Film.' freebase-rdf-2013-12-01-00-00.gz ergab null Zeilen. Fehle ich etwas? –
Hoppla, Copypasta Fehler an meinem Ende. Ich habe die Beispiele aktualisiert. Bitte versuchen Sie es noch einmal. –