Ich habe mit der Verwendung von Graphen gespielt, um große Datenmengen zu analysieren. Es funktioniert großartig und macht wirklich Spaß, aber ich frage mich, was zu tun ist, wenn die Daten größer und größer werden?Ist es möglich, Graphen HBase zu speichern? Wenn ja, wie modelliert man die Datenbank, um eine Graphenstruktur zu unterstützen?
Lassen Sie mich wissen, ob es eine andere Lösung gibt, aber ich dachte daran, Hbase auszuprobieren, weil es horizontal skaliert und ich kann Analysen in der Grafik ausführen (der meiste Code ist bereits in Java geschrieben), aber ich bin unsicher Wie strukturiert man ein Diagramm in einer Nosql-Datenbank? Ich weiß, dass jeder Knoten ein Eintrag in der Datenbank sein kann, aber ich bin mir nicht sicher, wie man Kanten modelliert und Eigenschaften hinzufügt (wie Namen von Knoten, Attribute, Pagerank, Gewichte an Kanten, etc ..).
Sehen, wie hbase/hadoop ist nach großen Tabellen und Karte reduziert Ich vermute, es gibt eine Möglichkeit, dies zu tun, aber nicht sicher, wie. Irgendwelche Vorschläge?
Macht das auch Sinn, was ich versuche zu tun? Oder gibt es bessere Lösungen für Big-Data-Graphen?
Auf den Punkt - Sie können Graphen in Hbase speichern. Aber es ist nicht die beste Lösung, um verknüpfte Daten zu behandeln. Traversieren wäre problemanfällig. Sie müssen Filter zum Abrufen auf der Grundlage von Werten (Eigenschaftswerten) verwenden, falls die Knoten-ID (src-Knoten) als Zeilenschlüssel verwendet wird. Besser wäre es, die verfügbaren Graph-Datenbanken zu verwenden, die BigData unterstützen. Dies ist nur ein Vorschlag, keine Antwort, daher füge ich das über den Kommentarblock hinzu. –