2009-10-06 17 views
5

Die Graphengröße liegt in Milliarden von Knoten und Dutzenden von Milliarden von Vertices.Speichern eines großen gerichteten ungewichteten Graphen mit Milliarden von Knoten und Scheitelpunkten

Es speichert Webseiten URLs und Links zwischen Webseiten und es wird zum Testen von Ranking-Algorithmen verwendet.

Jede Sprache ist in Ordnung, aber Java ist bevorzugt.

Lösungen die ich bisher gefunden:

  1. neo4j
  2. in sortierter flachen Dateien zu speichern

Ja, habe ich schon gelesen Best Way to Store/Access a Directed Graph.

aktualisieren

Die Daten können auf mehreren Computern verteilt werden und muss nicht vollständig im Speicher sein.

+0

Ihre Frage etwas vage ist, brauchen Sie eigentlich Zugriff auf alle Daten-Set? Oder visualisierst du nur die Verbindungsknoten. Was ich normalerweise tue und was viele in meinem Bereich tun, ist einfach eine breite berechnete Stichprobe der Daten zu nehmen und sie dann anzuzeigen. Dies ist möglicherweise nicht genau genug, abhängig von Ihrem Bedarf. – slimbo

+0

Müssen Sie Ihre Daten im Speicher behalten? Wenn ja, vergessen Sie es einfach ... Klären Sie Ihre Frage oder erwägen Sie die Verwendung von Off-Memory-Speicher (indizierte Datenbank). – NewbiZ

+0

@Steve: Der Ranking-Algorithmus muss alle Links scannen, um einen Wert pro Link auszugeben. Die Verwendung einer Teilmenge/Stichprobe funktioniert also nicht. – elhoim

Antwort

Verwandte Themen