Die FLOSSmole project sammelt und veröffentlicht monatlich Daten über alle Projekte Google Code.
Eine Liste der Projektinformationen einschließlich des Projektnamens und der Projektzusammenfassung ist verfügbar. Zum Beispiel hier ist ein Link zu dem Datensatz für November 2011:
Das Dateiformat ist ein Projekt pro Zeile, mit Tabulatoren getrennten Feldern. Das erste Feld ist der Projektname und das achte Feld ist die Projektübersicht. Also vorausgesetzt, Sie wget verwenden, um die Datei zu packen ...
wget http://code.google.com/p/flossmole/downloads/detail?name=gcProjectInfo2011-Nov.txt.bz2
bunzip2 gcProjectInfo2011-Nov.txt.bz2
cut -f 1,8 gcProjectInfo2011-Nov.txt
Ein paar Anmerkungen:
- Google Code hat mehr als 200.000 Projekte, so auch in gedrängter Form, aber das ist eine Menge von Daten!
- Offensichtlich ist dies eine Momentaufnahme von Google Code-Projekten, keine Live-, Echtzeit-Liste. Ich bin mir nicht sicher, ob einer existiert.
Ich würde es gerne mehr API freundlich ohne Curl oder andere Dinge tun, um diese Liste in DB zu speichern, aber wenn keine weiteren Möglichkeiten auftauchen, werde ich damit enden – canni