Ich stieß auf wunderbare figure, die (wissenschaftliche) Autoren Zusammenarbeit über Jahre zusammenfasst. Die Figur ist unten eingefügt.Reproduzieren Liniendiagramm in Matplotlib oder R
Jede vertikale Linie bezieht sich auf einzelnen Autor. Der Beginn jeder vertikalen Linie entspricht dem Jahr, in dem der betreffende Autor seine erste Mitarbeiterin erhielt (d. H. Als sie aktiv wurde und somit Teil des Kollaborationsnetzwerks war). Autoren werden nach der Gesamtzahl ihrer Mitarbeiter im letzten Jahr (d. H. 2010) eingestuft. Die Farbgebung gibt an, wie die Anzahl der Mitarbeiter eines jeden Autors im Laufe der Jahre zugenommen hat (seit dem Zeitpunkt der Aktivierung bis 2010).
Ich habe einen ähnlichen Datensatz; anstelle von Autoren habe ich Keywords in meinem Datensatz. Jeder Zahlenwert bezeichnet die Häufigkeit des Begriffs in einem bestimmten Jahr. Die Daten wie folgt aussehen:
Year Term1 Term2 Term3 Term4
1966 0 1 1 4
1967 1 5 0 0
1968 2 1 0 5
1969 5 0 0 2
Zum Beispiel Term2
erstmals im Jahr 1967 mit der Frequenz 1 auftritt, während Term4
zunächst mit der Frequenz im Jahr 1966 treten 4. Die vollständige Datensatz here zur Verfügung steht.
Dies ist nicht sehr schwierig. Zeige deine eigenen Bemühungen und erkläre, wo du feststeckst. – Roland
Da Sie natürliche Bins (Autor ID und Jahr) haben, würde ich dies mit einer Heatmap/IMshow tun. Füllen Sie es mit 'np.nan' aus, um mit zu beginnen, und füllen Sie dann Werte mit ganzen Zahlen (unklar, wie es Bruchteilhaber gibt). Dann verwenden Sie einfach "ax.imshow" für den Hintergrund + "ax.plot" für diese über die geplottete Linie. – tacaswell