Ich bin immer noch sehr neu in R und ich entschuldige mich, wenn ich nicht die richtige Terminologie verwende. Ich bin daran interessiert, eine große Menge an Arbeitslosenversicherungs-Treuhandfonds-Daten aus dem Treasury Direct Online-Berichtabfragesystem (http://www.treasurydirect.gov/govt/reports/tfmp/tfmp_utf.htm) zu ziehen, und ich habe die Informationen unter Verwendung von readLines
erfolgreich abgerufen.Lesen und analysieren Sie eine irreguläre und gemischte ASCII-Datei in R
ESAA_OCT15 <- readLines('http://www.treasurydirect.gov/govt/reports/tfmp/utf/es/dfiw01015tses.txt')
was mir das Diagramm als Zeichenfolge Vektor gibt.
Gibt es eine Möglichkeit, die Zeilen dann zu parsen und in einen Datenrahmen zu verwandeln, damit ich sie zumindest übertreffen kann und die wichtigen Informationen leicht herausholen kann? Ich bin mir sicher, dass es auch eine andere Möglichkeit gibt, dies zu tun, aber die Berichte unterscheiden sich immer darin, welche Abschnitte des Buchhaltungscodes enthalten sind und wie viele einzelne Transaktionen enthalten sind, so dass ich nicht einmal sicher bin, wo ich damit anfangen soll.
Die Elemente, die ich brauche, sind das Datum, die Aktie/Par (Dollar-Transaktionsbetrag), der Transaktionscode und die Transaktionsbeschreibung. Die Summen wären nützlich, aber keineswegs notwendig.
Wenn man es auch dreht mit Excel sieht es aus wie
Das ist perfekt. Vielen Dank! – KevinS