2017-06-30 3 views
0

Meine Frage beinhaltet das Zusammenfassen eines Datenrahmens, in dem ich alle leeren Fälle löschen soll. Ich versuchte mit na.rm, aber nicht funktioniert, weil die Zeilen ohne Wert tatsächlich geschrieben wird "nicht verfügbar", dann bekam ich einen Fehler aufgrund fehlender Daten. umsah, was ich tun konnte ich über einen Skript kam, wo die Person, die Linien mit dem folgenden Befehl auswählen:Was bedeutet `== s ', wenn Daten untergliedert werden?

filtered <- x[x$State==s & 
    x$Hospital.30.Day.Death..Mortality..Rates.from.Heart.Attack != 'Not Available', 
    c("Hospital.Name","Hospital.30.Day.Death..Mortality..Rates.from.Heart.Attack")] 

ich das Thema festgelegt, wie die „nicht verfügbar“ wählen, aber ich didn‘ t verstehe, was die ==s tut. Kann mir das bitte jemand erklären?

+0

Allgemeiner auszuführen: '==' ist ein Test für die Äquivalenz. '2 == 2' gibt' TRUE' zurück, ebenso wie '4/2 == 2'. Dies unterscheidet es von einem einzelnen Gleichheitszeichen '=' welches in vielen Programmiersprachen (einschließlich R) ein Zuweisungsoperator ist (im Grunde eine Alternative zu <<-', aber in R sollten Sie weiterhin '<-') verwenden. – HFBrowning

Antwort

3

Ein paar Dinge hier:

  • Ihre subsetting Betrieb sofort drei Dinge tut:

    • alle Zeilen auszuwählen, wo die State Variable auf den Wert in der Variablen s gespeichert gleich ist (was vor der Ausführung dieser Zeile gesetzt sein musste, sonst würde ein Fehler auftreten); dies ist die Bedeutung von x$State == s ...
    • und (das ist, was die & Operator bedeutet) die Krankenhaus-30-Tage-Mortalität-Raten Variable fehlt nicht
    • und Auswahl nur der Name des Krankenhauses und Mortalitätsrate Spalten aus dem Datensatz (das ist, was das Bit nach dem , tut)
  • Wenn Sie die Daten in einer Datei read.csv() oder read.table() lesen verwenden, können Sie das na.strings Argument angeben Das „Nicht verfügbar“ sollte automatisch auf R fehlenden Wert umgewandelt bekommen, NA

  • Sie vielleicht Ihre lang benannte Variable umbenennen (es gibt praktisch Umbenennung Funktionen in den gdata, sjmisc, plyr und dplyr Pakete: ein Pick)
  • Sie auch subset von der Basis R oder filter und select von dplyr, können diese Operationen
+0

Vielen Dank sehr viel für die wirklich gute Erklärung, Ben. –

+0

für was es wert ist, StackOverflow bevorzugt, dass Sie * nicht * Kommentare verwenden, um "Danke" zu sagen; Wenn die gepostete Antwort Ihr Problem löst, können Sie stattdessen auf das Häkchen klicken, um es zu akzeptieren. –