2017-09-22 7 views
1

Zählen vermeiden ich einen Datensatz, die wie folgtWie doppelte Datenpunkte

enter image description here

ich jede Spezies hatte brauchen eine Zusammenfassung, wie viele Seiten pro StandType aussieht.

Also im Wesentlichen brauche ich R, um mir zu sagen, wie viele A, C und G ALFL hatte. und so weiter.

habe ich die Befehle

xtab1 <- xtabs(~SPECIES +StandType, X2016RawData) 

xtab1 

Diese mir einen Tisch gibt, der etwas sieht wie folgt aus.

A  C  G 
ALFL 3 1 0 
AMGO 1 0 0 
BTWB 0 0 1 
... 

Hier ist der Trick. Da das Sampling über mehrere Tage hinweg durchgeführt wurde, gibt es Duplikate für SPECIES und Sites.

In der Probe über Sie, dass ALFL in SITE A29 zweimal gesehen wurde sehen Ich kann nicht gehen und löschen Duplikate von Arten der Zählung für ALFL in StandType ‚A‘ bis 3 statt 2.

bringen pro Standtyp, da die eigentliche Rohdatendatei über 22.000 Datenpunkte an 400 Standorten enthält.

Wie bekomme ich R, um die gleiche Spezies einmal pro SITE zu zählen?

+0

SMasson, irgendwelche Updates? Wenn die Antwort funktioniert, "akzeptiere" sie bitte. Wenn nicht, ist es unwahrscheinlich, dass Sie weitere Hilfe ohne Feedback erhalten, um zu sagen, was damit nicht stimmt. – r2evans

Antwort

0

Wie wäre es ...

library(dplyr) 
X2016RawData %>% 
    select(-day) %>% 
    distinct() %>% 
    group_by(SPECIES, StandType) %>% 
    count()