Ich möchte eine data.frame
basierend auf einer Bedingung in r unterteilen. Ich habe folgende data.frame
:Subsetting eines data.frame basierend auf einer Bedingung in R
df
id | message | cluster
-------+-----------------+----------------
1 | Test A | 1
2 | Test B | 1
3 | Test C | 3
4 | Test D | 1
5 | Test E | 2
6 | Test F | 2
7 | Test G | 3
8 | Test H | 3
9 | Test I | 1
10 | Test K | 2
11 | Test L | 4
12 | Test M | 4
ich eine neue data.frame
mit 4 (Anzahl der verschiedenen Cluster) Reihen bauen will. Ich wähle die erste message
als Vertreter des Clusters. Deshalb möchte ich die bekommen folgende data.frame
:
df2
id | message | cluster
-------+-----------------+----------------
1 | Test A | 1
3 | Test C | 3
5 | Test E | 2
11 | Test L | 4
'df2 <- do.call (rbind, von (df, df $ cluster, funktion (x) head (x, 1))) ' – JasonAizkalns
Bitte geben Sie Ihre Beispieldaten in einem reproduzierbaren Format wie' dput' –
oder 'df2 <- df [! duplicated (df $ cluster),] wird funktionieren. – lmo