2017-02-21 1 views
1

Ich habe zwei Datenrahmen, in denen beide Datenrahmen eine gemeinsame Spalte haben. Einer der Datenrahmen hat eine zusätzliche Zeile.Mischen Sie zwei data.frames, wobei einer der Datenrahmen eine zusätzliche Zeile enthält

> df1 
       type  x   y 
1     A  10   417 
2     B  2   575 
3     C  3   14 
4     D  944   205 
5     E  44   87 
6     F  355   883 
7     G  73   150 

> df2  
    X1 X2 X3 X4 X5 X6 term 
1 9 28 3 34 5 39 B 
2 43 7 39 41 46 32 C 
3 17 30 0 27 0 9 D 
4 42 32 1 10 26 49 E 
5 21 17 34 28 35 12 F 
6 16 10 18 25 2 0 G 

Ich möchte Spalte x, y von df1 anzuhängen, während DF2 Reihe Einfügen term A enthält, während NA für den Rest der Säulen eingeführt werden.

Das Ziel ist, Folgendes zu erhalten:

X1 X2 X3 X4 X5 X6 x y term 
    NA NA NA NA NA NA 10 417 A 
    9 28 3 34 5 39 2 575 B 
    43 7 39 41 46 32 3 14 C 
    17 30 0 27 0 9 944 205 D 
    42 32 1 10 26 49 44 87 E 
    21 17 34 28 35 12 355 883 F 
    16 10 18 25 2 0 73 150 G 

ich die Merge-Funktion mit gemeinsamen Spalte als term versucht, aber hat nicht funktioniert, dann fand ich eine Lösung

cbindPad <- function(...){ 
    args <- list(...) 
    n <- sapply(args,nrow) 
    mx <- max(n) 
    pad <- function(x, mx){ 
    if (nrow(x) < mx){ 
     nms <- colnames(x) 
     padTemp <- matrix(NA, mx - nrow(x), ncol(x)) 
     colnames(padTemp) <- nms 
     if (ncol(x)==0) { 
     return(padTemp) 
     } else { 
     return(rbind(x,padTemp)) 
     } 
    } 
    else{ 
     return(x) 
    } 
    } 
    rs <- lapply(args,pad,mx) 
    return(do.call(cbind,rs)) 
} 

Aber das tat es nicht arbeite entweder.

Antwort

1

Verwenden Sie merge. Beachten Sie, dass allgemeine Spalten unterschiedliche Namen haben: type für df1 und term für df2, daher sollten Sie diese Informationen an merge Funktion über by.x und by.y Argumente weitergeben. Stellen Sie auch all=TRUE ein.

> merge(df1, df2, by.x="type", by.y="term", all=TRUE) 
    type x y X1 X2 X3 X4 X5 X6 
1 A 10 417 NA NA NA NA NA NA 
2 B 2 575 9 28 3 34 5 39 
3 C 3 14 43 7 39 41 46 32 
4 D 944 205 17 30 0 27 0 9 
5 E 44 87 42 32 1 10 26 49 
6 F 355 883 21 17 34 28 35 12 
7 G 73 150 16 10 18 25 2 0 
+0

Sorry, ich benenne eigentlich um, um den gleichen Spaltennamen zu behalten, ich denke, wir können 'by.x =" type "verwenden, by.y =" type "' es hat funktioniert. Warten auf die Annahme als Antwort :) –

+1

@ Null-Hypothese, wenn gemeinsame Spalten die gleichen Namen haben, können Sie 'by = type' verwenden und' by.x = type' und 'by.y = type' loswerden. Siehe "Zusammenführen" –

Verwandte Themen