2016-04-22 2 views
-1

Ich möchte durch große Datenmenge in zwei neue Datensätze im Verhältnis von 70% - 30% zufällig aufgeteilt werden.Teilen Sie einen Datensatz in zwei neue Datenmenge basierend auf Prozentsatz der Aufteilung

Grundsätzlich muss ich 70% der zufälligen Werte von großen Dataset zu dem newdataset1 und 30% der zufälligen Werte von largedataset zu dem newdataset2 zuweisen.

Können Sie mir bitte mit einem SAS-Code helfen, der mir hilft, es zu erreichen.

Ein Dummy-Code wird wirklich helfen ..

Proc SQL- oder SAS-Anweisung. Alles wird mit mir arbeiten.

+0

Welcher Ansatz haben Sie versucht noch? Bitte sag es uns zuerst. – surajsn

+0

Schauen Sie sich 'proc surveyselect' online an und sehen Sie, wie Ihnen das helfen kann. Wenn Sie stecken bleiben, dann schreiben Sie eine andere Frage mit dem, was Sie versucht haben – Longfish

+0

Danke Keith, werde ich tun. – newbie49

Antwort

0

Für komplexes Beispieldesign (wie geschichtete Randomisierung, z. B.) PROC SURVEYSELECT ist ein Weg zu gehen, wie @Keith sagte. Aber für nur eine einfache zufällige Spaltung RANTBL -function den Trick:

data newdataset1 newdataset2; 
    set have; 
    flag=rantbl(-1, 0.7, 0.3); 
    if flag=1 then output newdataset1; 
    else output newdataset2; 
    run; 
Verwandte Themen