Ich versuche, eine optimale Matching-Analyse mit TraMineR durchzuführen, aber es scheint, dass ich ein Problem mit der Größe des Datasets habe. Ich habe einen großen Datensatz von europäischen Ländern, der Beschäftigungszauber enthält. Ich habe mehr als 57.000 Sequenzen, die 48 Einheiten lang sind und aus 9 verschiedenen Zuständen bestehen. Um eine Vorstellung von der Analyse zu bekommen, hier ist der Kopf des Sequenzobjekts employdat.sts
:Problem mit großen Daten (?) Während der Berechnung von Sequenzabständen mit TraMineR
[1] EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-...
[2] EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-...
[3] ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-...
[4] ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-...
[5] EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-EF-...
[6] ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-ST-...
In einem kürzeren SPS-Format, das wie folgt lautet:
Sequence
[1] "(EF,48)"
[2] "(EF,48)"
[3] "(ST,48)"
[4] "(ST,36)-(MS,3)-(EF,9)"
[5] "(EF,48)"
[6] "(ST,24)-(EF,24)"
diese Sequenz Objekt Nach dem Passieren zur seqdist()
Funktion, erhalte ich die folgende Fehlermeldung:
employdat.om <- seqdist(employdat.sts, method="OM", sm="CONSTANT", indel=4)
[>] creating 9x9 substitution-cost matrix using 2 as constant value
[>] 57160 sequences with 9 distinct events/states
[>] 12626 distinct sequences
[>] min/max sequence length: 48/48
[>] computing distances using OM metric
Error in .Call(TMR_cstringdistance, as.integer(dseq), as.integer(dim(dseq)), : negative length vectors are not allowed
Ist dieser Fehler auf die große Anzahl von disti bezogen nct, lange Sequenzen? Ich benutze eine x64-Maschine mit 4GB RAM und ich habe es auch auf einer Maschine mit 8-GB-RAM versucht, die die Fehlermeldung reproduziert. Kennt jemand einen Weg, um diesen Fehler zu beheben? Darüber hinaus funktionierte die Analyse für jedes einzelne Land mit der gleichen Syntax mit einem Index für das Land gut und lieferte aussagekräftige Ergebnisse.
Bitte Code anzeigen – sashkello