2016-09-17 7 views
0

Ich habe eine Datei, wobei ich die E-Index von I-Index so gefolgt sortieren müssen, dass die Datei, ich habe viele solche Indizes nicht nur die eine unten erwähnt:Sortierung alphanumerische und numerische Spalten zusammen

**chr3 148813677 148815677 ENSG00000071794:I1 -** 
chr3 148804104 148804291 ENSG00000071794:E1 - 
chr3 148804291 148804292 ENSG00000071794:E1 - 
chr3 148804292 148804309 ENSG00000071794:E1 - 
chr3 148804309 148804317 ENSG00000071794:E1 - 
chr3 148804317 148804341 ENSG00000071794:E1 - 
chr3 148802469 148802676 ENSG00000071794:E2 - 
chr3 148801419 148801522 ENSG00000071794:E3 - 
chr3 148793668 148793834 ENSG00000071794:E4 - 
chr3 148792002 148792135 ENSG00000071794:E5 - 
chr3 148791012 148791109 ENSG00000071794:E6 - 
chr3 148789370 148789444 ENSG00000071794:E7 - 
chr3 148802677 148804103 ENSG00000071794:I1 - 
chr3 148801523 148802468 ENSG00000071794:I2 - 
chr3 148793835 148801418 ENSG00000071794:I3 - 
chr3 148792136 148793667 ENSG00000071794:I4 - 
chr3 148791110 148792001 ENSG00000071794:I5 - 
chr3 148789445 148791011 ENSG00000071794:I6 - 
chr3 148789231 148789369 ENSG00000071794:I7 - 

wird

chr3 148789231 148789369 ENSG00000071794:I7 - 
chr3 148789370 148789444 ENSG00000071794:E7 - 
chr3 148789445 148791011 ENSG00000071794:I6 - 
chr3 148791012 148791109 ENSG00000071794:E6 - 
chr3 148791110 148792001 ENSG00000071794:I5 - 
chr3 148792002 148792135 ENSG00000071794:E5 - 
chr3 148792136 148793667 ENSG00000071794:I4 - 
chr3 148793668 148793834 ENSG00000071794:E4 - 
chr3 148793835 148801418 ENSG00000071794:I3 - 
chr3 148801419 148801522 ENSG00000071794:E3 - 
chr3 148801523 148802468 ENSG00000071794:I2 - 
chr3 148802469 148802676 ENSG00000071794:E2 - 
chr3 148802677 148804103 ENSG00000071794:I1 - 
chr3 148802677 148804103 ENSG00000071794:I1 - 
chr3 148804104 148804291 ENSG00000071794:E1 - 
chr3 148804291 148804292 ENSG00000071794:E1 - 
chr3 148804292 148804309 ENSG00000071794:E1 - 
chr3 148804309 148804317 ENSG00000071794:E1 - 
chr3 148804317 148804341 ENSG00000071794:E1 - 

durch irgendwelche Duplikat-IDs zu entfernen (in diesem Fall der ersten Reihe in fett), die 2 und 3 jeder Reihe zwischen den Spalten aus der aufeinanderfolgenden Ordnung sind. Kurz gesagt möchte ich meine Zeilen in Bezug auf die IDs esp alles nach ':' und die Positionen in der zweiten und dritten Spalte bestellen.

Antwort

2
$ sort -k 4,3 my_file 

chr3 148789231 148789369 ENSG00000071794:I7 - 
chr3 148789370 148789444 ENSG00000071794:E7 - 
chr3 148789445 148791011 ENSG00000071794:I6 - 
chr3 148791012 148791109 ENSG00000071794:E6 - 
chr3 148791110 148792001 ENSG00000071794:I5 - 
chr3 148792002 148792135 ENSG00000071794:E5 - 
chr3 148792136 148793667 ENSG00000071794:I4 - 
chr3 148793668 148793834 ENSG00000071794:E4 - 
chr3 148793835 148801418 ENSG00000071794:I3 - 
chr3 148801419 148801522 ENSG00000071794:E3 - 
chr3 148801523 148802468 ENSG00000071794:I2 - 
chr3 148802469 148802676 ENSG00000071794:E2 - 
chr3 148802677 148804103 ENSG00000071794:I1 - 
chr3 148804104 148804291 ENSG00000071794:E1 - 
chr3 148804291 148804292 ENSG00000071794:E1 - 
chr3 148804292 148804309 ENSG00000071794:E1 - 
chr3 148804309 148804317 ENSG00000071794:E1 - 
chr3 148804317 148804341 ENSG00000071794:E1 - 
Verwandte Themen