Trio type1 Chr Pos Allele rsID Gene
Sample11 type1 1 11105106 C/T rs2273345 MASP2
Sample11 type1 1 31342388 A/C/* 1:31342388 SDC3
Sample11 type1 1 33402334 GA/G-/++A rs36040674 RNF19B
Sample11 type1 1 38078171 G/+GT/+GTGT rs139353088 RSPO1
Sample11 type1 1 47074774 TCATGGTCTGATGGTCC/T----------------/ACATGGTCTGATGGTCC rs4275405 MOB3C
Sample11 type1 1 50883804 CTT/C--/CT- 1:50883804 DMRTA2
Sample11 type1 1 52947350 TA/++A/T- 1:52947350 ZCCHC11
Sample11 type1 1 84956161 CT/C-/++T rs556742567 RPF1
Sample11 type1 1 114940632 CAA/C--/CA- rs78184484 TRIM33
Ich weiß, wie das Auftreten der Spalte rsID zählen. Hier ist der Befehl, den ich von @ glenn jackman lernen, die ich die Anzahl der rsID haben kann.Anzahl Vorkommen in einer Spalte zählen und die gesamte Zeile
awk '{count[$7]++} END {for (word in count) print word, count[word]}' Nofilter.txt
Ich möchte die gesamte Zeile grep, die die RSID wiederkehrend ist.
grep if count[word]>3
Wie soll ich den Befehl basierend auf dem aktuellen ändern?
grep was? Möchten Sie Zeilen drucken, bei denen die Anzahl größer als eine Zahl ist? – karakfa
Ja, vielleicht ist Grep keine gute Idee? @ Karakfa – user3631848