Meine große tabstoppgetrennte Datei mit Text vor und nach, redigiertFilter aus Linien Regex
chr3Av1G678.1 chr2Bv1G678.9
chr1Av1G978.6 chr1Bv1G456.1
chr2Av1G123.4 chr2Bv1G678.3
chr1Av1G456.0 chr2Av1G784.22
mit Wie aus der Datei 1A-1B und 2A-2B abzuzufiltrieren? Damit ich nur 3A 2B habe und 1A 2A
import re
import sys
f=open('input.txt','r')
r=open('output.txt','w')
for line in f.readlines():
line = line.split()
if not (?) re.search(r'text1Av1', line[0]) and not (?) re.search(r'text1Bv1', line[1]):
r.write("\t".join(line)+"\n")
f.close()
r.close()
Warum filtern Sie "1A 1B" und "2A 2B" aus? Liegt es daran, dass die Nummer am Anfang jedes Buchstabens gleich ist? – asongtoruin
Ihre Filterbedingung ist nicht wirklich klar. Unter welchen Bedingungen möchten Sie Linien gefiltert? – kamikaze
Was möchten Sie behalten und was möchten Sie verlassen? Was sind die Kriterien? – Toto