dort vergleichen. Ich bin ein begginer in Python, und ich bin zu kämpfen das tun folgendes:Python - Dateien vergleichen Zeichen in Zeile
Ich habe eine Datei wie diese (+ 10k Linie):
EgrG_000095700 /product="ubiquitin carboxyl terminal hydrolase 5"
EgrG_000095800 /product="DNA polymerase epsilon subunit 3"
EgrG_000095850 /product="crossover junction endonuclease EME1"
EgrG_000095900 /product="lysine specific histone demethylase 1A"
EgrG_000096000 /product="charged multivesicular body protein 6"
EgrG_000096100 /product="NADH ubiquinone oxidoreductase subunit 10"
und diese ein (+600 Zeilen):
EgrG_000076200.1
EgrG_000131300.1
EgrG_000524000.1
EgrG_000733100.1
EgrG_000781600.1
EgrG_000094950.1
Alle IDs der zweiten Datei sind in der ersten, so möchte ich die Linien der ersten Datei zu IDs des zweiten entspricht.
Ich schrieb das folgende Skript:
f1 = open('egranulosus_v3_2014_05_27.tsv').readlines()
f2 = open('eg_es_final_ids').readlines()
fr = open('res.tsv','w')
for line in f1:
if line[0:14] == f2[0:14]:
fr.write('%s'%(line))
fr.close()
print "Done!"
Meine Idee der ids Abgrenzung der Zeichen pro Zeile Suche war EgrG_XXXX einer Datei zur anderen entsprechen, einem dann schreiben Sie die Zeilen in eine neue Datei . Ich habe einige Modifikationen versucht, das ist nur der "Kern" meiner Idee. Ich habe nichts. In einer der Modifikationen bekam ich nur eine Zeile.
Sind die Zeilen der zweiten Datei immer mit '.1' abgeschlossen? – albert
In der Tat sortieren Sie den Inhalt von 'egranulosus_v3_2014_05_27.tsv' in die Reihenfolge 'eg_es_final_ids'? – roganjosh
Ja, alle Zeilen der zweiten Datei enden mit .1. –