Ich habe Probleme mit dem Versuch, teilweise übereinstimmende Zeichenfolgen aus zwei Dateien zu kombinieren.Merge teilweise übereinstimmende Zeichenfolgen
Datei 1 enthält eine Liste eindeutiger Zeichenfolgen. Diese Strings werden teilweise abgestimmt auf eine Anzahl von Strings in Datei 2. Wie fusionieren ich die Zeilen in der Datei 1 mit Datei 2 für jeden Fall angepasst
File1
mmu-miR-677-5p_MIMAT0017239
mmu-miR-181a-1-3p_MIMAT0000660
File2
mmu-miR-677-5p_CTTCAGTGATGATTAGCTTCTGA
mmu-miR-677-5p_CTTCAGTGATGATTAGCTTCTGACT
mmu-miR-677-5p_TTCAGTGATGATTAGCTTCTGACT
mmu-miR-181a-1-3p_ACCATCGACCGTTGATTGTAC
mmu-miR-181a-1-3p_ACCATCGACCGTTGATTGTACC
gewünschter Ausgang
mmu-miR-677-5p_MIMAT0017239 mmu-miR-677-5p_CTTCAGTGATGATTAGCTTCTGA
mmu-miR-677-5p_MIMAT0017239 mmu-miR-677-5p_CTTCAGTGATGATTAGCTTCTGACT
mmu-miR-677-5p_MIMAT0017239 mmu-miR-677-5p_TTCAGTGATGATTAGCTTCTGACT
mmu-miR-181a-1-3p_MIMAT0000660 mmu-miR-181a-1-3p_ACCATCGACCGTTGATTGTAC
mmu-miR-181a-1-3p_MIMAT0000660 mmu-miR-181a-1-3p_ACCATCGACCGTTGATTGTACC
I hat versucht pmatch()
in R verwendet wird, b Aber mach es nicht richtig. Ich sehe aus wie etwas, mit dem Perl umgehen würde ??
Vielleicht so etwas wie folgt aus:
perl -ne'exec q;perl;, "-ne", q $print (/\Q$.$1.q;/?"$. YES":$. .q\; NO\;);, "file2" if m;^(.*)_pat1;' file1
, wenn ich von meiner CSV-Datei lesen klagt es über str kein Zeichen Vektor ist: ("?^* (= _)" File1,) Fehler bei stri_extract_first_regex: Argument 'str' sollte ein Zeichenvektor sein (oder ein Objekt, auf das ein Objekt erzwungen werden kann) – user3741035
Vielleicht solltest du' readLines' dafür benutzen? – gagolews
@ user3741035 Sie sollten zumindest versuchen, Dateien zu lesen, bevor sie übereinstimmen. Die Antworten hier gehen davon aus, dass Sie das Grundlegende zum Lesen/Schreiben von R-Dateien haben. – agstudy