Ich schreibe einige Skripts, um einige Textdateien in Python zu verarbeiten. Vor Ort liest das Skript aus einer so einzelnen txt-Datei verwenden iwie Suche Zeichenfolge in einem Ordner von Textdateien mit Python
index_file = open('index.txt', 'r')
for line in index_file:
....
und Schleife durch die Datei eine passende Zeichenfolge zu finden, aber wenn Amazon EMR, die index.txt Datei per se wird mehrere TXT-Dateien aufgeteilt in in einem einzigen Ordner.
Also ich möchte das lokal replizieren und lesen von mehreren TXT-Datei für eine bestimmte Zeichenfolge, aber ich habe Mühe, sauberen Code zu finden, um das zu tun.
Was ist der beste Weg, um dies zu tun, während Sie minimalen Code schreiben?
Sie können os.walk verwenden, um alle Dateien im Verzeichnis abzurufen, durch sie zu durchlaufen und dann die übereinstimmende Zeichenfolgelogik für jede Datei anzuwenden. – pmaniyan