Ich benutze PyCharm 2016.3.2 mit Python 3.6 als der Interpreter zum Konvertieren von PDF-Dateien zu .TXT Der Code, den ich habe (siehe unten) funktioniert gut, aber es konvertiert Dateien sequenziell und langsam . Ich frage mich, ob ich meine 8-Core-CPU nutzen kann, um das ein bisschen schneller zu machen. Hier ist der Code:Parallelisieren einer Schleife über Datei liest in Python
from tika import parser
from os import listdir
for filename in listdir("C:\\Dropbox\\Data"):
text = parser.from_file('C:\\Dropbox\\Data'+filename)
with open('C:\\Dropbox\\Data\\textoutput\\'+filename+'.txt', 'w+') as outfile :
outfile.write(text["content"])
Ich bin neu in Python Codierung so jede mögliche Hilfe in diesen Codeblock Parallelisierung wird sehr geschätzt, da ich mit> 100.000 Dateien (65 GB +)
Dank zu tun habe !