Ich habe eine Liste von 200 Namen in einer Textdatei. Alle Zeichen in den Namen sind Kleinbuchstaben und variieren von 6 Zeichen oder 7 Zeichen und sind in mehrere Überschriften unterteilt. Einige haben Untertitel. Ich versuche, basierend auf dem Raum zu teilen, aber es endet, die Textdatei aufzuteilen durch den Raum zwischen jedem Abschnitt von Namen. Einige \n
wird auch gedruckt. Ich habe 2 verschiedene Ideen und stecke auf beiden fest.Parsing durch eine Textdatei
Header
subheading
namenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamename
Heading
Header
subheading
namenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamenamename
Am Ende versuche ich, den Header und subheader (die zwischen allen Kappen, alle lowercaps, und eine Mischung aus beidem variieren) und drucken nur die Namen zu ignorieren. Ich begann damit, alles als Liste anzuhängen, aber da ich den Text nicht richtig analysieren konnte, bekam ich Fehler oder druckte jeden Buchstaben jedes Strings einzeln aus.
path_to_file = 'pathgoeshere'
check_list = []
for word in open(path_to_file).read()
username = str(word)
check_list.append(username)
print username
List = open(path_to_file).readlines()
print List
for x in List:
user_name = str(x)
if user_name.lower():
print user_name
In meinem eigentlichen Code ist es für richtig, aber dies ist der jist von dem, was ich gesucht habe formatiert.
Am Ende möchte ich die Namen analysieren und zählen, ohne den überflüssigen Text zu zählen, den ich nicht brauche.
Ich bin mir nicht sicher, wohin ich von hier aus gehen soll.
http://stackoverflow.com/help/someone-answers –