Es gibt eine Reihe von Fragen darüber, wie man eine URL in Python parsen kann, diese Frage betrifft die beste oder pythonischste Methode.Pythonic URL Parsing
In meiner Analyse brauche ich 4 Teile: den Netzwerkstandort, den ersten Teil der URL, den Pfad und den Dateinamen und Querystring Teile.
http://www.somesite.com/base/first/second/third/fourth/foo.html?abc=123
sollte analysieren, in:
netloc = 'www.somesite.com'
baseURL = 'base'
path = '/first/second/third/fourth/'
file = 'foo.html?abc=123'
Der folgende Code das richtige Ergebnis erzeugt, aber es gibt bessere Möglichkeit, dies in Python zu tun?
url = "http://www.somesite.com/base/first/second/third/fourth/foo.html?abc=123"
file= url.rpartition('/')[2]
netloc = urlparse(url)[1]
pathParts = path.split('/')
baseURL = pathParts[1]
partCount = len(pathParts) - 1
path = "/"
for i in range(2, partCount):
path += pathParts[i] + "/"
print 'baseURL= ' + baseURL
print 'path= ' + path
print 'file= ' + file
print 'netloc= ' + netloc
exaktes Duplikat: http://stackoverflow.com/questions/258746/slicing-url-with-python –
Nicht ganz dasselbe wie 258746, diese Frage hatte ein etwas anderes Ziel und der Schwerpunkt der Frage war der beste (pythonische) Weg, um die Aufgabe zu erfüllen. –