2016-11-30 1 views
1

Ich habe eine csv, die wie folgt aussieht:Wie kann ich die Unicode-Tags in meinem CSV löschen?

"[u'Title, Volume.']",[u'19780620'] 
[u'Title 2.'],[u'19910607'] 
"[u'Catalogue.']",[u'19910429'] 

ich eine csv wollen, die wie folgt aussieht:

'Title, Volume.','19786020' 
'Title 2.','199110607' 
'Catalogue.','19910429' 

Ich würde es vorziehen, diese Terminals über Mac zu tun mit sed + regex, aber Ich nehme an, ich könnte auch Python benutzen. Ich habe alle Arten von regex versucht, und dies kam die nächste mindestens Anfang Charakter Probleme zu lösen:

sed 's/[\"\[u]//g' file.csv 

Aber es löscht all die ‚u‘ Zeichen - nicht nur die, die am Anfang . Wie kann ich eine Regex schreiben, die zu meinem gewünschten Ergebnis führt?

+0

ist das nicht nur ein Anzeigeproblem, wenn es nach csv ausgeschrieben ist, sind die 'u' Präfixe nicht entfernt? – EdChum

+0

Hatte gehofft, dass dies der Fall war, aber aus irgendeinem Grund werden sie alle in einem Texteditor angezeigt, den ich verwendet habe & Excel. –

Antwort

2

Ich habe drei separate sed-Befehle ausgeführt, weil ich nicht sicher bin, wie man sie aneinander reiht, aber am Ende angekommen bin.

sed -ie 's/"//g' file.csv 
sed -ie 's/\[[u]//g' file.csv 
sed -ie 's/\]//g' file.csv 

Noch elegantere Lösungen sind willkommen!

+1

Begleiten Sie sie! 'sed -e 's /" // g' -e 's/...' -e '...' Datei.csv " – fedorqui

Verwandte Themen