Ich habe eine Datei mit einer Liste von Wörtern, nicht zu unähnlich, die ich in meine MSSQL-Datenbank importieren möchte;konvertieren in ASCII-Zeichen VB.net ssis
Świętochłowice
Chełmiec
Wałcz
...
Ich möchte eine rudimentäre Umwandlung der polnischen Zeichen in ASCII zu tun, so dass sie durch meine DB analysiert werden kann. Ich verwende SSIS, um die Daten zu importieren, und deshalb verwende ich ein vb.net-Skript, um den Text vor dem Import zu ändern.
Ich habe es versucht;
Public Overrides Sub Input0_ProcessInputRow(ByVal Row As Input0Buffer)
Row.unsanitised1.Replace("Ą", "A")
Row.unsanitised1.Replace("ą", "a")
Row.unsanitised1.Replace("Ć", "C")
Row.unsanitised1.Replace("ć", "c")
Row.unsanitised1.Replace("Ę", "E")
Row.unsanitised1.Replace("ę", "e")
Row.unsanitised1.Replace("Ł", "L")
Row.unsanitised1.Replace("ł", "l")
Row.unsanitised1.Replace("Ń", "N")
Row.unsanitised1.Replace("ń", "n")
Row.unsanitised1.Replace("Ó", "O")
Row.unsanitised1.Replace("ó", "o")
Row.unsanitised1.Replace("Ś", "S")
Row.unsanitised1.Replace("ś", "s")
Row.unsanitised1.Replace("Ź", "Z")
Row.unsanitised1.Replace("ź", "z")
Row.unsanitised1.Replace("Ż", "Z")
Row.unsanitised1.Replace("ż", "z")
Row.sanitised = Row.unsanitised
Row.sanitised1 = Row.unsanitised1
End Sub
Wenn jedoch die Datei eingelesen wird, werden die Zeichen nicht richtig gelesen, sie kommen in mehr wie „L“, was mache ich falsch? Muss ich sie als Unicode einlesen?
Die Datei und das VBScript werden in Codepage 1200 gespeichert, um die polnischen Zeichen zu erhalten.
verwenden Unicode-Code Seite 65001 –
@sandeeprawat Dank Unicode-Code Seite 65001 scheint zum größten Teil zu arbeiten. Es fehlt Ó & ó aus irgendeinem Grund, auch wenn die Daten analysiert werden, sieht es für mich identisch aus. – Intern87
Ich würde vorschlagen, Ihre Idee mit dem Unicode zu versuchen. Ich hatte ein ähnliches Problem (mit leicht verschiedenen zu ersetzenden Zeichen) und es funktionierte gut nach dem Überprüfen und Ersetzen der Unicode-Codes anstelle der Zeichen selbst. – Tyron78