Hallo zusammen,
ich habe ein kleines Encodingproblem: Der Text in der Datei iso.txt ist (vermutlich) iso-8859-1 kodiert. Diesen möchte ich in eine UTF-Datei überführen. Knackpunkt dabei ist der Bindestrich (Bytewert 150). Das Ergebnis meiner Versuche ist in utf_java.txt zu besichtigen, wie man sieht wird der Bindestrich vermurkst. Ganz generell muss es aber funktionieren, mit einem Online-Konverter habe ich ein korrektes Ergebnis erzielt (utf_online.txt), da musste ich aber als Quellzeichensatz windows-1252 eingeben.
Mein Code:
Hat jemand eine Idee wie mans besser macht?
ich habe ein kleines Encodingproblem: Der Text in der Datei iso.txt ist (vermutlich) iso-8859-1 kodiert. Diesen möchte ich in eine UTF-Datei überführen. Knackpunkt dabei ist der Bindestrich (Bytewert 150). Das Ergebnis meiner Versuche ist in utf_java.txt zu besichtigen, wie man sieht wird der Bindestrich vermurkst. Ganz generell muss es aber funktionieren, mit einem Online-Konverter habe ich ein korrektes Ergebnis erzielt (utf_online.txt), da musste ich aber als Quellzeichensatz windows-1252 eingeben.
Mein Code:
Java:
PrintWriter out = new PrintWriter ( "c:\\utf_java.txt", "UTF-8" ) ;
FileInputStream byteStream = new FileInputStream("c:\\Inkonsistenzen\\iso.txt");
InputStreamReader characterStream = new InputStreamReader(byteStream, "ISO-8859-1");
int c;
while ((c = characterStream.read()) != -1)
{
out.print((char)c);
}
out.flush();
out.close();
characterStream.close();
Anhänge
Zuletzt bearbeitet von einem Moderator: