Hallo Leute,
Ich möchte Strings aus einer UTF8 kodierten Datei einlesen. Wenn ich die Datei im Browser (Opera) oder einem UTF8 fähigen Editor öffne werden alle Zeichen korrekt dargestellt. Die Consolenausgabe in Java enthält allerdings viele nicht erkannte Zeichen.
Es geht dabei um folgenden Code:
Was ich bisher schon probiert habe:
a) fileLine=new String(buff.readLine().getBytes("UTF8"));
b) fileLine = new String(buff.readLine().getBytes(),"UTF8");
Weiters habe ich das Encoding unter General/Workspace von cp1252 auf UTF8 umgestellt.
Ich weiß jetzt leider nicht mehr weiter und auch im Internet finde ich nichts was mich weiterbringen könnte. Ich wäre euch sehr dankbar wenn mir jemand einen Hinweis geben könnte.
mfg
MStrike
Ich möchte Strings aus einer UTF8 kodierten Datei einlesen. Wenn ich die Datei im Browser (Opera) oder einem UTF8 fähigen Editor öffne werden alle Zeichen korrekt dargestellt. Die Consolenausgabe in Java enthält allerdings viele nicht erkannte Zeichen.
Es geht dabei um folgenden Code:
Code:
FileReader file = new FileReader("test.txt");
BufferedReader buff = new BufferedReader(file);
boolean eof = false;
String fileLine;
while (!eof)
{
fileLine = new String(buff.readLine().getBytes("UTF8"),"UTF8");
if (fileLine == null)
{
eof = true;
}
System.out.println(fileLine);
}
buff.close();
file.close();
Was ich bisher schon probiert habe:
a) fileLine=new String(buff.readLine().getBytes("UTF8"));
b) fileLine = new String(buff.readLine().getBytes(),"UTF8");
Weiters habe ich das Encoding unter General/Workspace von cp1252 auf UTF8 umgestellt.
Ich weiß jetzt leider nicht mehr weiter und auch im Internet finde ich nichts was mich weiterbringen könnte. Ich wäre euch sehr dankbar wenn mir jemand einen Hinweis geben könnte.
mfg
MStrike