Hallo,
Ich habe eine Frage bezüglich Encoding von natürlich-sprachlichem Text.
Wenn ich mit Java eine Text-Datei einlese, die in utf-8 kodiert ist, ohne dass ich beim Einlesen explizit etwas bezüglich Encoding-Format sage, z.B. benutze ich folgenden Code:
kann es dann irgendwelche Probleme geben, so dass Characters nicht richtig erkannt werden oder mein Java Programm zur Laufzeit abstürzt?
Dabei nehme ich an, dass mein Rechner für eine beliebige Sprache der Welt konfiguriert worden ist.
Vielen Dank im Voraus.
Ich habe eine Frage bezüglich Encoding von natürlich-sprachlichem Text.
Wenn ich mit Java eine Text-Datei einlese, die in utf-8 kodiert ist, ohne dass ich beim Einlesen explizit etwas bezüglich Encoding-Format sage, z.B. benutze ich folgenden Code:
Java:
BufferedReader br = new BufferedReader(new FileReader(file));
String line = br.readLine();
Dabei nehme ich an, dass mein Rechner für eine beliebige Sprache der Welt konfiguriert worden ist.
Vielen Dank im Voraus.