utf-8 und java

miwieg · 21. Okt 2010

Hallo,

Ich habe eine Frage bezüglich Encoding von natürlich-sprachlichem Text.
Wenn ich mit Java eine Text-Datei einlese, die in utf-8 kodiert ist, ohne dass ich beim Einlesen explizit etwas bezüglich Encoding-Format sage, z.B. benutze ich folgenden Code:

Java:

BufferedReader br = new BufferedReader(new FileReader(file));
String line = br.readLine();

kann es dann irgendwelche Probleme geben, so dass Characters nicht richtig erkannt werden oder mein Java Programm zur Laufzeit abstürzt?
Dabei nehme ich an, dass mein Rechner für eine beliebige Sprache der Welt konfiguriert worden ist.

Vielen Dank im Voraus.

Der Müde Joe · 21. Okt 2010

Java:

BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream("foo.file"), Charset.forName("UTF-8")));

EDIT:
Na das nennt man mal decorator Pattern

EDIT2:
Ach ja und:
FileReader:

The constructors of this
* class assume that the default character encoding and the default byte-buffer
* size are appropriate. To specify these values yourself, construct an
* InputStreamReader on a FileInputStream.

das default encoding ist wohl je nach maschine verschieden. Win hat meist cp1251, Linux meisst UTF-8.
Letzthin war hat ich mal auf nem Debian ANSI-1968 oder so....

miwieg · 21. Okt 2010

Danke für den Code mit der expliziten Encoding-Anweisung. Meine Frage war allerdings, ob ich etwas befürchten muss, wenn ich auf diese explizite Anweisung verzichte?

KrokoDiehl · 21. Okt 2010

Der Müde Joe hat es dir doch quasi schon beantwortet: Wenn du nichts angibts, wird die Standardkodierung des Systems genommen. Die kann stimmen, muss aber nicht. UTF-8 ist zwar sehr freundlich zu 1-Byte-Zeichensätzen, kann aber auch Mehrbyte-Zeichen enthalten. In dem Fall bekommt man nur Müll, wenn man eine UTF-8-kodierte Datei mit cp1252 oder ähnlichem einliest. Ob der Fall in der Praxis auftritt ist eine andere Frage.

Gelöschtes Mitglied 20545 · 21. Okt 2010

Hallo,

bei der Codierungs-Geschichte hatte ich schon Probleme: Eine Datei unter Linux mit JavaProg XY bearbeitet, dann mit XY unter windows wieder ausgelesen: Umlaute zerstört. Wenn das Programm also plattformübergreifend arbeiten soll, sollte beim Schreiben und Lesen die Codierung explizit angegeben werden.

	Titel	Forum	Antworten	Datum
	Von C++ nach Java	Allgemeine Java-Themen	1	9. Apr 2025
	Java auf USB Stick	Allgemeine Java-Themen	5	20. Feb 2025
	Mitstreiter gesucht: Gemeinsam Java und Android Development lernen!	Allgemeine Java-Themen	5	25. Aug 2024
	Karriereberatung benötigt: Wie kann ich ein Java Full Stack Entwickler werden?	Allgemeine Java-Themen	7	21. Aug 2024
P	Java Access Bridge	Allgemeine Java-Themen	5	28. Mai 2024
W	ICEpdf PDF-Dateien werden mit Java 21 nicht nicht mehr vollständig dargestellt	Allgemeine Java-Themen	3	26. Mai 2024
	Grundsätzliche Frage zur Verwendung von Java Versionen??	Allgemeine Java-Themen	3	6. Mai 2024
	Java Deployment Vaadin	Allgemeine Java-Themen	3	16. Apr 2024
D	Hat Java eine Library um JavaScript auszuwerten?	Allgemeine Java-Themen	2	29. Feb 2024
	Wieso sind eigentlich JUnit-Tests in src/test/java platziert - nur Konvention?	Allgemeine Java-Themen	7	11. Feb 2024
N	LlaMA, KI, java-llama.cpp	Allgemeine Java-Themen	39	26. Dez 2023
V	Java-Codierungsherausforderung: Navigieren durch die Macken der Datumsmanipulation	Allgemeine Java-Themen	2	28. Nov 2023
E	Output Fehler (Java-Programm Kuchen)	Allgemeine Java-Themen	11	4. Nov 2023
M	java: unexpected type	Allgemeine Java-Themen	2	2. Nov 2023
	Java Input/Output Tests Junit	Allgemeine Java-Themen	3	22. Okt 2023
B	Java Discord bot auf ein Root Server?	Allgemeine Java-Themen	1	21. Okt 2023
	Java PKIX path building failed as non Admin	Allgemeine Java-Themen	15	17. Okt 2023
D	Linux, Java-Version wird nicht erkannt bzw. welche Einstellung fehlt noch?	Allgemeine Java-Themen	19	11. Okt 2023
	Java 21 Release	Allgemeine Java-Themen	5	19. Sep 2023
V	Umgang mit fehlenden Daten in einer Java-Datenanalyseanwendung	Allgemeine Java-Themen	5	15. Sep 2023
P	Fehler: Hauptklasse Main konnte nicht gefunden oder geladen werden Ursache: java.lang.ClassNotFoundException: Main	Allgemeine Java-Themen	24	13. Sep 2023
K	Java Anwendung machen Anleitung	Allgemeine Java-Themen	5	8. Sep 2023
G	java.io.listFiles()	Allgemeine Java-Themen	3	16. Aug 2023
	Frage zu Java Streams min / max	Allgemeine Java-Themen	17	16. Aug 2023
S	Java Programm lässt sich vom USB-Stick starten, aber nicht von HDD	Allgemeine Java-Themen	16	31. Jul 2023
K	Java-Projekt	Allgemeine Java-Themen	11	9. Jul 2023
K	Java-Projekt	Allgemeine Java-Themen	0	9. Jul 2023
	Welcher Browser unterstützt heutzutage noch Java Applets?	Allgemeine Java-Themen	5	23. Jun 2023
	Java-Klasse im extra cmd-Fenster ausführen	Allgemeine Java-Themen	3	31. Mai 2023
	Java Threads	Allgemeine Java-Themen	4	9. Mai 2023
G	java.io.listFiles()	Allgemeine Java-Themen	2	4. Mai 2023
N	Java Dynamic Proxy	Allgemeine Java-Themen	3	10. Apr 2023
N	Leichte Java Gegner Ki	Allgemeine Java-Themen	10	3. Apr 2023
A	Java modul Problem	Allgemeine Java-Themen	4	21. Mrz 2023
	Java Jar datei erstellen, von Projekt, dass auch Javafx Dateien, FXML Dateien und CSS Dateien, sowie Bilder enthält?	Allgemeine Java-Themen	14	21. Mrz 2023
V	Funktionale Schnittstelle in Java	Allgemeine Java-Themen	3	13. Mrz 2023
	Java String in Hashmap als Key NULL	Allgemeine Java-Themen	27	8. Mrz 2023
	Exception in thread "main" java.lang.Error: Unresolved compilation problem:	Allgemeine Java-Themen	7	6. Mrz 2023
	Wenn ich bei Intelij javafx mit maven importieren will, muss ich das in die pom.xml reintun, aber warum noch in module-info.java?	Allgemeine Java-Themen	3	25. Feb 2023
	Java 20 am 21. März	Allgemeine Java-Themen	1	24. Feb 2023
O	Java Website Stock Bot	Allgemeine Java-Themen	3	24. Feb 2023
J	Front-/Backend in Java	Allgemeine Java-Themen	14	10. Feb 2023
	JAVA Google Webcrawler	Allgemeine Java-Themen	1	29. Jan 2023
J	JavaScript innerhalb eines Java Projekts ausführen	Allgemeine Java-Themen	2	26. Jan 2023
A	Java Programm erstellen hilfe	Allgemeine Java-Themen	10	20. Jan 2023
G	java.lang.NoClassDefFoundError: org/aspectj/lang/Signature	Allgemeine Java-Themen	2	19. Jan 2023
	Java Aktienkurse nachfragen	Allgemeine Java-Themen	4	19. Jan 2023
J	Class to link Java	Allgemeine Java-Themen	4	18. Jan 2023
V	Wie funktioniert das Schlüsselwort "final" von Java?	Allgemeine Java-Themen	19	18. Jan 2023
	Inferenz JAVA	Allgemeine Java-Themen	6	15. Jan 2023
U	URI Rechner (Java Script)	Allgemeine Java-Themen	7	5. Jan 2023
	Java Geburtsdatum Textfeld	Allgemeine Java-Themen	7	30. Dez 2022
	Java 19 JavaDocs: Browserintegration	Allgemeine Java-Themen	1	19. Dez 2022
	Gleichzeitiges Ausführen und verbinden von 2 Java-Klassen über die Eingabeaufforderung und Eclipse	Allgemeine Java-Themen	21	5. Dez 2022
H	Java Rechner Programmierung der Mathematik	Allgemeine Java-Themen	33	1. Dez 2022
	Java Kara Auf einen Java Host laufen lassen	Allgemeine Java-Themen	17	29. Nov 2022
C	Fußnoten von DocX mit Java	Allgemeine Java-Themen	2	27. Nov 2022
C	Fußnoten in DocX mit Java	Allgemeine Java-Themen	1	27. Nov 2022
	Aussagenlogik in Java Programmieren	Allgemeine Java-Themen	22	18. Nov 2022
B	Per Java Word Dokument schreiben?	Allgemeine Java-Themen	8	10. Nov 2022
	Java-Bibliothek für ONVIF	Allgemeine Java-Themen	1	9. Nov 2022
	Oracle übergibt (Java Teile der) GraalVM Community Edition an OpenJDK Community	Allgemeine Java-Themen	2	26. Okt 2022
	Brauche Hilfe - Java Projekt kann nicht erstellt werden	Allgemeine Java-Themen	12	25. Okt 2022
B	Java mit command line und jars benutzen?	Allgemeine Java-Themen	18	22. Okt 2022
	Java Überprüfen ob .exe-Datei bereits ausgeführt wird	Allgemeine Java-Themen	2	19. Okt 2022
B	HTTP Allgemeine Fragen über Suchmaschine nutzen mit Java	Allgemeine Java-Themen	20	16. Okt 2022
	Wie kriege ich die Fehlermeldung "java: symbol lookup error: ..." weg?	Allgemeine Java-Themen	11	13. Okt 2022
K	Nachhilfe Java	Allgemeine Java-Themen	11	11. Okt 2022
	Java 19	Allgemeine Java-Themen	11	19. Sep 2022
F	IDEA IntelliJ Java Songliste erstellen	Allgemeine Java-Themen	6	15. Sep 2022
	Java bestimmtes Array auf den Wert 0 setzen	Allgemeine Java-Themen	32	19. Aug 2022
B	Java Reflection Probleme beim wehcselseitigen Referenzieren zweier Klassen/Objekte	Allgemeine Java-Themen	14	23. Jul 2022
	Sind alle Methoden in Java implizit virtuell	Allgemeine Java-Themen	2	6. Jul 2022
E	Java und integrierte Grafikkarten	Allgemeine Java-Themen	18	5. Jul 2022
	Wie wird die Typumwandlung bei Mehrfachvererbung in Java implementiert?	Allgemeine Java-Themen	3	4. Jul 2022
	Hilfe bei Java gesucht	Allgemeine Java-Themen	3	28. Jun 2022
A	Java unter Win 10	Allgemeine Java-Themen	1	11. Jun 2022
B	Woher kommen die Bildschirmkoordinaten beim java Robot?	Allgemeine Java-Themen	14	10. Jun 2022
	java.Lang Klassen fehlen in JRE System Library	Allgemeine Java-Themen	1	7. Jun 2022
T	Java Robot Class - Bot	Allgemeine Java-Themen	3	2. Jun 2022
E	Wie Java Heap Space vergrößern?	Allgemeine Java-Themen	3	26. Mai 2022
B	Java Programm auf virutellem Desktop laufen lassen?	Allgemeine Java-Themen	1	21. Mai 2022
D	VBA Code mit Java ausführen möglich?	Allgemeine Java-Themen	10	9. Mai 2022
	Threads, wie genau läuft das in Java ab? (Ich kann Threads erstellen und nutzen, nur das Verständnis)	Allgemeine Java-Themen	6	28. Apr 2022
	Java Home Pfad unabhängig von der Version	Allgemeine Java-Themen	7	25. Apr 2022
N	JAVA-Code mit Grafikfenster zeichnet in Windows, aber nicht Mac.	Allgemeine Java-Themen	4	24. Apr 2022
L	Java überprüfen lassen, ob sich ein gegebener Pfad / das Programm an sich auf einer CD oder Festplatte befindet	Allgemeine Java-Themen	14	21. Apr 2022
	CVE-2022-21449: Fehler in Java bei Signaturprüfung	Allgemeine Java-Themen	20	21. Apr 2022
	Java sql	Allgemeine Java-Themen	15	7. Apr 2022
	Unverständlicher Java code?	Allgemeine Java-Themen	21	4. Apr 2022
	XSD To Java - Überschreiben von Assoziationen	Allgemeine Java-Themen	1	30. Mrz 2022
	Comparisons and Swapa in Bubble-sort Java	Allgemeine Java-Themen	6	17. Mrz 2022
	Java 18	Allgemeine Java-Themen	8	10. Mrz 2022
N	Statistische Auswertung von Logfiles (Einlesen, auswerten und grafische Aufbereitung von logfiles) mit Java	Allgemeine Java-Themen	9	7. Mrz 2022
	Fragen aus einer Java Klausur	Allgemeine Java-Themen	67	1. Mrz 2022
Z	Mit Java 8+ Streams Zeilen nummern zu Zeilen hinzufügen	Allgemeine Java-Themen	17	10. Feb 2022
M	Verständnisfrage java.util.TimerTask	Allgemeine Java-Themen	2	2. Feb 2022
V	Hilfe mit Java Code	Allgemeine Java-Themen	4	30. Jan 2022
S	Processing Java Code verstehen	Allgemeine Java-Themen	4	28. Jan 2022
O	Newton Algorithmus Java	Allgemeine Java-Themen	1	27. Jan 2022

utf-8 und java

miwieg

Mitglied

Der Müde Joe

Top Contributor

miwieg

Mitglied

KrokoDiehl

Top Contributor

Gelöschtes Mitglied 20545

Gast

Ähnliche Java Themen

Aktuelle Jobs

Neue Themen