Hallo,
ich habe eine etwas merkwürdige Frage.
Dabei geht es um das matchen von Wörtern.
Ich habe ein Standardisierungstool geschrieben. Dieses konvertiert z.B.Jürgen in JUERGEN.
Im Programm sieht das in etwa so aus:
So, verschiedene DBs benutzen ja verschiedene Charsets. Meine Frage ist: Ist java "charset" unabhängig? Also wenn jemand UTF-8 verwendet und liest die Datei ein die den Charset verwendet, würde die Methode die Umlaute dann erkennen?
Wenn nun jemand komplett anderes mit irgnd einem anderem charset auf seinem System die Methode verwendet, werden dort dann auch die Umlaute erkannt. Also was ich meine ist: Eigentlich sollte es ja kein Problem darstellen die Methode so zu belassen wie sie ist, oder muss ich irgendwie auf Charsets Rücksichtnehmen. Die Methode soll natürlich auf jedem System mit jedem Charset anwendbar sein.
ich habe eine etwas merkwürdige Frage.
Dabei geht es um das matchen von Wörtern.
Ich habe ein Standardisierungstool geschrieben. Dieses konvertiert z.B.Jürgen in JUERGEN.
Im Programm sieht das in etwa so aus:
Java:
/**
* converts Ä,Ö,Ü,ß into AE,OE,UE,SS
*
* @param current_name
* @return current_name with its converted Umlaute
*/
public static String convertUmlaut(String current_name) {
current_name = current_name.toUpperCase();
current_name = current_name.replace("ß", "SS");
current_name = current_name.replace("Ä", "AE");
current_name = current_name.replace("Ö", "OE");
current_name = current_name.replace("Ü", "UE");
return current_name;
}
So, verschiedene DBs benutzen ja verschiedene Charsets. Meine Frage ist: Ist java "charset" unabhängig? Also wenn jemand UTF-8 verwendet und liest die Datei ein die den Charset verwendet, würde die Methode die Umlaute dann erkennen?
Wenn nun jemand komplett anderes mit irgnd einem anderem charset auf seinem System die Methode verwendet, werden dort dann auch die Umlaute erkannt. Also was ich meine ist: Eigentlich sollte es ja kein Problem darstellen die Methode so zu belassen wie sie ist, oder muss ich irgendwie auf Charsets Rücksichtnehmen. Die Methode soll natürlich auf jedem System mit jedem Charset anwendbar sein.