Hi,
ich habe Texte in einem (wie es scheint) HTML-codierten, dezimalen unicode-Format vorliegen, also Beispielsweise diesen:
كل شيء له نهاية
In diesem Fall sind es irgendwelche arabischen Zeichen. Wie schaffe ich es diese mit Java als UTF-8 codierte Strings zu verarbeiten, so dass ich eben jene "arabischen zeichen" in der konsole ausgeben kann?
Mein Ansatz wäre jetzt "&#" durch "\u" zu ersetzen die vierstelligen Zahlen nach HEX zu wandeln und das Semikolon zu streichen, so dass das resultierende format so aussähe: "\u063F\u..." Ich habe allerdings meine zweifel, dass es da nicht doch vielleicht eine elegantere Methode gibt?! Bin für jede Antwort dankbar!
EDIT:
LOL, dieses Forum (bzw. mein Browser) codiert die HTML-Zeichen natürlich korrekt, so dass hier tatsächlich arabische zeichen angezeigt werden, also der String welcher die Arabischen Zeichen ergibt hat das folgende format wobei "$" duch "&" zu ersetzen ist: (hoffe diesmal klappts):
$#1603;$#1604; $#1588;$#1610;$#1569; $#1604;$#1607; $#1606;$#1607;$#1575;$#1610;$#1577;
Also im Prinzip ist meine Frage nur:
Wie kriege ich die darstellung der Zeichen in Java so hin wie sie im Browser dargestellt werden?
ich habe Texte in einem (wie es scheint) HTML-codierten, dezimalen unicode-Format vorliegen, also Beispielsweise diesen:
كل شيء له نهاية
In diesem Fall sind es irgendwelche arabischen Zeichen. Wie schaffe ich es diese mit Java als UTF-8 codierte Strings zu verarbeiten, so dass ich eben jene "arabischen zeichen" in der konsole ausgeben kann?
Mein Ansatz wäre jetzt "&#" durch "\u" zu ersetzen die vierstelligen Zahlen nach HEX zu wandeln und das Semikolon zu streichen, so dass das resultierende format so aussähe: "\u063F\u..." Ich habe allerdings meine zweifel, dass es da nicht doch vielleicht eine elegantere Methode gibt?! Bin für jede Antwort dankbar!
EDIT:
LOL, dieses Forum (bzw. mein Browser) codiert die HTML-Zeichen natürlich korrekt, so dass hier tatsächlich arabische zeichen angezeigt werden, also der String welcher die Arabischen Zeichen ergibt hat das folgende format wobei "$" duch "&" zu ersetzen ist: (hoffe diesmal klappts):
$#1603;$#1604; $#1588;$#1610;$#1569; $#1604;$#1607; $#1606;$#1607;$#1575;$#1610;$#1577;
Also im Prinzip ist meine Frage nur:
Wie kriege ich die darstellung der Zeichen in Java so hin wie sie im Browser dargestellt werden?