Endcoding Problem bei XML unmarshal

Tho82

Mitglied
Hallo,

wir haben probleme mit dem Encoding, und zwar werden arabische Zeichen nicht richtig dargestellt. Das Problem liegt vermutlich in dieser Methode:

Java:
/** 
* Converts an XML String to an XML annotated Object. 
* 
* @param xml 
* The XML string to convert. 
* @param clazz 
* The XML annotated class. 
* 
* @return The object which was converted from the xml. 
* */ 
public Object string2Object(String xml, Class<?> clazz) { 
  JAXBContext jc; 
  Object o = null; 

  try { 
    jc = JAXBContext.newInstance(clazz); 
    Unmarshaller um = jc.createUnmarshaller(); 
    o = um.unmarshal(new StringReader(xml)); 

  } catch (JAXBException e) { 
    LOGGER.error("Error on unmarshalling XML String. ", e); 
    throw new ConversionException("Error on unmarshalling XML String. ", e); 
  } 

  return o; 
}

Das Problem könnte doch an dem new StringReader(xml) liegen? Wie kann ich erzwingen, dass der xml String in UTF-8 unmarshalled wird?

Gruß und Danke schonmal,
Tho
 
Zuletzt bearbeitet von einem Moderator:
S

SlaterB

Gast
xml ist doch schon ein String, gib diesen aus, da sollten die Texte doch auftauchen,
sind sie dort noch korrekt oder auch schon fehlerhaft?

> Wie kann ich erzwingen, dass der xml String in UTF-8 unmarshalled wird?

wo wird den xml aus irgendwas, etwa einer Datei eingelesen?
einem InputStreamReader kann man ein CharSet mitgeben
 

Tho82

Mitglied
Dieser String ist eben fehlerhaft. Ich bekomme den String über einen REST Service herein. Das ist jetzt bissl tricky zu beschreiben, aber ich versuchs:

Der REST Service bekommt ein xml object übergeben. In diesem XML object ist ein tag mit einem String definiert, indem XML als String (im Beispiel unten im content tag) übergeben wird. Also in der Art:

[XML]
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<message>
...
<content>Hier das XML als String, ebenfalls mit definiertem UTF-8 encoding</content>
...
<message>
[/XML]


Und dieser String mit dem XML des content tags wird dann von mir von hand unmarshalled mit der beschriebenen Methode.
War nicht meine Idee das so zu machen (finde es bescheuert, xml als string in ein xml object einzubetten), aber gut,damit muss ich leben und eine Lösung finden.

Hier die Ausgabe in meinem Logfile mit eingeschaltenem Jersey Logging:

Code:
<message>
....
<content>&lt;?xml version=&quot;1.0&quot; encoding=&quot;UTF-8&quot; standalone=&quot;no&quot;?&gt;&lt;freetext xmlns=&quot;....&quot; xmlns:xsi=&quot;http://www.w3.org/2001/XMLSchema-instance" dir=&quot;ltr&quot;&gt;&lt;timestamp&gt;2011-10-25T08:14:05.468Z&lt;/timestamp&gt;&lt;subject/&gt;&lt;text&gt;شيبمشتي ششسي بشب&lt;/text&gt;&lt;/freetext&gt;</content>
....
</message>

Im text tag sieht man die falsch encodierten Zeichen.
 
Zuletzt bearbeitet:
S

SlaterB

Gast
da sind mir jetzt bisschen zu viele Komponenten zu ungenau eingebunden,
wenn du das Senden auch kontrollierst kannst du das XML vielleicht anders übertragen, Stichwort Base64-Encoding,
dann dürften die schlimmsten Zeichen umgangen werden

oder du nimmst den String so wie er aktuell ist und prüfst nur das Vorhandensein von Problemzeichen und ersetzt diese manuell,
schön sind diese Lösungen freilich nicht, vielleicht antwortet noch wer anders

> werden arabische Zeichen nicht richtig dargestellt.

ok, wenn es mehr Probleme als nur einzelne deutsche Umlaute gibt, dann wirklich Richtung Base64,
HTML-Encoding kann dabei wohl nicht helfen,
anderseits gibt es ja auch Webseiten, die die verrücktesten Sachen erfolgreich an Browser-Clients übertragen..
 
Zuletzt bearbeitet von einem Moderator:

Tho82

Mitglied
Das Problem ist, das senden macht eine andere Komponente, auf die ich keinen Zugriff habe. Wenn ich den Webservice mit dem REST Client testtool mit arabischen Zeichen aufrufe, funktioniert dies.

Kann es sein, dass man im HTTP Header noch ein Encoding setzen muss?
 

Tho82

Mitglied
da sind mir jetzt bisschen zu viele Komponenten zu ungenau eingebunden,
wenn du das Senden auch kontrollierst kannst du das XML vielleicht anders übertragen, Stichwort Base64-Encoding,
dann dürften die schlimmsten Zeichen umgangen werden

oder du nimmst den String so wie er aktuell ist und prüfst nur das Vorhandensein von Problemzeichen und ersetzt diese manuell,
schön sind diese Lösungen freilich nicht, vielleicht antwortet noch wer anders

> werden arabische Zeichen nicht richtig dargestellt.

ok, wenn es mehr Probleme als nur einzelne deutsche Umlaute gibt, dann wirklich Richtung Base64,
HTML-Encoding kann dabei wohl nicht helfen,
anderseits gibt es ja auch Webseiten, die die verrücktesten Sachen erfolgreich an Browser-Clients übertragen..

Kannst du mir ein Beispiel nennen?
 
S

SlaterB

Gast
wofür ein Beispiel wenn du eh nicht senden kannst,
wie genau hast du denn nun erstmals Zugriff auf die Daten, schon als String oder noch Bytes?
ich weiß nicht ob daraus nochmal schöne Daten werden, ich vermute dass dann richtig gearbeitet werden muss, Zeichen für Zeichen oder Byte für Byte anschauen und je nach schon automatisch eingebauten Problemen mehr manuell als offiziell umwandeln,

eine richtige Lösung kann ich also nicht nennen, das will ich sagen,
vielleicht wer anders bevor du irgendwas schlimmes versuchst von dem ich rede ;) (und kein Beispiel dazu posten werde)
 

Tho82

Mitglied
Zu meinem Verständnis :) Habe echt probleme, die encoding problematik zu verstehen, bzw. zu verstehen, wo genau das Problem aufgehängt ist. Ist das ein HTML Problem, ein XML problem, Problem des benutzen REST Frameworks, vielleicht sogar ein Problem unterschiedlicher Betriebssysteme (wobei ich das weniger vermute) --> Der Client ruft den WS von Windows aus auf, unser Appserver läuft auf Linux.

Hier der definierte Webservice, ich denke ich könnte schon irgendwie an den Bytestream rankommen, leider habe ich gerade keine Entwicklungsumgebung mit mir, aber meines wissens nach kann man an den context irgendwie rankommen über eine notation:

Code:
@POST
@Consumes({ MediaType.APPLICATION_XML })
@Path("delivermessage/")
public Response delivermessage(Message message) {
      
}
 
Zuletzt bearbeitet:

Tho82

Mitglied
Haben das Problem ausfindig gemacht. Auf unserer Seite hat alles gestimmt, die client Applikation, die unsere WS aufruft, muss mit dem Parameter -Dfile.encoding=UTF-8 gestartet werden, damit es funktioniert. Danke für eure Hilfe!
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
krgewb Problem mit Umlauten und Eszett bei InputStream Allgemeine Java-Themen 3
Max246Sch Backtracking Problem Box Filler Allgemeine Java-Themen 6
NightVision402 VisualVM Startskript Problem Allgemeine Java-Themen 3
javaBoon86 Email Server Connection Problem Allgemeine Java-Themen 1
F Problem mit PDFBOX Library Allgemeine Java-Themen 1
A Java modul Problem Allgemeine Java-Themen 4
D Read JSON File Problem Allgemeine Java-Themen 9
urmelausdemeis Exception in thread "main" java.lang.Error: Unresolved compilation problem: Allgemeine Java-Themen 7
J Problem mit JasperReports Allgemeine Java-Themen 8
M log4j Problem mit jlink Allgemeine Java-Themen 19
8u3631984 Problem beim Mocken von Record Klassen Allgemeine Java-Themen 4
torresbig Website login Problem - Jsoup, wie bisher, klappt nicht! Allgemeine Java-Themen 31
P Selenium . getText Problem Allgemeine Java-Themen 9
A Jar zu Exe Problem Allgemeine Java-Themen 13
sserio Variablen Liste erstellt und ein Problem mit dem Index Allgemeine Java-Themen 6
S Folgendes Problem bei einem Programm Allgemeine Java-Themen 1
stormyark Problem beim Klassen erstellen Allgemeine Java-Themen 1
A Thread.sleep Problem Allgemeine Java-Themen 2
A Problem bei der Nachbarschafttest Allgemeine Java-Themen 11
Splayfer Problem: no main manifest attribute Allgemeine Java-Themen 3
G javamail Problem beim Empfangen von Nachrichten Allgemeine Java-Themen 3
Splayfer JDA Problem mit MessageCounter Allgemeine Java-Themen 0
Splayfer Problem mit BufferedWriter Allgemeine Java-Themen 3
F Streams als Alternative für dieses Problem ? Allgemeine Java-Themen 15
N Maven Problem mit Datenbanktreiber (H2 Embedded) Allgemeine Java-Themen 12
T Problem beim Umwandeln in eine Jar-Datei Allgemeine Java-Themen 3
B Einfach Elemente zweier Arraylisten kreuz und quer vergleichen, min und max Problem? Allgemeine Java-Themen 16
C ArrayList Problem Allgemeine Java-Themen 3
kev34 nim-Spiel problem Allgemeine Java-Themen 1
D Firebase retrieve data Problem, Child Element wird nicht angesprochen Allgemeine Java-Themen 0
G Welches Problem besteht bei den Typparametern? Allgemeine Java-Themen 5
temi Problem mit Aufrufreihenfolge bei Vererbung Allgemeine Java-Themen 3
Sumo_ow "ArrayIndexOutofBoundsException: 2" Array Problem Allgemeine Java-Themen 6
T PIM basierend auf netbeans via AnyDesk Problem Allgemeine Java-Themen 3
xGh0st2014 Problem mit Java Array Allgemeine Java-Themen 1
Kirby.exe Verständnis Problem bei Rucksack Problem Allgemeine Java-Themen 6
B Eclipse-Lombok-Problem Allgemeine Java-Themen 19
I Input/Output ObjectOutputStream - Problem Allgemeine Java-Themen 7
1 Multiple Choice Knapsack- Problem Allgemeine Java-Themen 2
kodela Problem mit strukturiertem Array Allgemeine Java-Themen 18
E Problem mit Gridlayout und Button Allgemeine Java-Themen 2
A Array Problem Allgemeine Java-Themen 8
bueseb84 Problem Allgemeine Java-Themen 0
S Problem mit Arrays Allgemeine Java-Themen 1
D Nullpointer Exception Problem Allgemeine Java-Themen 5
B Problem mit meinen Klassen Allgemeine Java-Themen 6
A HashMap Methode "get()"-Problem Allgemeine Java-Themen 28
J Problem beim Umstellen auf Java jdk 13 Allgemeine Java-Themen 3
J Problem bei Install java 13 Allgemeine Java-Themen 3
X Profitable Reise Problem Allgemeine Java-Themen 32
A Problem beim öffnen von Java-Installern Allgemeine Java-Themen 1
Dann07 Problem mit JavaMail API Allgemeine Java-Themen 26
J Problem beim Generischen Klassen und Interfaces Allgemeine Java-Themen 2
L Klassen Algorithmus für das folgende Problem entwickeln? Allgemeine Java-Themen 30
J Clear-Problem Allgemeine Java-Themen 10
B Problem zu einem Java Projekt Allgemeine Java-Themen 6
S JFileChooser Problem Allgemeine Java-Themen 4
M Traveling Salesman - MST Heuristik Problem Allgemeine Java-Themen 4
J Traveling Salesman Problem Allgemeine Java-Themen 14
E Java Editor Problem mit 2er Exceptions Allgemeine Java-Themen 12
C code oder Bibliotheken für 2-Center Problem Allgemeine Java-Themen 4
M Salesman Problem - Bruteforce Algorithmus Allgemeine Java-Themen 23
S Methoden Problem mit NullPointerException Allgemeine Java-Themen 9
Javafan02 Problem mit if-clause Allgemeine Java-Themen 17
J Lombok Problem mit Konstruktoren bei Verberbung Allgemeine Java-Themen 1
kodela Event Handling Problem mit der Alt-Taste Allgemeine Java-Themen 16
W Threads Problem Allgemeine Java-Themen 15
D (Verständnis-)Problem mit Unterklasse Allgemeine Java-Themen 4
S Problem mit Generic bei unmodifiableCollection Allgemeine Java-Themen 4
S jserialcomm Problem Allgemeine Java-Themen 1
Flynn Thread-Problem... Allgemeine Java-Themen 2
J Generische Interface - Problem Allgemeine Java-Themen 3
G Problem beim GUI Allgemeine Java-Themen 9
L Applet Problem "security: Trusted libraries list file not found" ? Allgemeine Java-Themen 7
A OOP Problem beim Berechnen der größten Fläche eines Ringes Allgemeine Java-Themen 19
T Problem mit externen Datenbankzugriff über SSH Tunnel Allgemeine Java-Themen 4
F Problem beim Einlesen einer Textdatei Allgemeine Java-Themen 12
S Java OpenOffice Problem mit Windows-Benutzerwechsel Allgemeine Java-Themen 19
K Threads RAM Problem Allgemeine Java-Themen 20
P Operatoren Problem mit Zähler in recursiver Schleife Allgemeine Java-Themen 2
C Int Problem Allgemeine Java-Themen 8
C J2V8 NodeJs Java Bride Problem und Frage!?!? Allgemeine Java-Themen 1
J Problem bei Hashmap Key-Abfrage Allgemeine Java-Themen 4
C Webseiten Programm problem Allgemeine Java-Themen 5
M LocalDate Problem Allgemeine Java-Themen 4
J "Problem Objektorientierung" Allgemeine Java-Themen 20
geekex Problem Meldung! Was tun?! Allgemeine Java-Themen 19
T Klassen Override Problem Allgemeine Java-Themen 7
L Unbekanntes Problem Allgemeine Java-Themen 1
FrittenFritze Problem mit einer JComboBox, Event temporär deaktivieren Allgemeine Java-Themen 11
Blender3D Java Swing Programm Windows 10 Autostart Problem Allgemeine Java-Themen 2
F HTTPS Zertifikat Problem Allgemeine Java-Themen 3
M OpenCV KNearest Problem Allgemeine Java-Themen 0
Tommy Nightmare Project Euler: Problem 22 Allgemeine Java-Themen 2
C Abstrakte Klasse, lokale Variable-Problem Allgemeine Java-Themen 1
N Vererbung Design-Problem mit vorhandenen, von der Klasse unabhängigen Methoden Allgemeine Java-Themen 12
P Eclipse Projekt anlegen macht Problem Allgemeine Java-Themen 1
RalleYTN META-INF/services Problem Allgemeine Java-Themen 3
F Java Mail Problem: Authentifizierung wird nicht immer mitgeschickt Allgemeine Java-Themen 1
I Problem beim Aufrufen, von Objektmethoden/ -variablen Allgemeine Java-Themen 6

Ähnliche Java Themen


Oben