Hallo,
ich habe Texte in einem von mir geschriebenen Objektcontainer, die ich mit einer JEditorPane anzeigen lasse. Die Texte sind darin nicht editierbar. Ich nutze ein HTMLEditorKit, damit der Nutzer Textstellen markieren und per Kontextmenü farbig formatieren kann. Die Koordinaten dieser Markierungen speichere ich separat für jeden Text ab, weil vom Benutzer an anderer Stelle noch Textinformationen zu der jeweiligen Markierung festgehalten werden sollen. Es ist also wichtig, dass ich die Koordinaten der Textstellen korrekt auslesen kann.
Mein Problem bei der Sache: Wenn in Texten z.B. zwei Leerzeichen oder zwei Zeilenumbrüche aufeinanderfolgen, wird das vom HTMLEditorKit (bzw. vom View?) als ein einzelnes Leerzeichen behandelt. Das allein ist nicht so schlimm, denn ich habe eine Methode geschrieben, die einfach per regex die doppelten Whitespaces auf jeweils eins reduziert, bevor der Text in meinen Objektcontainer übernommen wird. Dabei muss ich aber irgendwelche ähnlich gelagerten Fälle übersehen, denn hin und wieder sind die Markierungen um ein oder zwei oder drei Zeichen nach hinten verschoben, wenn ich die Datei wieder öffne und die Markierungen an den gespeicherten Textstellen neu zeichnen lasse.
Meine Frage lautet daher: Gibt es irgendeine einfache Methode, um einen Text so zu transformieren, dass er seiner HTML-Darstellung (also nur einfache Leerzeichen usw.) genau gleicht? Falls nicht, hat vielleicht jemand Hinweise, was für Kleinigkeiten ich außer Leerzeichen und Zeilenumbrüchen übersehen haben könnte? Danke!
ich habe Texte in einem von mir geschriebenen Objektcontainer, die ich mit einer JEditorPane anzeigen lasse. Die Texte sind darin nicht editierbar. Ich nutze ein HTMLEditorKit, damit der Nutzer Textstellen markieren und per Kontextmenü farbig formatieren kann. Die Koordinaten dieser Markierungen speichere ich separat für jeden Text ab, weil vom Benutzer an anderer Stelle noch Textinformationen zu der jeweiligen Markierung festgehalten werden sollen. Es ist also wichtig, dass ich die Koordinaten der Textstellen korrekt auslesen kann.
Mein Problem bei der Sache: Wenn in Texten z.B. zwei Leerzeichen oder zwei Zeilenumbrüche aufeinanderfolgen, wird das vom HTMLEditorKit (bzw. vom View?) als ein einzelnes Leerzeichen behandelt. Das allein ist nicht so schlimm, denn ich habe eine Methode geschrieben, die einfach per regex die doppelten Whitespaces auf jeweils eins reduziert, bevor der Text in meinen Objektcontainer übernommen wird. Dabei muss ich aber irgendwelche ähnlich gelagerten Fälle übersehen, denn hin und wieder sind die Markierungen um ein oder zwei oder drei Zeichen nach hinten verschoben, wenn ich die Datei wieder öffne und die Markierungen an den gespeicherten Textstellen neu zeichnen lasse.
Meine Frage lautet daher: Gibt es irgendeine einfache Methode, um einen Text so zu transformieren, dass er seiner HTML-Darstellung (also nur einfache Leerzeichen usw.) genau gleicht? Falls nicht, hat vielleicht jemand Hinweise, was für Kleinigkeiten ich außer Leerzeichen und Zeilenumbrüchen übersehen haben könnte? Danke!