Code Page characters darstellen

javango · 14. Aug 2018

Hallo,
ich möchte für eine Art Hex-Editor Zeichen (einzelne Bytes) auch in ASCII darstellen. Nun sind die normalen Formate wie UTF-8 usw. dafür nicht geeignet, da diese zeichen grösser 127 nicht oder nur teilweise darstellen können.
Ich hab mich noch an die alten DOS-Programme erinnert und hab dann auf die Erweiterte ASCII-Tabelle mit Codepage "IBM850" gefunden, welche auf von Java 8 unterstützt wird:
https://docs.oracle.com/javase/8/docs/technotes/guides/intl/encoding.doc.html
Mit einer mit dieser Code Page erweiterten ASCII - Tabelle lässt sich dann jeder Bytewert von 0-255 mit einem Zeichen darstellen. Es dürfte auch eine andere sein, welche alle Bytewerte in Zeichen unterscheiden kann.
Damit hab ich ein bisschen rumprobiert mit folgendem Code:

Java:

      boolean bo = Charset.isSupported("IBM850");
      if (bo) {
        Charset cs = Charset.forName("IBM850");
        ByteBuffer bb = ByteBuffer.allocate(256);
        for (int i = 0; i < 256; i++) {
          byte b = (byte)(i+32);
          bb.put(i, b);
        }
        Stringss = cs.decode(bb).toString();
        System.out.printf(ss);
      }

Das programm kopiert in einen ByteBuffer alle 256 Zeichen und wandelt diese dann laut dem Charset mit decode() in einen Charbuf und da gleich in einen string (toString()) um und soll diesen dann ausprinten.
Dabei kommt er bis zum printf(), wirft dann aber eine Exception java.util.UnknownFormatConversionException
Aber der String ss kann ich beim Debuggen vorher noch anschauen. Dieser enthält zwar ab 128 nur noch Vierecke, aber ich kann ihn eben im Debugger sehen. Wieso es dann beim printf() knallt, ist mir ein Rätsel.
Ausserdem hab ich die Zeichen der IBM850er Code Page nicht bekommen, obwohl diese offenbar unterstützt wird.

httpdigest · 14. Aug 2018

Ersetze printf durch println

EDIT: und warum addierst du 32 zu dem byte??? Ich dachte, du willst tatsächlich das entsprechende Byte 0-255 (und nicht 32-287) in sein Zeichen wandeln.
EDIT2: Ach ja, durch den byte Cast wird daraus ja auch 0-255, nur eben Start bei 32 und dann Überlauf.
EDIT3: Der Grund, warum du für die ersten 31 Zeichen wahrscheinlich nur Fragezeichenkästchen bekommst, ist, dass die Console, auf der du das ausgibst, selbst die Zeichen nicht unterstützt. Die Eclipse Console z.B. unterstützt die nicht.
Versuch es mal auf einer richtigen Console, wie etwa ConEmu/Cmder unter Windows. Unter Linux sollte das sowieso gehen.

Xyz1 · 14. Aug 2018

javango hat gesagt.:
Stringss

?

Bearbeitung: Dachte erst ich hätte was am Auge

javango · 14. Aug 2018

Sorry sollte natürlich Strings heissen und das mit den 32 dazuaddieren war ein Versuch, weil die untersten 32 werte auch nur Kästchen liefern.

OK, println funktioniert erstmal zum printen, nun muss ich nur noch eine code page finden, welche für alle werte ein anderes Zeichen bringen. CP437 z.B. müsste ja eigentlich das tun, da gibt es diese smilies und Zeichen zum Rahmen erstellen - DOS halt:
http://www.fship.com/charsets/codepages.html
Stattdessen bekomme ich viele ???? und kästchen:

Kästchen konnte ich nicht kopieren (die ersten 32)
!"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~ÇüéâäàåçêëèïîìÄÅÉæÆôöòûùÿÖÜ¢£¥?ƒáíóúñÑªº¿?¬½¼¡«»?????????????????????????????????????????????????ß????µ??????????±????÷?°?·??²?

httpdigest · 14. Aug 2018

Ja, es hängt von der Konsole (bzw. dem darauf verwendeten Font) ab, auf der du das printest, ob sie die Zeichen unterstützt oder nicht. Unter ConEmu sieht das z.B. so aus:

javango · 14. Aug 2018

Diese Charsets sollten aber eben gerade plattformunabhängig sein (siehe mein oberster link) und mit decode() werden diese in unicode-Zeichen übersetzt. Dann sollte es ja kein Problem mehr sein. Fragt sich nur, ob die Zeichen in Unicode überhaupt vorhanden sind. Sind aber ja mögliche 64k zeichen...

httpdigest · 14. Aug 2018

Ja natürlich sind sie plattformunabhängig. Und ja, Java wandelt es immer in Unicode um. Wenn aber die Konsole nun mal kein Unicode kann, sieht man nichts.

javango · 14. Aug 2018

Einverstanden, aber ich muss es schlussendlich nicht in einer Konsole darstellen, sondern in meinem Java-Programm. Und da kommt die Ausgabe so daher:

Sorry für das kleine Bild aber offenbar kann man hier mittels den Funktionen nur Bilder vom Internet einfügen. Jedenfalls sind alle Zeichen da, ausser die ersten 32.

httpdigest · 14. Aug 2018

Also du musst den String innerhalb eines modalen Windows Notification Popup Dialoges als Message anzeigen?
Oder was ganz genau meinst du mit "in meinem Java-Programm"?

EDIT: Wenn du die Glyphs z.B. selber zeichnen lässt, dann schaue dir mal an: https://stackoverflow.com/questions...g-box-instead-of-runic-letter#answer-30904729

httpdigest · 14. Aug 2018

Also der Codepage Decoder in Java verhält sich schon sehr merkwürdig. Wenn man ihn danach fragt, die Bytes 0-255 von Cp850/IBM850 zu decodieren, und den erhaltenen String wieder in seine UTF-8 Bytes konvertiert, dann erhält man für die ersten 127 Bytes genau die Folge: 0, 1, 2, 3, 4, 5, ..., 127, was sogar korrekt ist laut dieser Wikipedia-Seite: https://en.wikipedia.org/wiki/Code_page_850
Dort sagen sie, dass die Zeichen 0-127 Zeichen in Cp850 genau denen von ASCII entsprechen, was für die ersten 31 Zeichen nicht-druckbare Steuerzeichen sind, die Java dann mit dem Fragezeichenkästchen darstellt.
Interessanterweise sagt aber die deutsche Wikipediaseite etwas anderes: https://de.wikipedia.org/wiki/Codepage_850
Dort sind die ersten 0-127 Zeichen eben mal überhaupt nicht die von ASCII, plus sie geben sogar den Unicode-Wert der einzelnen Zeichen hübsch an.
Java's Codepage Decoder scheint wohl dem Wortlaut von der englischen Wikipediaseite zu folgen und somit einfach die ersten 0-127 Zeichen als tatsächlich die Bytes 0, 1, 2, 3, ..., 127 abzubilden, was ja in ASCI, ANSI und UTF-8 dieselben Zeichen sind.
Somit bleibt dir eigentlich nur, die Unicode-Escapesequenzen aus der Tabelle der deutschen Wikipedia-Seite abzutippen, um wirklich wiiiirklich reproduzierbare Ergebnisse zu erhalten, also:

Java:

public static void main(String[] args) {
  String s = "\u263A\u263B\u2665\u2666\u2663...";
  JOptionPane.showMessageDialog(null, s);
}

mihe7 · 15. Aug 2018

httpdigest hat gesagt.:
Also der Codepage Decoder in Java verhält sich schon sehr merkwürdig.

Ausgehend von den Wiki-Artikeln habe ich mal ein wenig recherchiert. Merkwürdig sind vor allem CP437 und Konsorten, denn es handelt sich dabei nicht um fixe Kodierungen, sondern jeweils um mehrere, die abhängig vom Einsatzgebiet verwendet werden (https://web.archive.org/web/2016060...bm.com/software/globalization/cp/cp00437.html).

Man mag sich fragen, was die damals geraucht haben, jedenfalls gibt es somit natürlich keine eindeutige Zuordnung zu Unicode. Allerdings findet man ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/PC/CP437.TXT - und dort sind tatsächlich die Steuerzeichen und keine Smileys oder Herzchen angegeben.

Aber Achtung: natürlich gibt es auch noch Unterschiede zwischen CPxxx von MS und CPxxx von IBM (https://github.com/pentaho/pentaho-reporting/tree/master/libraries/libfonts/encodings/VENDORS/IBM) - wo kämen wir auch hin, wenn das alles einheitlich wäre?

javango · 15. Aug 2018

httpdigest hat gesagt.:
Somit bleibt dir eigentlich nur, die Unicode-Escapesequenzen aus der Tabelle der deutschen Wikipedia-Seite abzutippen

Ja, werde wohl eine 256 grosse lookup table machen und dort die Zeichen einzeln ablegen. Ist zwar mühsam, aber wohl schneller als sich durch die grosse Flut an "Standards" durchzuarbeiten, wo dann wohl eh keine richtig das erfüllt was ich möchte.

mihe7 hat gesagt.:
Man mag sich fragen, was die damals geraucht haben

) Angesichts dieser Fülle von code pages kann man sich dies sicher fragen, wobei man natürlich beachten muss, dass früher halt eben der Speicherplatz rar war und man nicht einfach so 4 Bytes für ein einzelnes Zeichen verschwenden konnte/wollte. Dazu kamen sicher rechtliche Belange wie z.B. Copyrights und so hat dann halt jeder sein eigenes Süppchen gekocht.

Ich hab mich schon gefragt ob ich auch noch eine eigene code page machen soll, es gibt ja schon so viele, da kommt es auf eine mehr oder weniger auch nicht an ;-)
Da werd ich dann bei Nummer 0 und 255 welche ja wie ein Blank aussehen wenigstens auch noch ein Bildchen reinmachen, so dass man auch diese unterscheiden kann!

mihe7 · 15. Aug 2018

javango hat gesagt.:
Angesichts dieser Fülle von code pages kann man sich dies sicher fragen, wobei man natürlich beachten muss, dass früher halt eben der Speicherplatz rar war und man nicht einfach so 4 Bytes für ein einzelnes Zeichen verschwenden konnte/wollte. Dazu kamen sicher rechtliche Belange wie z.B. Copyrights und so hat dann halt jeder sein eigenes Süppchen gekocht.

Das erklärt sicher die Fülle der code pages (z. B. 437 für US, 850 für Europa usw.), nicht aber, dass man in einer CP einem Code verschiedene Zeichen zuordnet und dann sagt, dass es vom Kontext abhängt, welches Zeichen zu verwenden ist.

	Titel	Forum	Antworten	Datum
	Tipps für Organisation von Code-Reviews nach einem Pull Request.	Allgemeine Java-Themen	5	20. Aug 2024
M	Unsicher, ob das Code richtig ist	Allgemeine Java-Themen	4	21. Okt 2023
	Unbekanntes Zeichen in fremden Code wirft Fragen auf	Allgemeine Java-Themen	4	20. Sep 2023
	Methoden Code-Verbesserung	Allgemeine Java-Themen	2	1. Apr 2023
D	Webarchive (war): Code verschleiern	Allgemeine Java-Themen	7	3. Mrz 2023
D	Compiler-Fehler child process exited with code 1	Allgemeine Java-Themen	1	18. Feb 2023
	Interface Mein Microsoft Visual Studio Code zeigt komische Dinge & Menüs an	Allgemeine Java-Themen	9	14. Nov 2022
A	Clean Code: Variable vs. Methode	Allgemeine Java-Themen	8	9. Sep 2022
	Versteht jemand, was diese beiden Zahlen bei dem IJVM Code zu bedeuten haben?	Allgemeine Java-Themen	10	7. Aug 2022
	Releaseversion Tag in Code	Allgemeine Java-Themen	5	27. Jul 2022
	JDA Code funktioniert nicht?	Allgemeine Java-Themen	4	13. Jun 2022
F	Code auslagern	Allgemeine Java-Themen	5	23. Mai 2022
D	VBA Code mit Java ausführen möglich?	Allgemeine Java-Themen	10	9. Mai 2022
N	JAVA-Code mit Grafikfenster zeichnet in Windows, aber nicht Mac.	Allgemeine Java-Themen	4	24. Apr 2022
	Unverständlicher Java code?	Allgemeine Java-Themen	21	4. Apr 2022
V	Hilfe mit Java Code	Allgemeine Java-Themen	4	30. Jan 2022
S	Processing Java Code verstehen	Allgemeine Java-Themen	4	28. Jan 2022
A	code wird nicht ausgeführt	Allgemeine Java-Themen	3	9. Jan 2022
B	Bitte um Code Erklärung	Allgemeine Java-Themen	5	6. Dez 2021
N	nicht einsehbarer Fehler im code, kann nicht mehr übersetzten	Allgemeine Java-Themen	51	22. Sep 2021
N	Regulären Ausdruck in normalen Java-Code umwandeln	Allgemeine Java-Themen	12	17. Mai 2021
	Clean Code oder	Allgemeine Java-Themen	5	8. Mai 2021
	Aus einem byte Array Steuerungszeichen und Code bekommen und ersetzen	Allgemeine Java-Themen	3	13. Feb 2021
J	Simple Date Format Alternativen bitte um Code	Allgemeine Java-Themen	14	9. Feb 2021
	in Java-Code plötzlich ein paar Wörter in Rot	Allgemeine Java-Themen	2	12. Dez 2020
L	Best Practice Auslagerung von Code = Performance Optimierung?	Allgemeine Java-Themen	4	31. Aug 2020
H	Precompilierten code ansehen	Allgemeine Java-Themen	3	29. Jul 2020
R	Wo müsste ich im Code eine Änderung vornehmen?	Allgemeine Java-Themen	6	25. Apr 2020
L	Ausgabe von in Echtzeit ausgeführten Code	Allgemeine Java-Themen	9	16. Apr 2020
	Wie kann ich die menge an code reduzieren?	Allgemeine Java-Themen	28	14. Mrz 2020
	Warum ist dieser Code OS abhängig?	Allgemeine Java-Themen	10	21. Feb 2020
S	Code Erklärung	Allgemeine Java-Themen	21	10. Feb 2020
B	Pausem im Code	Allgemeine Java-Themen	2	9. Jan 2020
T	Java-Quiz Code Fehler	Allgemeine Java-Themen	10	16. Dez 2019
L	Eclipse Java Code ausführen	Allgemeine Java-Themen	18	28. Nov 2019
F	Java Code ausführen direkt nach Anmelden in Windows	Allgemeine Java-Themen	2	21. Nov 2019
F	Code in Klassen bringen	Allgemeine Java-Themen	4	14. Okt 2019
S	Gibt es eigentlich Java Source Code Interpreter..?	Allgemeine Java-Themen	13	14. Aug 2019
J	JUnit - Auslassen von Code	Allgemeine Java-Themen	25	16. Feb 2019
F	Klassen Spaghetti Code Vermeidung	Allgemeine Java-Themen	16	28. Nov 2018
C	code oder Bibliotheken für 2-Center Problem	Allgemeine Java-Themen	4	24. Okt 2018
J	wie sollte man sinnvoll seinen Code aufteilen	Allgemeine Java-Themen	6	30. Jul 2018
I	Python Code in Java Code	Allgemeine Java-Themen	9	26. Jul 2018
M	Java (GUI) Code verdoppeln oder anzeige mehrmals anzeigen?	Allgemeine Java-Themen	8	25. Mai 2018
N	Wie öffne ich einen runtergeladadenen Code in IntelliJ	Allgemeine Java-Themen	3	20. Mai 2018
R	Fehler im Code	Allgemeine Java-Themen	1	7. Mai 2018
R	Fehler im Code	Allgemeine Java-Themen	3	30. Apr 2018
O	Standard library nativer C code	Allgemeine Java-Themen	1	15. Apr 2018
R	Wo ist mein Fehler in diesem Code	Allgemeine Java-Themen	7	14. Apr 2018
S	Java Editor Bekomme bei der Code-Vervollständigung die Zeichen	Allgemeine Java-Themen	3	22. Feb 2018
N	Morse Code decoder	Allgemeine Java-Themen	9	11. Jan 2018
O	Erste Schritte Benzinverbrauch Code Hilfe	Allgemeine Java-Themen	3	11. Jan 2018
S	Eclipse exit code 805306369	Allgemeine Java-Themen	1	11. Nov 2017
	Vererbung Code einbinden	Allgemeine Java-Themen	3	9. Nov 2017
	Website HTML Code von HTTPS URL laden	Allgemeine Java-Themen	0	13. Okt 2017
S	Wie kann ich eine kleine Stelle in meinem Code mit multiplen Threads abarbeiten..?	Allgemeine Java-Themen	20	17. Mai 2017
S	Code 'innerhalb' des synchronen Bereichs einer BlockingQueue ausfuehren..?	Allgemeine Java-Themen	7	4. Mai 2017
F	Verständlichkeitsproblem bei Java Code?!	Allgemeine Java-Themen	2	13. Mrz 2017
G	Eclipse Eclipse: Unreachable code	Allgemeine Java-Themen	16	7. Mrz 2017
P	Java Android Code in IOS compilieren?	Allgemeine Java-Themen	9	24. Jan 2017
C	Code vereinfachen	Allgemeine Java-Themen	2	23. Jan 2017
T	Hilfe bei Code	Allgemeine Java-Themen	3	28. Dez 2016
R	Java-Code für folgene Aufgabe?	Allgemeine Java-Themen	8	28. Okt 2016
	Best Practice Code Refaktorisierung	Allgemeine Java-Themen	7	12. Sep 2016
	Was bedeutet/macht ein Exit-Code	Allgemeine Java-Themen	1	17. Mai 2016
D	Code für bereitgestellte Methoden	Allgemeine Java-Themen	1	6. Mai 2016
	HTML Code decodieren	Allgemeine Java-Themen	2	22. Mrz 2016
C	ASCII-Code in Java	Allgemeine Java-Themen	1	19. Jan 2016
J	Java-Code in DLL packen	Allgemeine Java-Themen	5	14. Jan 2016
J	LWJGL 3 Error Code 1282	Allgemeine Java-Themen	4	22. Nov 2015
0	Code startet nicht (Keine Warnung/Fehlermeldung)	Allgemeine Java-Themen	4	22. Nov 2015
A	Frage zu meinem Code	Allgemeine Java-Themen	2	20. Nov 2015
B	Code generierung Velocity Templates Telosys	Allgemeine Java-Themen	1	13. Mai 2015
E	Fehlermeldung vor dem Programm code	Allgemeine Java-Themen	1	9. Mai 2015
B	JAVA - mehrere Clienten gleichzeitig starten. Nicht bei Code!	Allgemeine Java-Themen	3	10. Apr 2015
	Ausführen von fremden Code	Allgemeine Java-Themen	14	20. Mrz 2015
	Code snipped Software	Allgemeine Java-Themen	1	25. Feb 2015
L	Eclipse Editieren des Code templates für Override methods	Allgemeine Java-Themen	2	18. Nov 2014
J	Java code "plugin" fähig machen	Allgemeine Java-Themen	4	11. Okt 2014
	.jar Code Signing, User-Keystore und Fragen dazu	Allgemeine Java-Themen	0	18. Aug 2014
	Wie verstecke ich meinen private Key am besten im Code?	Allgemeine Java-Themen	10	5. Jun 2014
A	Thread: Code paralell ausführen in mehreren Instanzen	Allgemeine Java-Themen	1	23. Mrz 2014
B	NullPointerException - Aber kein Fehler im Code	Allgemeine Java-Themen	4	8. Mrz 2014
N	HTTP response code: 403	Allgemeine Java-Themen	3	21. Feb 2014
D	Code bitte mit 19 stelligen Zahlen kompatibel machen	Allgemeine Java-Themen	5	27. Jan 2014
D	Java Compiler code referencen	Allgemeine Java-Themen	0	9. Jan 2014
G	Fehler im Java-Code	Allgemeine Java-Themen	4	1. Jan 2014
A	PHP-Code zu Java-Code	Allgemeine Java-Themen	5	15. Dez 2013
M	Code läuft unter windows aber nicht unter Linux	Allgemeine Java-Themen	6	28. Nov 2013
X	Was macht folgender Code!?	Allgemeine Java-Themen	6	19. Nov 2013
K	Code zu einem Projekt entschluesseln	Allgemeine Java-Themen	15	26. Okt 2013
H	Java Leistungssteigerung durch Code Anpassung	Allgemeine Java-Themen	5	25. Sep 2013
	Best Practice Vorgehensweise bestehenden Code/Programm verschönern	Allgemeine Java-Themen	4	23. Jan 2013
M	Code optimieren	Allgemeine Java-Themen	7	21. Dez 2012
A	jEditorPane Html Datei öffnen (code)	Allgemeine Java-Themen	3	18. Dez 2012
S	EAN-Code Tabelle für CD's	Allgemeine Java-Themen	2	18. Nov 2012
T	Code durch eigenes Frame pausieren (ähnlich JDialog)	Allgemeine Java-Themen	4	13. Nov 2012
J	Erzeugung von Java-Code	Allgemeine Java-Themen	2	13. Nov 2012
A	Source code analyze	Allgemeine Java-Themen	8	23. Okt 2012
N	VB Code in Java verwenden	Allgemeine Java-Themen	5	17. Okt 2012

Code Page characters darstellen

javango

Mitglied

httpdigest

Top Contributor

Xyz1

Gast

javango

Mitglied

httpdigest

Top Contributor

javango

Mitglied

httpdigest

Top Contributor

javango

Mitglied

Anhänge

httpdigest

Top Contributor

httpdigest

Top Contributor

mihe7

Top Contributor

javango

Mitglied

mihe7

Top Contributor

Ähnliche Java Themen

Aktuelle Jobs

Neue Themen