Datenaustauschformat

Status
Nicht offen für weitere Antworten.
G

Guest

Gast
Hallo,

ich habe mal eine Frage zu Datenaustauschformaten. Bei XML habe ich ja die Tags, die einen gewissen Overhead erzeugen. Wie sieht es mit reinem text aus ? Welchen Overhead erzeugt Text bei der Übertragung ?

Kann mir das jemand grob sagen ?


Vielen Dank
 

Ark

Top Contributor
Eine Markierung für den verwendeten Zeichensatz könnte eventuell nötig werden (kommt auf die Umstände an). Wenn aber z.B. ausschließlich UTF-8 verwendet wird, kann auch diese Markierung wegfallen. Diese Zeichensatzinformation enthält aber auch eine XML-Datei.

Welche Header nötig sind und wie dann der Overhead aussieht, hängt aber auch von den Informationen ab, die nötig sind und in einem Header gespeichert werden können. Unter ein bestimmtes Minimum an Informationen kommt man einfach nicht.

Weiter kann man dir jetzt nur helfen, wenn du uns verrätst, was du denn speichern willst.

Ark
 

Ark

Top Contributor
Anonymous hat gesagt.:
Meinem Empfinden nach müßte doch aber bei Text der geringste Overhead entstehen. Jedenfalls im Vergleich zu den anderen Formaten...

Wie könnte das gemeint sein ?
Wie, "wie könnte das gemeint sein"? Worum geht es dir denn? Was willst du erreichen? Worauf kommt es dir an? Danach richtet sich ja das Format, das du benutzen solltest, deswegen gibt es ja diese Tabelle. Wenn du auf Sicherheit setzt, musst du XML nehmen, weil dort "Integrity check" mit "Very good" angegeben ist. Wenn es dir eher auf für Menschen lesbare Formate ankommt, weil eventuell von Hand nachgebessert werden können muss, dann solltest du auf CSV verzichten, weil "Human readable" dort mit "Impossible" angegeben ist usw.

Ark
 
G

Gast

Gast
Mir geht es hier um das Verständnis. Der Rest der Tabelle ist klar. XML oder JSON spielen bei meiner Frage keine Rolle.

Nimm halt mal CSV vs. Text :

Eine Daten könnte doch so in CSV aussehen:

'name1'; 'name2'; .....

und im Textformat: name1, name2, name3

Wieso soll der Overhead bei CSV geringer sein als beim Textformat? Darum geht es mir. Ich möchte das für eine Arbeit aufbereiten, nicht praktisch umsetzen.

So meine ich das ...
 

Ark

Top Contributor
Gast hat gesagt.:
Wieso soll der Overhead bei CSV geringer sein als beim Textformat?
Hast du denn schon mal so erzeugte CSV- und TXT-Dateien miteinander verglichen? Woher soll ich denn wissen, wie die Dateien formatiert werden? Eine Rechenmaschine ist kein Wunderding, und die Bytes werden mit einem anderen Format sicherlich auch nicht plötzlich 9 Bit lang oder mehr als Nullen und Einsen verwendet.

Nichts gegen dich, aber ich glaube, diese Verständnisschwierigkeiten rühren wohl daher, dass man den Schülern im Informatikunterricht weismacht, Textdateien wären etwas Grundverschiedenes von Binärdateien usw.

Ark
 
G

Gast

Gast
Mmh, ich weiss nicht, ob wir aneinander vorbei reden. Der Link zeigt doch eine generelle Betrachtung auf.

Mit der Angabe des Zeichensatzes in einer Textdatei hast du sicherlich recht. Doch das kann nicht alles sein. Womöglich ist der Header einer Textdatei im Allgemeinen sehr groß. Vielleicht sollte ich in dieser Richtung etwas weiter forschen.

Zum Thema Verständnis: Du kannst mir doch auch keine plausible Antwort geben.

Ich danke Dir trotzdem für Diene Bemühungen...
 
M

maki

Gast
Bei XML habe ich ja die Tags, die einen gewissen Overhead erzeugen. Wie sieht es mit reinem text aus ? Welchen Overhead erzeugt Text bei der Übertragung ?
Wenn ein Baum im Wald umfällt und keiner hat es gehört, welche Farbe hat dann der Baum?

Stelle vernünftige Fragen, dann kannst du auch vernünftige Antworten bekommen.
Philosophische Wischi-Waschi Fragen sind fehl am Platz in der IT.

Welches Textformat?
 
G

Gelöschtes Mitglied 5909

Gast
kommt auf die daten an, wenn du nur Zahlen drinn hast ist binär besser ;)
 

Ark

Top Contributor
raiL hat gesagt.:
kommt auf die daten an, wenn du nur Zahlen drinn hast ist binär besser ;)
... wenn die Daten von einer Maschine verarbeitet werden sollen. Aber wenn man von Hand noch drin rumpfuschen können möchte, sollte man Dezimal- oder Hexadezimalkodierungen verwenden. Es kommt halt alles auf den Verwendungszweck an.

Ark
 

ice-breaker

Top Contributor
Es kommt ja immer darauf an was du sendest, verschachtelte Arrays usw mit CSV zu senden dürfte sich recht schwer gestalten.
 
G

Guest

Gast
Ich verstehe nicht, warum der Fragesteller hier teilweise so angegangen wird. Ich halte die Frage für völlig nachvollziehbar und gerechtfertigt. Eine Antwort habe ich aber auch nicht. Ich könnte mir nur vorstellen, dass Overhead entsteht, wenn man den Text menschenlesbar halten will und dazu Zusatzinfos einfügt.
 

ARadauer

Top Contributor
laut dem link
Human readable -> CSV -> Impossible

das muss man mir erst beweisen, dass ich eine einfache csv datei nicht verstehen kann...
 

ARadauer

Top Contributor
wtf...

Could not insert new word

DEBUG MODE

SQL Error : 1195 Table 'phpbb_search_wordlist' is marked as crashed and last (automatic?) repair failed

INSERT IGNORE INTO phpbb_search_wordlist (word_text, word_common) VALUES ('beweisen', 0), ('csv', 0), ('das', 0), ('dass', 0), ('datei', 0), ('dem', 0), ('eine', 0), ('einfache', 0), ('erst', 0), ('human', 0), ('ich', 0), ('impossible', 0), ('kann', 0), ('laut', 0), ('link', 0), ('man', 0), ('mir', 0), ('muss', 0), ('nicht', 0), ('readable', 0), ('verstehen', 0)

Line : 225
File : /www0126/www.java-forum.org/de/includes/functions_search.php
 
T

tuxedo

Gast
Ja, der Fehler kommt bei mir auch. Die Tabelle an sich ist aber "quatsch".

Es sind dort folgende Spalten aufgeführt:

XML
JSON
HTML
CSV
Text

Warum man XML von HTML so sehr unterscheidet: Kein Plan. Für mich ist die Struktur, das benutzen der Tags etc. gleichwertig. Zeigt ja auch die Tabelle. Warum man das ganze also in zwei Spalten aufführt: Keine Ahnung. Ist ja wie wenn ich schreibe: blaues Auto: wiegt ne Tonne; rotes Auto: wiegt ne Tonne. Kan ich ja gleich schreiben: Auto: wiegt ne Tonne...

JSON von CSV zu unterscheiden macht Sinn, denn die Formatierung ist ja eine andere.

Aber wo ist "Text" anzusiedeln"? In meinen Augen ist das quatsch. Denn Text ist so allgemein gehalten, dass XML, JSON, HTML und CSV darunter fallen kann und wird.

An den Fragesteller:

bzgl. des Overheads kannst du HTML und XML zusammenziehen zu einer Spalte.
Somit hast du dann noch:

XML/HTML, JSON und CSV

"Text" gibt es an sich nicht und ist zu allgemein gehalten. Der "Overhead" hängt stark davon ab wie man sich _sein_ Textformat definiert. Prinzipiell lässt sich das natürlich noch mehr aufblasen als XML ... Aber man kann es auch locker auf CSV-Größe runterbrechen, oder sogar noch etwas darunter (wobei es wohl kaum arg viel weniger wird als CSV, da CSV schon recht spartanisch mit Markierzeichen etc, umgeht).

- Alex
 
Status
Nicht offen für weitere Antworten.

Neue Themen


Oben