HTML / XHTML Seite nach Excel exportieren. Suche Lib

mrBrown

Super-Moderator
Mitarbeiter
Ich habe absolut keine Plan davon, aber wie kommt man bitte zu der Anforderung, aus HTML ein Excel-Spreadsheet generieren zu müssen? 🤨
 

internet

Top Contributor
und wie soll ich das machen?
Meine Quelle ist eine HTML Seite, die dynamisch erstellt wird.

User drückt Button -> Report wird generiert (SQL abgesetzt etc.) -> Output HTML File -> Rendering HTML File nach Excel...
 
K

kneitzel

Gast
Die Frage ist doch, ob das generieren des Reports unter Deiner Kontrolle ist oder nicht. Oder was für Möglichkeiten des Eingriffs du hast.

"Ich baue mir einen Art Report" -> das klingt danach, dass Du da einen aktiven Part und die Kontrolle hast.

Daher die Frage, ob Du den Report nicht direkt in ein besseres Format packen kannst.
 

internet

Top Contributor
Ok, zugegebermaßen ist es auch die Frage, was generell vom HTML nach Excel konvertiert werden kann (technischer Aspekt & abgesehen von <table>)

Mein Report ist zunächst mal ein XML Template, auf welchem ich dann später den eigentlichen HTML Content erzeuge.

Ich habe mir die obengenannte Lib nicht im Detail angeschaut, aber wenn ich das richtig vertehe, macht die eigentlich genau das:
- Verwendet JSoup und extrahiert aus dem HTML Code die Tabellen (<table>).
- <table> wird konvertiert nach Excel mittels Apache POI

Allerdings wundert es mich, dass ich sonst keine weitere Lib dazu finde (außer eine kostenpflichtige: https://www.easyxls.com/)
 
K

kneitzel

Gast
Wenn Du ein XML Template hast, dann kannst Du doch die Daten einfach in plain XML ausgeben. Das kann dann Excel vermutlich schon richtig lesen.
Ansonsten kannst Du durch einfaches XSLT es in andere Formate transformieren also z.B. CSV Dateien, die dann in Excel eingelesen werden.

Also wichtig: verunreinige Deine Daten nicht mit irgendwelchen Ausgabe-Informationen.
 

internet

Top Contributor
Das XML Template bildet mir nur den Rahmen des Reports.
Es gibt zB Listen, TextItems etc, die hier mit verschiedenenen Eigenschaften deklariert sind.
Beim Rendering nutze ich dieses XML Template um mir dann den HTML Code zu erstellen (via JSF).
Diesen HTML Code greife ich dann ab und möchte daraus die Excel generieren.
 
K

kneitzel

Gast
Ja, das Vorgehen ist ja schon klar soweit. Nur hast Du den Vorschlag verstanden? Statt eines komplexen Generierens einer Visuellen Form um dann daraus die reinen Zahlen in einem Excel Sheet zu bekommen wäre es doch einfacher, wenn Du auf zwei Umwandlungen verzichtest um dann die Daten in XML Form zu bekommen wie diese direkt gut von Excel gelesen werden können.
Ob der Vorschlag für Dich umsetzbar, gut, was auch immer ist, kannst nur Du beurteilen. Das war aber - so wie ich @mrBrown verstanden habe - eine Lösungsidee.

Es geht bei der Idee einfach nur darum, einfache, unkomplizierte, direkte Wege zu gehen.
 

internet

Top Contributor
Ja, das Vorgehen ist ja schon klar soweit. Nur hast Du den Vorschlag verstanden? Statt eines komplexen Generierens einer Visuellen Form um dann daraus die reinen Zahlen in einem Excel Sheet zu bekommen wäre es doch einfacher, wenn Du auf zwei Umwandlungen verzichtest um dann die Daten in XML Form zu bekommen wie diese direkt gut von Excel gelesen werden können.

Ne, ich verstehe es nicht so ganz...
Angenommen ich habe sowas wie folgender Code, was mir einfach nur die Design Spezifikation speichert.
Java:
<report>
  <liste>
       <row>
             <cell>...</cell>
             <cell>...</cell>
       </row>
   <liste>
</report>

Was ich machen könnte ist:
- Nach entsprechenden "Komponenten" im XML suchen, (zB Liste), die für den Excel Export in Frage kommen (also nichts anderes als wenn ich das HTML habe und dann via JSoup nach <table> suche)
- Nun habe ich das XML (siehe Code oben ab <liste>).
- Anhand dieser Liste könnte ich dann auch via Apache POI das Excel generieren.

Meinst du das so?
 
K

kneitzel

Gast
- Anhand dieser Liste könnte ich dann auch via Apache POI das Excel generieren.
Du kannst aber auch:
- einfach per xslt das XML transformieren, so Du das möchtest.
- einfach per Excel zugreifen. Wenn die einzelnen Zellen alle nur cell heissen und nicht einen vernünftigen Namen haben, dann ist etwas Arbeit notwendig in Excel. Wären da die Bezeichner, dann könnte man das XML sogar direkt als Arbeitsblatt öffnen ohne jeden Zwischenschritt.
- ...

XML ist ein universelles Format. Damit können sehr viele Tools umgehen um die Daten zu verarbeiten.

(also nichts anderes als wenn ich das HTML habe und dann via JSoup nach <table> suche)
Dann ließe sich das html auch verwenden. Aber das teilweise kommen da ja zusätzliche Informationen mit rein oder Daten werden weggelassen (Weil sie nicht sichtbar sein sollen oder so). Wenn das bei Dir nicht ist, dann wäre das natürlich auch nutzbar.
 

Barista

Top Contributor
Ich baue mir einen Art Report (unter anderem HTML Tabellen) und möchte diese nun als Excel haben

Mach einen Download-Button/-Link, der eine CSV-Datei liefert.

Dabei sollte die CSV-Datei aus den gleichen Daten wie der HTML-Report gespeist werden.

Für CSV-Dateien wird auf Windows meist Excel als Standard-Applikation angeboten.
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
O Mit jsoup Text aus HTML-Datei rausgrabben Allgemeine Java-Themen 29
S Bookmark HTML Datei einlesen, alle Links erhalten und manche editieren..? (aktuell JSoup) Allgemeine Java-Themen 4
S HTML einer Webseite 1:1 so bekommen wie es auch der Browser anzeigt? Allgemeine Java-Themen 14
C Parsen einer sich updatenden Html mithilfe von jsoup Allgemeine Java-Themen 4
F Kennt ihr eine Library um 2 HTML Seiten zu diffen? Allgemeine Java-Themen 8
K HTMLEditor HTML Text in Rich Text umwandeln Allgemeine Java-Themen 14
N Value Wert aus HTML-Button mittels thymeleaf spring an java übergeben Allgemeine Java-Themen 2
N Lottowebsite programmieren mittels Java, HTML,.... Allgemeine Java-Themen 7
S HTML den ich von einer URL hole nicht identisch mit dem HTML im Browser Allgemeine Java-Themen 1
M Html Seite auslesen Allgemeine Java-Themen 16
Developer_X Website HTML Code von HTTPS URL laden Allgemeine Java-Themen 0
L HTML Formular ausführen Allgemeine Java-Themen 1
J Auslesen Daten Java/HTML Allgemeine Java-Themen 15
A Applet in HTML einbinden Allgemeine Java-Themen 1
KeVoZ_ JSoup - HTML Tag entfernen Allgemeine Java-Themen 1
I HTML einer Website auslesen liefert nur head Allgemeine Java-Themen 6
perlenfischer1984 HTML Code decodieren Allgemeine Java-Themen 2
stylegangsta Mehrere html seiten einer Homepage einlesen und als Textdatei ausgeben Allgemeine Java-Themen 14
P HTML Text bearbeiten Allgemeine Java-Themen 1
A Probleme beim auslesen von Quelltext (HTML) Allgemeine Java-Themen 5
OnDemand String aus html einlesen Allgemeine Java-Themen 2
OnDemand Substring einer HTML Seite will nicht Allgemeine Java-Themen 5
S Applet in html laden; InvocationTargetException,.. nur warum ? Allgemeine Java-Themen 0
R HTML Tabelle durchsuchen Allgemeine Java-Themen 3
L Erste Schritte Eclipse und Lokal funktioniert - in HTML nicht! Allgemeine Java-Themen 2
T Keyword Highlighting in HTML Allgemeine Java-Themen 5
B Best Practice HTML Output Optimal implementieren Allgemeine Java-Themen 3
A jEditorPane Html Datei öffnen (code) Allgemeine Java-Themen 3
Y Applet/Html - Wie Java-Methode aufrufen, die einen Parameter erwartet? Allgemeine Java-Themen 3
H HTML Parsing errors Allgemeine Java-Themen 9
P Aktuellen HTML Code auslesen (von JS manipuliert) Allgemeine Java-Themen 3
M HTML-Code von Webseite über Browser oder Console auslesen?? Allgemeine Java-Themen 5
S Robuste Methode um Text von HTML code zu extrahieren..? Allgemeine Java-Themen 6
S Bekomme mit Scanner und URL keine Html-Seite ausgelesen Allgemeine Java-Themen 3
C JEditorPane langsam großes HTML Allgemeine Java-Themen 8
M html aus aktuellem Browserfenster mitlesen lassen Allgemeine Java-Themen 5
T Kann HTML Datei nicht lesen Allgemeine Java-Themen 3
S HTML-Quelltext nach bestimmter Stelle durchsuchen Allgemeine Java-Themen 2
B HTML Tags in Strings umwandeln Allgemeine Java-Themen 4
S BufferedReader/PrintWriter an einer HTML Allgemeine Java-Themen 6
T HTML Tag Position mittels Pattern ermitteln Allgemeine Java-Themen 7
C Attribute aus HTML Tags auslesen Allgemeine Java-Themen 6
M Wicket Html Allgemeine Java-Themen 2
S Fehler beim ausführen des HTML Allgemeine Java-Themen 7
S Fehler Applet-HTML Allgemeine Java-Themen 5
B suchfunktion in html integrieren Allgemeine Java-Themen 3
DEvent Wieso ist Javadoc mit Html Tags? Allgemeine Java-Themen 47
P RegEx mit HTML Parser für Java möglich? Allgemeine Java-Themen 10
B RTF zu HTML Allgemeine Java-Themen 3
S Von HTML-Seite den Titel bekommen Allgemeine Java-Themen 2
M .jar in HTML einbinden Allgemeine Java-Themen 5
H Kleiner HTML Parser (Facharbeit) Allgemeine Java-Themen 11
K iText, HTML Einrückung im Document, aber nicht im Paragraph Allgemeine Java-Themen 3
J Überprüfen ob URL eine HTML Datei referenziert Allgemeine Java-Themen 4
E Zeilenumbruch html Allgemeine Java-Themen 3
J URLs aus HTML Datei extrahieren Allgemeine Java-Themen 2
G Swing JEditorPaneAppender (Output im HTML-Format) Allgemeine Java-Themen 12
W Java Anwendung in HTML Allgemeine Java-Themen 2
M Html Unit Whitespace-Problem Allgemeine Java-Themen 4
J HTML-Sonderzeichen ersetzen Allgemeine Java-Themen 2
M HTML-Websiten verarbeiten Allgemeine Java-Themen 8
A Index Datei aus HTML-Dateien Allgemeine Java-Themen 7
S HTML => DOM - Welcher Parser für meine Zwecke? Allgemeine Java-Themen 3
I HTML Seite laden Allgemeine Java-Themen 6
W Saubere Lösung für das Auslesen einer Html Seite (Mehrsprachigkeit) Allgemeine Java-Themen 5
M String in Html Text umwandeln Allgemeine Java-Themen 2
S Formatierungen aus HTML-Dokument übernehmen und in Word docx schreiben Allgemeine Java-Themen 3
E HTML File mit Umlaute einlesen Allgemeine Java-Themen 8
T HTML Parser Allgemeine Java-Themen 7
E Regex HTML Tag und Inhalt löschen Allgemeine Java-Themen 4
S Swing mit JEditorPane per HTML auf Bilder in JAR zugreifen. Allgemeine Java-Themen 3
S Regulärer Ausdruck für HTML-Tag Allgemeine Java-Themen 18
H Java Methode zum HTML encodieren/decodieren Allgemeine Java-Themen 2
Daniel_L Bug in Copy-Funktion bei HTML-Editorpane? Allgemeine Java-Themen 4
M JApplet einbinden in HTML Allgemeine Java-Themen 19
F Problem mit regulären Ausdruck in Zusammenhang mit HTML Allgemeine Java-Themen 8
T JavaScript aus HTML im JEditorPane ausführen? Allgemeine Java-Themen 5
S PDF nach HTML oder XML Allgemeine Java-Themen 2
O Tastendrücke in verstecktes HTML-Formular schreiben Allgemeine Java-Themen 4
D Strings von HTML befreien Allgemeine Java-Themen 17
A HTML-Seite aufrufen, drucken und zum Programm zurückkehren Allgemeine Java-Themen 2
E Html tags entfernen optimieren Allgemeine Java-Themen 12
Q API zum Verarbeiten von HTML Allgemeine Java-Themen 4
DerEisteeTrinker PDF mit seiner Formatierung in HTML umwandeln Allgemeine Java-Themen 15
B Java in HTML stellen Allgemeine Java-Themen 11
M id aus HTML (Regex) Allgemeine Java-Themen 7
D HTML mit Java verknüpfen Allgemeine Java-Themen 2
W HTML-Pfad Allgemeine Java-Themen 4
G HTML-Datei einlesen, Plain Text in Textfile speichern Allgemeine Java-Themen 4
A HTML-Seite wieder schließen Allgemeine Java-Themen 2
E JTidy html "hidden" Button drücken Allgemeine Java-Themen 7
faetzminator Regex zur Suche von "value-losen" Attributen in HTML Tags Allgemeine Java-Themen 7
data89 Java und HTML-Seiten mit Bildern - Wie passt das zusammen? Allgemeine Java-Themen 2
C Applet: JFileChooser: PFad an HTML zürückgeben Allgemeine Java-Themen 4
T Webseite (HTML) Parser gesucht Allgemeine Java-Themen 8
Daniel_L RegEx: UBB in HTML konvertieren, Problem Verschachtelung Allgemeine Java-Themen 3
T html Datei in jrxml Datei (JasperReports) umwandeln Allgemeine Java-Themen 6
J Seltsame Exception beim Java Applet einbinden in Html Allgemeine Java-Themen 2
G Import von HTML-Dateien Allgemeine Java-Themen 5
MQue Tidy HTML baum durchlaufen Allgemeine Java-Themen 5

Ähnliche Java Themen


Oben