G
Guest
Gast
Hallo!
nach langem suchen und probieren :?
hab ich es nun geschafft eine Seite (hier zB google für tests...) runter zu laden und danach einen kompletten DOM Baum zu erstellen aus der Seite. Nun würde ich aber gerne von einzelnen Elementen den Quellcode heraus lesen.
Leider bringe ich das gar nicht zustande
hier mein Quelltext soweit:
irgendwie muss man doch aus dem "Element" 'root' den Quelltext heraus zu bekommen oder?
danke für Hilfen! bin da echt planlos
nach langem suchen und probieren :?
hab ich es nun geschafft eine Seite (hier zB google für tests...) runter zu laden und danach einen kompletten DOM Baum zu erstellen aus der Seite. Nun würde ich aber gerne von einzelnen Elementen den Quellcode heraus lesen.
Leider bringe ich das gar nicht zustande
hier mein Quelltext soweit:
Code:
URL url = new URL("http://www.google.at:80");
URLConnection connection = url.openConnection();
InputStream is = connection.getInputStream();
InputStreamReader isr = new InputStreamReader(is);
BufferedReader br = new BufferedReader(isr);
HTMLEditorKit htmlKit = new HTMLEditorKit();
HTMLDocument htmlDoc = (HTMLDocument) htmlKit.createDefaultDocument();
HTMLEditorKit.Parser parser = new ParserDelegator();
HTMLEditorKit.ParserCallback callback = htmlDoc.getReader(0);
parser.parse(br, callback, true);
javax.swing.text.Element root = htmlDoc.getRootElements()[0];
recurseElements(root);
}
void recurseElements(Element root)
{
System.out.println(root.getName());
int count = root.getElementCount();
for (int i=0; i<count; i++)
{
Element child = root.getElement(i);
if (child != null) recurseElements(child);
}
}
irgendwie muss man doch aus dem "Element" 'root' den Quelltext heraus zu bekommen oder?
danke für Hilfen! bin da echt planlos