Hi,
beim Versuch den Quelltext einer Seite auszulesen, komme ich leider nicht weiter.
Es werden wohl im Hintergrund Inhalte geladen. (Die Artikel eines shops)
Ich hatte es mit dem Framework jSoup versucht, leider ohne Erfolg. (Artikel haben immer gefehlt)
Beim weiteren googlen bin ich dann noch auf HTMLUNIT gestoßen, womit es eigentlich hätte gehen müssen... aber mir fehlen noch immer die benötigten Inhalte...
Hier mal beispielhaft die Methode
Hätte jemand eine Idee, woran das liegen könnte? Bzw. was ich noch machen könnte?
Vielen Dank schonmal
beim Versuch den Quelltext einer Seite auszulesen, komme ich leider nicht weiter.
Es werden wohl im Hintergrund Inhalte geladen. (Die Artikel eines shops)
Ich hatte es mit dem Framework jSoup versucht, leider ohne Erfolg. (Artikel haben immer gefehlt)
Beim weiteren googlen bin ich dann noch auf HTMLUNIT gestoßen, womit es eigentlich hätte gehen müssen... aber mir fehlen noch immer die benötigten Inhalte...
Hier mal beispielhaft die Methode
Code:
public static void testGoogle() throws FailingHttpStatusCodeException, MalformedURLException, IOException, InterruptedException{
WebClient webClient = new WebClient();
HtmlPage currentPage = webClient.getPage("http://de.wikipedia.org/wiki/Google");
String textSource = currentPage.asText();
String xmlSource = currentPage.asXml();
System.out.println(xmlSource);
}
Hätte jemand eine Idee, woran das liegen könnte? Bzw. was ich noch machen könnte?
Vielen Dank schonmal