Moin zusammen,
ich habe den crawler4j von github soweit Programmiert/implementier das er bei mir läuft und auch alle daten in einer txt Datei abspeichert.
Das Problem ist das mir einfach zuviel Information in der Ausgabe steht, ich brauche nur zwei Daten aus der html/txt und zwar wäre das nur <titel> .... </titel> und <body> .... </body> gibt es hierfür eine Anweisung (System.out.println(...));
Info: Die meisten Internet Seiten die ich mit dem crawler durchforste sind in html geschrieben.
Viele Grüße
ich habe den crawler4j von github soweit Programmiert/implementier das er bei mir läuft und auch alle daten in einer txt Datei abspeichert.
Das Problem ist das mir einfach zuviel Information in der Ausgabe steht, ich brauche nur zwei Daten aus der html/txt und zwar wäre das nur <titel> .... </titel> und <body> .... </body> gibt es hierfür eine Anweisung (System.out.println(...));
Info: Die meisten Internet Seiten die ich mit dem crawler durchforste sind in html geschrieben.
Viele Grüße