Hallo erstmal
Mein Problem ist folgendes ich versuche über Java ein Programm zu coden welches den Quelltext einer Seite ausliest um danach die urls zu filtern. Mein Problem ist aber das ich es einfach nicht hinbekommen die Urls zu filtern, den Quelltext hab ich schon einmal geschafft runterzuladen und zwar mit:
das funktioniert auch bis jetzt schön und gut nur weis ich nicht was ich benutzen muss um den Quelltext letztendlich von <a href="http://www nach "> zu filtern da sich der Inhalt der Urls ändert. Wahrscheinlich hab ich die Lösung übersehen da ich damit jetzt 10 stunden verbracht hab und 1000 mal gegoogelt bin ein totaler noob in Java aber hoffe das sich des bald ändert.
Ich hoffe ihr versteht mein Problem und könnt mir helfen im voraus schon mal danke Mr.T
Mein Problem ist folgendes ich versuche über Java ein Programm zu coden welches den Quelltext einer Seite ausliest um danach die urls zu filtern. Mein Problem ist aber das ich es einfach nicht hinbekommen die Urls zu filtern, den Quelltext hab ich schon einmal geschafft runterzuladen und zwar mit:
Code:
package quelltext;
import java.net.URL;
import java.util.Scanner;
public class Main {
public static void main(String[] args )throws Exception{
Scanner url = new Scanner(new URL("Url der Seite").openStream());
while(url.hasNextLine())
System.out.println(url.nextLine());
}
}
das funktioniert auch bis jetzt schön und gut nur weis ich nicht was ich benutzen muss um den Quelltext letztendlich von <a href="http://www nach "> zu filtern da sich der Inhalt der Urls ändert. Wahrscheinlich hab ich die Lösung übersehen da ich damit jetzt 10 stunden verbracht hab und 1000 mal gegoogelt bin ein totaler noob in Java aber hoffe das sich des bald ändert.
Ich hoffe ihr versteht mein Problem und könnt mir helfen im voraus schon mal danke Mr.T