A
alex01
Gast
Hallo Leute,
eins vorweg, ich habe schon stundenlang gegoogelt auch zig Foren durchstöbert -dieses inklusive- habe aber nicht finden können, das mir bei meinem Problem hilft.
Ich möchte Internetinhalte aus einer beliebigen html-Datei auslesen und diese dann in einer XML-Datei abspeichern.
An diese html-Daten muss ich irgendwie rankommen, um diese dann zu parsen und abzuspeichern. Mein erster Ansatz war.
Dies funktioniert leider aber nur mit lokaler Dateien auf dem Rechner. Meine naive Idee war an der Stelle "irgendein file" im Code einfach eine http-adresse einzufügen z.B. "http://www.testfile.tf/testfile.html", dies funktionierte leider nicht.
Fehlermeldung: Die Syntax für den Dateinamen, Verzeichnisnamen oder die Datenträgerbezeichnung ist falsch
ohne "http://" kam die Fehlermeldung: Das System kann den angegebenen Pfad nicht finden
Also ich freue mich auf eure Tipps!
eins vorweg, ich habe schon stundenlang gegoogelt auch zig Foren durchstöbert -dieses inklusive- habe aber nicht finden können, das mir bei meinem Problem hilft.
Ich möchte Internetinhalte aus einer beliebigen html-Datei auslesen und diese dann in einer XML-Datei abspeichern.
An diese html-Daten muss ich irgendwie rankommen, um diese dann zu parsen und abzuspeichern. Mein erster Ansatz war.
Code:
File file = new File("irgendein File");
String file_line ="";
String file_all ="";
BufferedReader file_buf = new BufferedReader(new FileReader(file));
while((file_line = file_buf.readLine()) != null){
file_all += file_line;
}
System.out.print(file_all);
Dies funktioniert leider aber nur mit lokaler Dateien auf dem Rechner. Meine naive Idee war an der Stelle "irgendein file" im Code einfach eine http-adresse einzufügen z.B. "http://www.testfile.tf/testfile.html", dies funktionierte leider nicht.
Fehlermeldung: Die Syntax für den Dateinamen, Verzeichnisnamen oder die Datenträgerbezeichnung ist falsch
ohne "http://" kam die Fehlermeldung: Das System kann den angegebenen Pfad nicht finden
Also ich freue mich auf eure Tipps!