Hey, ich wollte einen kleinen Picture Downloader schreiben und hätte dazu ein paar algemeine Fragen bzw Probleme.
Ablauf:
Gebe Seitenlink ein
Suche im Source nach der jpg
Lade Bild in ein BufferedImage
Überprüfe ob es einen nachfolgendes Bild gibt (im Source)
Wenn letzes Bild erreicht -> gehe zum nächsten Chapter
Ende
Sehr schwer
Dazu würde mich interessieren wie es dabei mit der Auslastung aussieht?
Sollte ich dazwischen ein paar sleeps machen oder nicht?
Oder gar mit Threads arbeiten?
Also am Anfang checken ob das Buch mehr als 1 chapter hat, wenn ja dann kann das nächste Kapitel in einem eigenen Thread ausgeführt werden.
Zum Problem:
Der Sourcecode ist soweit ich bisher gesehen habe, egal bei welchem Buch, immer der gleiche.
Leider findet mein Pattern das Bild nicht.
Zu durchsuchender String: <div id="imgholder"><a href="/buch-name/chapter/seite"><img id="img" width="800" height="1142" src="urlZumBild.jpg" alt="" name="img" /></a> </div>
urlZumBild möchte ich logischerweise haben.
Pattern: "<div id=\"imgholder\"><a href=\"/.+?/\\d+/\\d+\"><img id=\"img\" width=\"\\d+\" height=\"\\d+\" src=\"(.+)\" alt"
Mit RegexBuddy matche ich damit immer den ganzen String bis zum alt.
Leider habe ich jetzt seit einem Jahr nichts mehr mit Regexes gemacht und noch nie in Java.
Habe mich zwar eingelesen haber irgendwas passt da einfach nicht....
Und nein, einfach nach href oder jpg kann ich nicht abfragen.
Wäre über eine Erklärung erfreut, da mich die Tutorials irgendwie nicht weiter bringen....
Ablauf:
Gebe Seitenlink ein
Suche im Source nach der jpg
Lade Bild in ein BufferedImage
Überprüfe ob es einen nachfolgendes Bild gibt (im Source)
Wenn letzes Bild erreicht -> gehe zum nächsten Chapter
Ende
Sehr schwer
Dazu würde mich interessieren wie es dabei mit der Auslastung aussieht?
Sollte ich dazwischen ein paar sleeps machen oder nicht?
Oder gar mit Threads arbeiten?
Also am Anfang checken ob das Buch mehr als 1 chapter hat, wenn ja dann kann das nächste Kapitel in einem eigenen Thread ausgeführt werden.
Zum Problem:
Der Sourcecode ist soweit ich bisher gesehen habe, egal bei welchem Buch, immer der gleiche.
Leider findet mein Pattern das Bild nicht.
Zu durchsuchender String: <div id="imgholder"><a href="/buch-name/chapter/seite"><img id="img" width="800" height="1142" src="urlZumBild.jpg" alt="" name="img" /></a> </div>
urlZumBild möchte ich logischerweise haben.
Pattern: "<div id=\"imgholder\"><a href=\"/.+?/\\d+/\\d+\"><img id=\"img\" width=\"\\d+\" height=\"\\d+\" src=\"(.+)\" alt"
Mit RegexBuddy matche ich damit immer den ganzen String bis zum alt.
Leider habe ich jetzt seit einem Jahr nichts mehr mit Regexes gemacht und noch nie in Java.
Habe mich zwar eingelesen haber irgendwas passt da einfach nicht....
Und nein, einfach nach href oder jpg kann ich nicht abfragen.
Java:
Pattern regex = Pattern.compile("<div id=\"imgholder\"><a href=\"/.+?/\\d+/\\d+\"><img id=\"img\" width=\"\\d+\" height=\"\\d+\" src=\"(.+)\" alt");
Matcher regexMatcher = regex.matcher(s);
if (regexMatcher.find()) {
ResultString = regexMatcher.group();
Wäre über eine Erklärung erfreut, da mich die Tutorials irgendwie nicht weiter bringen....