Content aus Website ziehen

chris.

Mitglied
Hallo zusammen!
Ich komme am Besten gleich zu meiner Frage: Und zwar möchte ich mir ein kleines Programm in Java schreiben, welches die Quoten aus einer Website (bet365.com) einliest. Bisher habe ich schon einiges über Google gefunden und einige Möglichkeiten gelesen. (Die Website arbeitet mit JavaScript)
Die Verwendung der Klasse URL scheint mir hier ein wenig zu umständlich zu sein, da ich nur die Quoten haben möchte.
Dann las ich von dem Apache HTTPClient, womit ich bspw. csv Files, die generiert werden, auslesen kann. Ich bin mir nicht sicher, ob das das Richtige ist.
Und zum Schluss las ich etwas über den HTML Scanner NekoHTML, der HTML Dokumente parsen tut.

Da ich bis jetzt noch nicht so in diesem Bereich der Programmierung tätig gewesen bin, bin ich mir nicht sicher, ob diese Möglichkeiten überhaupt funktionieren.
Prinzipiell suche ich eine angenehme Möglichkeit elegant diese Informationen aus der Website zu holen. Für ein paar hilfreiche Tipps und Erläuterungen, auch die, die über das, was ich bis jetzt gefunden habe hinaus gehen, wäre ich sehr dankbar :)


Grüße
chris.
 

kay73

Bekanntes Mitglied
Du bist grundsätzlich auf dem richtigen Weg.

Aber lass dir eins gesagt sein: Diese Anbieter haben alles andere als Interesse daran, dass ihre Seiten geparst werden.. Wenn ich mich recht erinnere, verwendet bet365 eine ganz besondere JavaScript-Monstrosität und einen gigantischen HTTP-Post zum Darstellen der Wettangebote. Ich halte es für nicht wirtschaftlich, selbst eine Parseengine für einen solchen Dienst zu entwickeln, es sei denn, du willsten den x-Ten Bookieindexer bauen.

Vielleicht macht es eher Sinn zu schauen, ob man an die XML-Feeds herankommt:
XML Odds feed - The Punters Lounge - The World's Best Betting Forum

Ich würde mich nicht wundern, wenn die Browserweichen und andere Tricks auffahren, um Parseversuche zu entlarven.
 
Zuletzt bearbeitet:

chris.

Mitglied
Vielen Dank für die Antwort!
Daraus würde ich dann schlussfolgern, dass ich mit solchen HTML Scannern nicht weit kommen würde. Was wäre denn am geeignetsten in meiner Situation?
 

kay73

Bekanntes Mitglied
Es kommt drauf an, zu welchem Zweck Du die Daten brauchst. Es gibt kommerzielle Anbieter, die solche Indexierungen (mit höchstwahrscheinlich großem Aufwand) anbieten.

Schau auch mal meinen geänderten Post.

Ich habe mich auch mal dafür interessiert, es aber dann aufgegeben, da ich denke dass das Gebiet kommerziell abgegrast ist. Ausserdem ist der Glückspiel-Staatsvertrag noch in der Schwebe und Du kannst eine Abmahnung riskieren, wenn du Dienste in der Richtung in Deutschland anbietest...
 
Zuletzt bearbeitet:

ARadauer

Top Contributor
Generell ist es ein Ansatz der funktionieren kann, wenn die Seite entsprechend aufgebaut ist.
Falls die Seite eine API anbietet über die man sauber gewisse Daten abrufen kann, ist das natürlich besser. Aber ich bezweifle das bet365 sowas anbietet... ´naja vielleicht doch...
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
H Java 1.4 HTTPClient Content von PutMethod Netzwerkprogrammierung 4
C HTTP Content-Length nicht übermittelt!? Netzwerkprogrammierung 7
Hindi93 Content-Handler Netzwerkprogrammierung 9
M Http POST liefert kryptischen Content Netzwerkprogrammierung 4
D Content einer email in sql-datenbank speichern Netzwerkprogrammierung 9
mor16Euro Realetime Website Netzwerkprogrammierung 1
mor16Euro HTTP Php website mit Java aktualisiern Netzwerkprogrammierung 6
T HTTP JSoup Automatic Website Login Netzwerkprogrammierung 1
MaxG. Website in Swing öffnen Netzwerkprogrammierung 4
C Spezielle Daten aus Website entnehmen Netzwerkprogrammierung 5
S Website Überwachung Netzwerkprogrammierung 12
C Gerenderte Website nach der ausführung von JavaScript als HTML Code aus lesen Netzwerkprogrammierung 4
KingSquizzi3 Website parsen mit Hilfe von jsoup funktioniert nicht Netzwerkprogrammierung 3
F Website parsen, die mit javascript zusammengebaut wird Netzwerkprogrammierung 1
D Zugriff auf Webinhalte ohne visuelles Öffnen der Website Netzwerkprogrammierung 2
F HTTP Website parsen Fehler 403 Netzwerkprogrammierung 2
J Website-Zugriff beenden Netzwerkprogrammierung 11
I Website darstellen Java Netzwerkprogrammierung 3
D .txt meiner Website editieren Netzwerkprogrammierung 9
G Txt datei von Website downloaden Netzwerkprogrammierung 8
V Quelltaxt einer Website auslesen funktioniert nicht Netzwerkprogrammierung 2
V Angezeigten Text einer Website erfragen Netzwerkprogrammierung 4
P HttpClient - Daten einer Website "unvollständig" Netzwerkprogrammierung 5
S website auslesen schlägt fehl Netzwerkprogrammierung 20
G Kryptische Zeichen beim Auslesen einer Website Netzwerkprogrammierung 11
H Socket Mit Applet Verbindung zu eigener Website aufbauen Netzwerkprogrammierung 4
N Login auf Website Netzwerkprogrammierung 11
B Website Netzwerkprogrammierung 6
T Quelltext einer Website auslesen Netzwerkprogrammierung 3
S CRC32 check von website Netzwerkprogrammierung 3
L Logingeschützte Website mit mehreren Accs auslesen Netzwerkprogrammierung 3
O Per POST automatisch auf Website einloggen... Netzwerkprogrammierung 9

Ähnliche Java Themen


Oben