Moin Community!
Ich lese mit Erfolg Webseiten mittels HTTPUnit aus, jedoch bekomme ich da den kompletten SiteQuelltext.
Gibt es etwas, das so wie html2text (Linux/Unix/derivative haben das ja implementiert) ?
Es ist zwar nett das ich per HTTPUnit den kompletten Quelltext bekomme, jedoch brauche ich nur die darzuistellende Text-Information.
HTTPUnit kommt deshalb zur Anwendung, da es sich um durch Sessions geschützte Seiten handelt und per Fromulareingabe, gewisse Seiten erst zur Anzeige gelangen.
Hat jemand eine Idee?
Wäre nett, wenn mir jemand weiterhelfen könnte.
lg
DocRandom
Ich lese mit Erfolg Webseiten mittels HTTPUnit aus, jedoch bekomme ich da den kompletten SiteQuelltext.
Gibt es etwas, das so wie html2text (Linux/Unix/derivative haben das ja implementiert) ?
Es ist zwar nett das ich per HTTPUnit den kompletten Quelltext bekomme, jedoch brauche ich nur die darzuistellende Text-Information.
HTTPUnit kommt deshalb zur Anwendung, da es sich um durch Sessions geschützte Seiten handelt und per Fromulareingabe, gewisse Seiten erst zur Anzeige gelangen.
Hat jemand eine Idee?
Wäre nett, wenn mir jemand weiterhelfen könnte.
lg
DocRandom