xml aus einer seite lesen ohne die html tags...
-
servus an alle,
ich sitzt hier schon seit ein paar tagen und schreibe für einen kunden ein programm das sich auf einer seite einloggt und dann die kommende seite auslesen soll... also die xml inhalte... das einloggen passt, nur wenn ich auslesen will werden auch die html tags mitgenommen. wie kann ich den inhalt des browsers mitnehmen ohne den "hintergrund (quelltext)"?
browser.DocumentText liefert nur den gesamten quelltext...
wie kann man, wie gesagt, nur den inhalt mitnehmen ohne den quelltext?
greez denjo303
-
Ist unwahrscheinlich das das geht. Wie soll der body content denn aussehen? Wenn da eine Tabelle und Grafiken sind, wie soll er es dann Speichern? Man bekommt immer den kompletten HTML Inhalt, anders kann die Website nicht gespeichert werden.
Schnapp den doch und such die die Positionen der Start und Endknoten des XML Dokuments und extrahiere es dir mit Substring
-
das sind nur xml knoten... aber wenn ich das als QT rauszieh dann hab ich html tags dazwischen.... warum auch immer...
-
Du hast innerhalb des XML Baums HTML Elemente? Das riecht danach das das XML Dokument durch die Website noch formatiert wird, dh die Website zerpflückt das Xml selber um es dann zu Formatieren.
-
ich habs fast befürchtet... ok ich werd mich mal an die arbeit machen.. danke soweit..
oder gibts ne möglichkeit vom webbrowsercontrol ne seite ohne dialog zu speichern?
-
Wenn du vom Browser aus eine Website speichern lässt, dann speichert er auch nur das komplette HTML ab, dann hast du das HTML innerhalb des XML genauso.
Eventuell gibt es noch eine andere Schnittstelle, oder das du irgend woher erfährst woher das original XML Dokument genommen wird, und du direkt diesen Link anspringst.
Frag doch einfach den Website Betreiber ob er da eine Möglichkeit sieht.
-
das ist eine von ner sharepoint.dll erzeugten html mit xml knoten...
-
Kannst du damit was anfangen? http://blogs.msdn.com/b/kaevans/archive/2009/05/01/getting-xml-data-from-a-sharepoint-list-the-easy-way.aspx
weiter helfen kann ich nicht, hab SharePoint nie benutzt.
-
ok, danke,,, ich werds mir mal ansehen