Links auslesen
-
Hi,
Ich versuche mit meinem Programm die Links auf einer Seite auszulesen.
while(dup.Pos("http://") > 0) { count++; buf = dup.SubString(dup.Pos("http://"), dup.Pos('\"')); EOutgoingLinks->Lines->Add(buf); dup = dup.SubString(dup.Pos("http://") + 8, dup.Length()); }
Die Ausgabe sieht komischerweise so aus:
http://images.google.de/imghp?hl=de&tab=wi" c
http://video.google.de/?hl=de&tab=w
http://maps.google.de/maps?hl
http://news.google.de/nwshp?hl=d
http://www.google.de/prdhp?hl=de&
http://mail.google.com/mail/?hl=
http://www.google.de/intl/de/optio
http://www.google.de/ig%3Fhl%3
http://www.google.de/" class=gb4>Anmelden</a></nobr></div><div class=gbh style=le
http://www.gooKann mir jemand sagen, was ich falsch mache ? Gibt vieleicht dup.Pos('\"') einen falschen Wert zurück ?
Danke,
Wiesel
-
Kleine Zusatzinformation:
In dup ist der Quelltext gespeichert und buf ist ein AnsiString.
-
Debugger?
-
Der 2. Parameter von SubString ist die Anzahl und nicht die Endposition !