Alle Links eines HTML-Dokuments auflisten
-
Hi,
gibts irgend ne einfache Möglichkeit, aus einem HTML-Dokunebt säntliche Links und sonstige urls rauszuhohlen und in einer Liste zu speichern?Ich hab mir überlegt, das Dokument nach "href=" und "src=" zu durchsuchen, aber dann müsste ich noch rausfinden, wo die url endet, ob und welche anführungszeichen verwendet werden,.... und beor ich mir da n ewig langen code für schreib, frag ich doch lieber mal nach na einfacheren methode
Also, ich wär für ideen echt dankbar
-
boost::regex oder eine andere Regular Expression Library ist da wohl erste Wahl.
-
an sowas mit rehulären ausdrücken, hab ich auch schon gedacht, aber ich hab absolut keine ahnung wie man die verwendet... gibts da irgendwo n tutorial oder sowas drüber (über reguläre ausdrücke)? am besten wär auf deutsch
-
Etliche..
http://www.linuxfibel.de/regex.htm