Html Seiten in SQL eintragen



  • Servus,
    Ich habe da ein Anliegen wobei ihr mir evtl. ein wenig helfen könntet 🙂
    Und zwar möchte ich gerne ein Programm schreiben welches mir den Quelltext
    aus einer Html Seite ausliest und mit Url in eine SQl Tabelle einträgt.
    Zudem habe ich an eine Funtkion gedacht die die entsprechenden Links aus
    dem Dokument liest und diese ebenfalls ausliest . Also solange bis auf allen
    Seiten keine Links mehr vorhanden sind . Ich kenne mich in diesem Bereich garnicht aus und
    weiß auch garnicht was da mit cpp so möglich ist bzw. welche libs dafür gut geignet sind.
    Ich freue mich auf eure Antworten , vielen Dank im voraus.
    Daniel



  • Wenn du unter Windows arbeitest, dann kannst du dafür die Funktion URLDownloadToFile (http://msdn.microsoft.com/en-us/library/ms775123%28VS.85%29.aspx) benutzen.

    Dann mußt du die Datei entsprechend parsen (z.B. nach <a href="..."> - Tags) und dann die Links verfolgen.
    Dabei mußt du aber aufpassen, daß du keine Endlos-Rekursion erzeugst (falls die HTML-Dateien sich gegenseitig verlinkt haben). Und evtl. nur Links der gleichen Domain verfolgen...



  • Und was hat das bitte mit Standard-C++ zu tun? Bitte die mit wichtig gekennzeichneten Threads vorm Posten lesen!



  • Dieser Thread wurde von Moderator/in pumuckl aus dem Forum C++ in das Forum Webzeugs verschoben.

    Im Zweifelsfall bitte auch folgende Hinweise beachten:
    C/C++ Forum :: FAQ - Sonstiges :: Wohin mit meiner Frage?

    Dieses Posting wurde automatisch erzeugt.



  • Das hier hat zwar absolut nichts mit Webzeugs zu tun ...
    (Keine Ahnung wie pumuckl darauf kommt)

    Hängt auch stark von der Entwicklungsumgebung ab.



  • Sry da war ich wohl reichlich neben der Spur 😞


Log in to reply