Strings/Text aus mit Browser geöffneter HTML-Seite auslesen



  • Seid gegrüßt ...

    Folgendes: Angenommen ich habe mir das WindowHandle auf ein fremdes geöffnetes (mit Mozilla Firefox ~) HTML-Fenster geholt und will den Text auslesen (der Text steht in einer Tabelle(<td> </td>)) ... wie macht man das? Kann ich jetzt einfach direkt auslesen oder nützt mir das WindowHandle gar nichts und ich muss die Datei mit meinem Programm downloaden und dann im Quelltext suchen? Oder muss ich die Datei nicht downloaden um im Quelltext zu lesen, oder noch anders :-).

    MfG dust



  • Also, den Text was Du in den anderen Fenstern "siehst" ist grundsätzlich Bitmaps.
    Denn im Prinzip wird jeder Text per TextOut() umgewandelt in Pixelgrafik. Und als solche Grafik ins Fenster hineinkopiert.

    Ergo: Text auslesen kannst Du nur wenn Du eine Art Schrifterkennung (OCR) für eine Bitmap hast (ähnlich wie bei guter Scanner-Software). Ansonsten bleibts Dir wohl oder übel nur Dein eigener Umweg über HTML herunterladen übrig...

    Was noch rein theoretisch machbar wäre: Firefox bietet Dir eine Schnittstelle zu den Informationen? Ich meine die Plug-In-Module können sicherlich an diese Infos rankommen? Da kenne ich mich aber nicht aus.

    Martin



  • hab grad noch entdeckt, dass die *.html nicht statisch ist, sondern die Daten an die ich ran will irgendwie durch Parameter geholt werden ..
    Beispiel: ".../htmlfile.html?action=details&id=2217247&..." ... bin kein Spezialist was das mit den Parametern angeht, aber könnten mir die nützen? Also wenn ich die HTML einfach sauge, dann sind die Daten nicht drin ...

    //Über die FireFox-Schnittstellen wollt ich nicht gehen, da das Programm später auch für andere Browser funktionieren soll



  • Tja, die Seite unter deinem Link ist leer.

    greetz, Swordfish

    BTW: Ich würd' die Datei per HTTP runterladen und dann parsen.



  • hm, man muss da wahrscheinlich angemeldet sein ... link wieder rausgenommen


Anmelden zum Antworten