PDF durchsuchen
-
Hallo,
ich suche nach einer Möglichkeit PDF Dokumente nach Text durchsuchen zu können. Für TIF Dateien habe ich die Microsoft MODI (Microsoft Office Document Imaging) Routinen gefunden.Gibt es so etwas auch für PDF ??
Ich finde da keinen Ansatz.
Bin für jeden Tipp dankbar!verwegener
-
Man kann natürlich die PDF-Specs von Adobe studieren und das selbst implementieren. Aber aber am besten greifst Du da auf Drittanbieterbibliotheken zurück.
Mit Modi wäre ich vorsichtig. Die waren mal Bestandteil von Office und sind mittlerweile nur noch umständlich auf die Rechner zu installieren. Du kannst auf iFilter gehen. Die sind für TIFF Bestandteil von Windows (müssen über Systemsteuerung nachinstalliert werden). Andere Hersteller liefern auch passende iFilter dazu. Adobe hatte das auch mal gemacht. Bin mir aber nicht mehr sicher ob das noch aktuell ist.
-
Nachtrag:
Bei PDFs musste du auch beachten, dass der Text lediglich ein eingebettetes Bild ist.