XML aus PDF extrahieren



  • Hallo ihr Lieben,
    ich suche nach einem Weg, mit dem ich ein eingebettetes XML aus einem PDF-Dokument extrahieren kann. Die Beispiele die ich im Netz bisher finden konnte funktionieren nicht (oder ich mache was falsch :-()
    Es wäre Klasse, wenn mir jemand helfen könnte.
    Letztendlich geht es darum, aus einer E-Rechnung den XML-Teil herauszuholen und die Rechnungsdaten weiter zu verwenden.

    Ich habe eine E-Rechnung vorliegen, wo der XML Teil "lesbar" ist, dass dann auseinanderzufummeln war kein Problem, aber wenn es eingebettet ist (Factur-X) kome ich nicht weiter.

    Vielen Dank im Voraus



  • Hi, hat echt niemand eine Idee, habe die Bibliothek von Apache laut Beispiel probiert, das funktioniert aber nicht. Da ich die Struktur nicht kenne, habe ich noch keine Lösung, wenn jemand weiter weiß, wäre das echt Klasse.
    Nochmal Vielen Dank


Anmelden zum Antworten