RTF in HTML umwandeln



  • Hey @all,

    Und zwar müssen wir in unserer Firma monatlich Word, PDF und HTML Berichte erzeugen.

    Das ganze läuft so ab, das der bericht von verschiedenen Personen zu einem Word Dokment zusmmengefügt wird, und anschließend als PDF gedruckt wird.

    Bisher habe ich es mit HTML so gemacht, das ich die jeweiligen Seiten vom Word-Dokument nach Dreamweaver kopiere, und diese dann formatiere. Nun ist es mir aber etwas zu blöd geworden, und habe mir überlegt, das Word-Dokument als RTF zu speichern, und mit meinem Programm zu einem vernünftigen formatierten HTML-Dokument zu konvertieren. Das HTML-Dokument hat grundsätzlich andere Formatierungen als das Word-Dokument.

    Nur wollte ich mal Fragen, ob ihr wisst wie das am einfachsten geht?

    Lg _freeze_



  • Was willst du eigentlich genau? So kann dir wohl keiner helfen!



  • Ich will unseren in der Firma geschriebenen Bericht in HTML konvertieren.
    Also RTF -> HTML. Nur halt nicht 1:1 sondern mit eigenen Formatierungen.

    Also zum Beispiel alle im Word geschriebenen "Überschrift 1" - Formate werden dann im HTML durch "<br><p class="Head1">........</p>" ersetzt. Da wir für alle HTML Dokumente eine CSS-Datei verwenden.

    Lg _freeze_



  • Ein IMO besserer Ansatz wäre, die Datei aus Word heraus als HTML abzuspeichern, ggf. ein Tool wie tidyhtml drüber laufen zu lassen, um den MS-Müll zu entfernen, und dann das Resultat zu parsen und anzupassen.
    Letzteres sollte deutlich einfacher sein als das Parsen der RTF-Formatanweisungen.


Anmelden zum Antworten