Bestes Tool um Word-Doc nach HTML zu konvertieren?



  • Hi,

    ich bin auf der Suche nach einem Tool/Webseite/Assistenten, der aus einem Word-Dokument mit eingebetteten Grafiken möglichst fehlerfreies(!) HTML erzeugt.

    Die Word "als HTML Speichern"-Variante ist ja nicht so der Hit.

    Die Grafiken sollten einfach abgetrennt werden, der Text in möglichst simples HTML konvertiert werden.

    Was sind da die Vorschläge dafür?

    Falls nötig, gehe ich auch über RTF oder PDF...



  • openoffice.org dürfe die besten importfilter für word haben, so wie ich die opensource community kenne schreibt er auch gültiges html oder es gibt filter die es zum gültigen html machen (ich habe das schon mal vor ne weile mit ooo gemacht, kann man mich aber nicht mehr an die details erinnern)

    wenn es dir nur um text geht würde ich catdoc benutzen


  • Mod

    was pdf zu html betrifft, da ist pdftohtml ziemlich gut.

    doc direkt zu HTML bekommst du nicht vernuenftig hin, maximal wie Gerard sagt, ueber OO.org - aber wenn dir das Ergebnis da auch nicht passt, dann vergiss alle Doc2Html konverter - ich habe noch keinen gesehen der halbwegs gut war.

    PS:
    was stoert dich an dem Word html export? ich habe damit bisher eher gute erfahrung gemacht...

    wenn es der HTML code ist, dann kannst du HTML Tidy drueber laufen lassen. Der hat nen extra Schalter fuer "repariere Word exportiertes HTML".



  • Shade Of Mine schrieb:

    was stoert dich an dem Word html export? ich habe damit bisher eher gute erfahrung gemacht...

    Naja, der packt soviele IDs&Co rein, daß es in einem HTML-Framework mit CSS bißchen hakt... weil er auch Styles mit exportiert. Ich hätte das eben gerne "nakt", aber will es auch nicht mit zu vielen Tools beaufschlagen, da das Word-Dokument das Zentraldokument ist, das weiter gepflegt wird, man sollte es also auch schon schnell in HTML updaten können.


  • Mod

    Jo, dachte ich mir.
    Ich denke Tidy ist sinnvollste... Kannst ja n Makro schreiben dass Tidy automatisch ueber den produzierten HTML Code laufen laesst. Aber Tidy hat diese Option extra fuer solche Situationen eingebaut 😉


Anmelden zum Antworten