Ein Word - Dokument auslesen welches eine Tabelle enthält



  • Hi@all,

    Wie kann ich mit CFile ein Word Dokument auslesen welches eine Tabelle beinhaltet?
    Ganz Normal über file.Read(...) oder aber auch file.ReadString(..) bekomm ich nur Hyroglyphen.

    Für jede Hilfe wie immer aüßerst dankbar:)

    Gruß

    crazyp



  • Den Link http://www.wotsit.org/search.asp?page=2&s=database hab ich mir mal von Polofreak geklaut. 🙂

    Ich hatte noch nicht die Zeit, genauer zu gucken, was da so alles zu finden ist, aber vielleicht hilft es dir.



  • Interessante Seite, hat mir hierfür aber leider nicht weitergeholfen.
    Sonstige Ideen werden gerne angenommen:)



  • Wenn du das zu Testzwecken mal so machst

    CStdioFile File;
    CString cZeile;
    
    if(File.Open("C:\\Test.doc", CStdioFile::modeRead))
    {
    	unsigned long Laenge = File.GetLength();
    
    	while (File.GetPosition() != Laenge)
    	{
    		File.ReadString(cZeile); // Zeile lesen
    		AfxMessageBox(cZeile);
    	}
    
    	File.Close();
    }
    

    dann sollten eigentlich erst einmal ein paar MessageBoxen mit Hyroglyphen auftauchen, dann irgendwann eine MessageBox mit dem kompletten Text aus dem Worddokument und dann wieder MessageBoxen mit Hyroglyphen.

    Das Problem liegt, glaube ich, eher daran, dass Word nicht \r\n als Zeilenumbruch benutzt sondern ein eigenes Format. Ebenso bei Zellenendeformatierungen, wenn eine Tabelle enthalten ist. Mit CFile wird es ähnlich sein. Auslesen kannst du ein Word-Dokument so, aber den Inhalt musst du anders herausfiltern. Die Hyroglyphen sind wahrscheinlich irgendwelche Formatierungen, Schriftarten usw..

    Welche Zeilenumbrüche oder Zellenenden Word benutzt, weiss ich aber auch nicht. Aber wenn man das weiss, kann man das Ausgelesene auch wieder richtig parsen...



  • Wenn du das Format nicht selbst zerlegen willst dann wirst du wohl mit COM
    zugreifen müssen.



  • schau dir mal das hier an! 😉 😃


Log in to reply