CSV Algorithmus verwendbar im Textänderungen ausfindig zu machen?



  • Hallo Forum,

    wie läuft das Dateivergleichen in diesen CSV Systemen ab, wenn in der Datei neuer Code eingefügt worden ist? Kennt Ihr den Algo Namen?

    In meinem Fall möchte ich Einschübe (+Änderungen) in langen Wordtexten per VBA ausfindig machen. Also nicht unbedingt zeilenweise suchen, sondern Satz- Wortweise vergleichen und schauen wo jemand was verändert hat.

    Vielen Dank

    Peter



  • Wenn du nur festestellen möchtest, ob es eine Änderung gibt, brauchst du nichteinmal einen komplizierten Algorythmus.
    Du erstellst einfach die hashs der zwei Dateien und vergeleichst diese. Sind sie nicht gleich, hast du eine Änderung innerhalb der Dateien.

    Funktionier nunmal nur, wenn du dnicht auch wissen willst, was/wo/wie verändert wurde (:



  • Wenn es so einfach wäre *g*
    Ich möchte die Änderungen dann auch anzeigen. So wie in einem CSV System...



  • Der Basis-Algorithmus baut auf Levenshtein-Distanzen (Edit-Distanzen) auf http://de.wikipedia.org/wiki/Levenshtein-Distanz.
    Dieser Algorithmen gehört zum Bereich "Pattern Matching" bzw. "Sequenzvergleich".

    Die Komplexität dieses Algos beträgt O(n*m), wobei n und m jeweils die Stringlängen sind.



  • Vielen Dank Th69. Genau was ich gesucht habe 🙂



  • Bitte sehr. Damit hatte ich schon vor über 10 Jahren bei meiner Diplom-Arbeit (Pattern-Matching in (Gen-)Sequenzen) zu tun.


Log in to reply