regex string ausschließen



  • hi.
    ich brauche einen regex, in dem icg einen bestimmten string ausschließen kann.
    zum besseren verständniss:

    string:
    <sd> sdrfg <sd> dsfghdsfhd </sd> </sd> 
    
    regex:
    (\<(.*?)\>).*?(?!\1)\<(/\2)>
    
    match:
    <sd> sdrfg <sd> dsfghdsfhd </sd>
    
    gewollt:
    <sd> dsfghdsfhd </sd>
    

    ".*?" akzeptiert leider den auszuschließenden string (?!\1).
    wie kann ich das verhindern?
    ich habe etwas rumprobiert, finde aber keinen weg...

    danke für alle hilfe

    ps.: zum testen der regex nutze ich diese seite: http://www.regexe.de/



  • Ja also, das is doch mal ein schönes Beispiel dafür, dass man html nicht mit RegEx parsen kann und es auch nicht mit solchen irregulären regulären Ausdrücken versuchen sollte.

    Hatten wir hier doch auch erst neulich. Da wurde auf dieses hier verwiesen: http://stackoverflow.com/a/1732454


Anmelden zum Antworten