Reply to Regular Explessions und Flex on Thu, 22 Nov 2007 10:09:03 GMT

Tanren — Thu, 22 Nov 2007 10:09:03 GMT

Ich versuche einen Parser zu bauen der den relevanten Text aus einer HTML Seite
Extrahiert. Nun will ich erstmal das er alles was in bestimmten Tags ist rausschmeisst z.B. head und script.
Mit dem Tag funktioniert das auch, mit .

Schau mal nach, ob du mit Flex non-greedy matchen kannst. mit boost::regex geht das jedenfalls und perl kann das auch. aber flex is ja auch schon ganz schön alt

Reply to Regular Explessions und Flex on Thu, 22 Nov 2007 16:41:25 GMT

minhen — Thu, 22 Nov 2007 16:41:25 GMT

Bei flex gibts keine speziellen Greedy-Operatoren. Aber man kann das Problem mit Zuständen lösen. Und zwar würde ich bei gelesen, wechselt man halt wieder zum Initialzustand. Die Syntax dazu verrät einem das Manual von flex