html filtern
-
Hi,
ich möchte von einer Seite den html code auslesen und dann gewisse Informationen filtern und speichern. Gibt es da bestimmte Techniken diese Informationen zu filtern, sodass ich an meinem Code nicht viel ändern muss wenn mal das html Design ein wenig geändert wurde? Ich dieser html Datei befinden sich auser html noch eine Menge Javascript, css und andere unwichtige Infos.
Kennst sich da jemand aus, wie man da am besten vorgeht?Gruß
Felix
-
kannst du das Design beeinflussen? Wenn ja, dann makier doch die interessanten Stellen mit entsprechenden Tags, die du dann über CSS setzen kannst.
<!-- ... --> <div id="DatenA">Daten</div> <!-- ... -->
dann ist es ja egal, wie das Design aussieht (was ja eh über CSS geregelt wird
) und du musst immer nur nach dieser Stelle suchen (dann brauchst du noch nicht einmal einen wirklichen HTML Parser dafür)
-
kingruedi schrieb:
kannst du das Design beeinflussen? Wenn ja, dann makier doch die interessanten Stellen mit entsprechenden Tags, die du dann über CSS setzen kannst.
<!-- ... --> <div id="DatenA">Daten</div> <!-- ... -->
dann ist es ja egal, wie das Design aussieht (was ja eh über CSS geregelt wird
) und du musst immer nur nach dieser Stelle suchen (dann brauchst du noch nicht einmal einen wirklichen HTML Parser dafür)
Leider kann ich das Design nicht selber beeinflussen, sonst würd ich mir nur die Daten ohne Design ausgeben lassen. So ähnlich wie du das beschrieben hast kann ich das auch machen, nur muss ich als id die Farbwerte oder Formatierungen nehme. Das Problem ist nur wenn das Design geändert wird, dann funktioniert nichts mehr
-
Wenn du keinen Einfluss auf die Ausgabe hast, dann musst du deinen Code immer für ein neues Design entsprechend anpassen, wenn du keine anderen Hinweise hast, wo deine Daten stehen könnten (bestimmte Formatierung oder so)
-
hmm... mit Regular Expressions könnte dir vielleicht geholfen werden. Das sind eine Art erweiterte Suchmuster. Die boost-Library ( www.boost.org ) besitzt eine brauchbare RE-Implementation.