selbstlernende textanalyse



  • hallo,

    ich möchte ein programm schreiben, welches text automatisch analysiert und kategoriesiert. Dabei möchte ich dem Programm keinerlei Informationen vorgeben, es soll zusammenhänge selber lernen. wie würdet ihr vorgehen?



  • was genau soll den analysiert werden? inhalt? sprache? vokabular?



  • der inhalt, das programm soll nach einer weile(also nach dem lesen von beispielsweise zehn texten) über ein thema selbstständig relationen herstellen können, bspw. dass eine Angina unter den Bereich Medizin fällt. usw.



  • texter schrieb:

    der inhalt, das programm soll nach einer weile(also nach dem lesen von beispielsweise zehn texten) über ein thema selbstständig relationen herstellen können, bspw. dass eine Angina unter den Bereich Medizin fällt. usw.

    das ist im grunde keine schwere angelegenheit.

    du musst dir selbst "wörterbücher" schreiben.
    das mit der Angina musst du dann da reinschreiben.

    nun liest du jedes einzelne wort aus dem text. danach vergleichst du das wort mit allen wörtern aus allen wöterbüchern.

    du musst da allerdings viel optimieren, weil das sonst viel zu langsam ist.

    außerdem solltest du vielleicht von vorneherein festlegen, welches wörterbuch benutzt werden soll, damit eben nur ein wörterbuch, und nicht alle durchsucht werden.


Log in to reply