<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[Ähnlichkeitsanalyse von Strings]]></title><description><![CDATA[<p>Hallo!</p>
<p>Habe mit einem neuen Projekt angefangen und habe da ein Problem, wo ich nicht so richtig weiß, wie ich das umsetzen soll.</p>
<p>Also, ich bin dabei ein kleines Programm zu schreiben, das automatisch ihm unbekannte Wörter lernt. Wenn der Benutzer nun dieses Wort wieder eingibt, allerdings mit 'nem Tippfehler, dann möchte ich, daß mein Programm trotzdem einen guten Vorschlag macht, sprich das richtige Wort als Korrektur vorschlägt.</p>
<p><strong>Beispiel:</strong><br />
Das Programm kennt die Wörter &quot;eins, einer, eines, zwei&quot;.<br />
Wenn der Benutzer nun &quot;ien&quot; eingibt, möchte ich die nahelegenden Einträge &quot;eins, einer, eines&quot; ausgeben lassen.</p>
<p>Bloß wie gesagt ich habe keine wirklich gute Idee wie man eine solche Analyse effizient gestaltet.<br />
Hat da jemand ein paar gute Tips oder gibts vielleicht sogar Quellcode (C++) irgendwo für solch ein Problem?</p>
<p>Vielen Dank,<br />
Tsunami</p>
]]></description><link>https://www.c-plusplus.net/forum/topic/179824/ähnlichkeitsanalyse-von-strings</link><generator>RSS for Node</generator><lastBuildDate>Fri, 03 Jul 2026 23:20:18 GMT</lastBuildDate><atom:link href="https://www.c-plusplus.net/forum/topic/179824.rss" rel="self" type="application/rss+xml"/><pubDate>Wed, 25 Apr 2007 15:46:40 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to Ähnlichkeitsanalyse von Strings on Wed, 25 Apr 2007 15:46:40 GMT]]></title><description><![CDATA[<p>Hallo!</p>
<p>Habe mit einem neuen Projekt angefangen und habe da ein Problem, wo ich nicht so richtig weiß, wie ich das umsetzen soll.</p>
<p>Also, ich bin dabei ein kleines Programm zu schreiben, das automatisch ihm unbekannte Wörter lernt. Wenn der Benutzer nun dieses Wort wieder eingibt, allerdings mit 'nem Tippfehler, dann möchte ich, daß mein Programm trotzdem einen guten Vorschlag macht, sprich das richtige Wort als Korrektur vorschlägt.</p>
<p><strong>Beispiel:</strong><br />
Das Programm kennt die Wörter &quot;eins, einer, eines, zwei&quot;.<br />
Wenn der Benutzer nun &quot;ien&quot; eingibt, möchte ich die nahelegenden Einträge &quot;eins, einer, eines&quot; ausgeben lassen.</p>
<p>Bloß wie gesagt ich habe keine wirklich gute Idee wie man eine solche Analyse effizient gestaltet.<br />
Hat da jemand ein paar gute Tips oder gibts vielleicht sogar Quellcode (C++) irgendwo für solch ein Problem?</p>
<p>Vielen Dank,<br />
Tsunami</p>
]]></description><link>https://www.c-plusplus.net/forum/post/1273366</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1273366</guid><dc:creator><![CDATA[Tsunami]]></dc:creator><pubDate>Wed, 25 Apr 2007 15:46:40 GMT</pubDate></item><item><title><![CDATA[Reply to Ähnlichkeitsanalyse von Strings on Wed, 25 Apr 2007 15:57:00 GMT]]></title><description><![CDATA[<p>Für den Anfang: Levenshtein-Distanz. Diese wird nicht vollständig dein Problem lösen aber es geht schon mal in diese Richtung.</p>
]]></description><link>https://www.c-plusplus.net/forum/post/1273374</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1273374</guid><dc:creator><![CDATA[CengizS]]></dc:creator><pubDate>Wed, 25 Apr 2007 15:57:00 GMT</pubDate></item><item><title><![CDATA[Reply to Ähnlichkeitsanalyse von Strings on Wed, 25 Apr 2007 18:36:21 GMT]]></title><description><![CDATA[<p>was vlt hilfreich sein kann sind tries <a href="http://www.eecs.harvard.edu/~ellard/Q-97/HTML/root/node22.html" rel="nofollow">http://www.eecs.harvard.edu/~ellard/Q-97/HTML/root/node22.html</a>. da können dann ähnliche wörter an einem ast hängen, wobei es bei unterschiedlichen anfangsbuchstaben schwerer wird.</p>
]]></description><link>https://www.c-plusplus.net/forum/post/1273497</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1273497</guid><dc:creator><![CDATA[fgbd]]></dc:creator><pubDate>Wed, 25 Apr 2007 18:36:21 GMT</pubDate></item><item><title><![CDATA[Reply to Ähnlichkeitsanalyse von Strings on Thu, 26 Apr 2007 07:21:58 GMT]]></title><description><![CDATA[<p>Sieh Dich mal nach &quot;Trigrammanalyse&quot; und &quot;Textcorpus&quot; um, vielleicht findest Du da was hilfreiches <img
      src="https://www.c-plusplus.net/forum/plugins/nodebb-plugin-emoji/emoji/emoji-one/1f609.png?v=ab1pehoraso"
      class="not-responsive emoji emoji-emoji-one emoji--winking_face"
      title=";)"
      alt="😉"
    /></p>
]]></description><link>https://www.c-plusplus.net/forum/post/1273695</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1273695</guid><dc:creator><![CDATA[Miq]]></dc:creator><pubDate>Thu, 26 Apr 2007 07:21:58 GMT</pubDate></item><item><title><![CDATA[Reply to Ähnlichkeitsanalyse von Strings on Thu, 26 Apr 2007 07:32:43 GMT]]></title><description><![CDATA[<p>Ähnliche Worte finden geht mit n-Grams wirklich sehr gut.<br />
Alternativ möchte ich noch einen SoundEx Algorithmus als mögliche Problemlösung in den Raum stellen.</p>
]]></description><link>https://www.c-plusplus.net/forum/post/1273705</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1273705</guid><dc:creator><![CDATA[Headhunter]]></dc:creator><pubDate>Thu, 26 Apr 2007 07:32:43 GMT</pubDate></item><item><title><![CDATA[Reply to Ähnlichkeitsanalyse von Strings on Thu, 26 Apr 2007 08:51:56 GMT]]></title><description><![CDATA[<p>Vielen Dank für die reichlichen Tips. Ich werde mal gucken was ich so an Material finde und dann mal schauen was sich machen läßt <img
      src="https://www.c-plusplus.net/forum/plugins/nodebb-plugin-emoji/emoji/emoji-one/1f603.png?v=ab1pehoraso"
      class="not-responsive emoji emoji-emoji-one emoji--grinning_face_with_big_eyes"
      title=":D"
      alt="😃"
    /></p>
]]></description><link>https://www.c-plusplus.net/forum/post/1273769</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1273769</guid><dc:creator><![CDATA[Tsunami]]></dc:creator><pubDate>Thu, 26 Apr 2007 08:51:56 GMT</pubDate></item><item><title><![CDATA[Reply to Ähnlichkeitsanalyse von Strings on Thu, 26 Apr 2007 17:19:18 GMT]]></title><description><![CDATA[<p>Habe mir mittels n-Grams einen Algorithmus (bigram) gebastelt der nicht nur einfach ist, sondern auch hervorragende Ergebnisse liefert. Bin selbst verdutzt wie gut das funktioniert <img
      src="https://www.c-plusplus.net/forum/plugins/nodebb-plugin-emoji/emoji/emoji-one/1f603.png?v=ab1pehoraso"
      class="not-responsive emoji emoji-emoji-one emoji--grinning_face_with_big_eyes"
      title=":D"
      alt="😃"
    /></p>
]]></description><link>https://www.c-plusplus.net/forum/post/1274132</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1274132</guid><dc:creator><![CDATA[Tsunami]]></dc:creator><pubDate>Thu, 26 Apr 2007 17:19:18 GMT</pubDate></item><item><title><![CDATA[Reply to Ähnlichkeitsanalyse von Strings on Thu, 26 Apr 2007 18:14:38 GMT]]></title><description><![CDATA[<p>n-Gramm , Hidden Markov Modell [HMM] und Backus Naur Form [BNF]) kann ich auch empfehlen.</p>
<p><a href="http://de.wikipedia.org/wiki/N-Gramm" rel="nofollow">http://de.wikipedia.org/wiki/N-Gramm</a><br />
<a href="http://en.wikipedia.org/wiki/Backus-Naur_form" rel="nofollow">http://en.wikipedia.org/wiki/Backus-Naur_form</a><br />
<a href="http://de.wikipedia.org/wiki/Hidden_Markov_Model" rel="nofollow">http://de.wikipedia.org/wiki/Hidden_Markov_Model</a></p>
<p>Man erziehlt aber bessere Resultate, wenn man versucht die Semantik zu integrieren, zum Bleistift mit OWL &amp; RDF(S). Das würde dein &quot;kleines Projekt&quot; aber ein wenig aus den Rahmen heben <img
      src="https://www.c-plusplus.net/forum/plugins/nodebb-plugin-emoji/emoji/emoji-one/1f609.png?v=ab1pehoraso"
      class="not-responsive emoji emoji-emoji-one emoji--winking_face"
      title=";)"
      alt="😉"
    /></p>
<p><a href="http://de.wikipedia.org/wiki/Semantisches_Netz" rel="nofollow">http://de.wikipedia.org/wiki/Semantisches_Netz</a></p>
]]></description><link>https://www.c-plusplus.net/forum/post/1274166</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1274166</guid><dc:creator><![CDATA[Prof84]]></dc:creator><pubDate>Thu, 26 Apr 2007 18:14:38 GMT</pubDate></item></channel></rss>