Erkennung der Sprache einer Internetseite
-
Hallo!
Mich würde mal interessieren wie z.B. Google die Sprache einer Seite anscheinend sehr genau erkennt.
Gibt es da einen Trick oder ist es das Zusammenspiel mehrerer Techniken wie z.B. Erkennung der Seite aus welchem Land sie kommt, stichprobenhaftige Überprüfung von Wörtern etc.?Würde mich über jede Antwort freuen!
Gruß:
-
wie genau das Google macht weiss ich nicht. Aber es bietet sich natürlich an, die Meta-Tags einer Webseite zu betrachten, die ja in einigen Fällen Informationen über die Verwendete Sprache beinhalten. Ansonsten kannst du natürlich auch nach der tld gehen. Nur ist das nicht immer so richtig
-
wie du schon sagtest spielen da häufig mehrere methoden zusammen... z.B. bestimmte wörter, bestimmte buchstaben (wie umlaute im deutschen) oder die häufigkeit der buchstaben.
-
Gut, danke! Ich dachte es gebe da irgendeinen besonderen Trick für.
-
Also auf die Metatags kann man sich nur selten verlassen. Wenn sie denn mal da sind dann haben sie oft irgendwelche Editorprogramme automatisch erzeugt. Und von deren Sprache kannst du nicht auf die Sprache des Users schließen (ich benutze z.B. ~40% ausländische Software).