Selbstbefriedigung für den guten Zweck?!?
-
Na, gebräuchlich bedeutet so viel wie geläufig. Ein deutsches Wort ist gebräuchlich, wenn es im Wortschatz fast aller deutschen Muttersprachler vorhanden ist und auch so ungefähr jeder weiß, was es bedeutet. "Marathon", "Masturbation" sowie "Masse" gehören dazu.
-
PeterTheMaster schrieb:
wie jetzt, kriegt man da im normalen abendprogramm massig geschlechtsteile und so zu sehen? wie soll das genau ablaufen? auch mal grossaufnahmen um die individuelle technik zu kommentieren? ich stell mir grad einen kommentator wie bei sportereignissen vor.
hehe, Werner hansch (die Stimme würde so geil passen ;)): "und da geht es auch schon in die zweite runde... ein gelungener Start für Gerd Müller... wenn er die Geschwindigkeit beibehält könnte das eine neue Bestzeit werden... und... AHHH!!!! SCHAAAAAAADE! auf den letzten Metern wurde er durch eine Verstauchung in seiner rechten Hand dazu gezwungen sich eine auszeit zu nehmen... so wird das nix mit einer Medaille für Deutchland..."
Und ich weiss auch wie es anfangen wird:
Michael Buffer (ehem. Ansager beim Wrestling + Boxen - wer ihn kennt, weiss wie geil der ist :)) macht seine berühmte Ansage in leicht abgewandelter Form: "LET'S GET READY TO FUMBLE!!!!!!"
ndT Lupo
Anpassung ist der Weg des geringsten Widerstandes -
doch der führt nirgendwo hin.
^Else Pannek^
-
oder so:
der Regen prasselt unaufhörlich im Fersehstadion in ?? und keiner wankt.....
broschnik, broschnik immer wieder broschnik ....
aus dem Hintergrund müsste Rahn schieße Rahn schießt Toooooor Tooooor Tooooor...
3:2 für Deutschland halten sie mich für verrückt halten sie mich für übergeschnappt ...
auch Wixerlaien sollten ein Herz fürs wixen zeigen ein Massenmasturbationsmarathon ist nur alle 4 Jahre ...
na wer hats erkannt??
-
Daniel E. schrieb:
minhen schrieb:
Quizfrage, wer weiß, was man hier sieht?
Zipf's Law?
Jupp, das ist es. Eine Definition von "gebräuchlichen Wörtern" über deren Verwendungshäufigkeit ist also sehr, sehr problematisch. Deutlich sinnvoller ist dagegen WebFritzis Vorschlag.
Gut, wenn man typische "Stop-Words" wie
$ zcat Korpora/freq.german.u8.gz | head -10
100286636 der
90699945 und
83970551 die
52774582 in
35725527 von
33774448 den
30064225 zu
28554052 mit
28536419 für
26141651 des
als die einzigen "gebräuchlichen" Wörter ansehen will, kann man natürich auch über die Häufigkeit gehen ...
-
WebFritzi schrieb:
Na, gebräuchlich bedeutet so viel wie geläufig. Ein deutsches Wort ist gebräuchlich, wenn es im Wortschatz fast aller deutschen Muttersprachler vorhanden ist und auch so ungefähr jeder weiß, was es bedeutet. "Marathon", "Masturbation" sowie "Masse" gehören dazu.
nein, gebräuchlich bedeutet nicht "so viel wie geläufig", sondern es bedeutet "so was wie" "häufig od. allgemein verwendet" ≈ "üblich". und genauso habe ich es in meiner vorherigen interpretation ausgelegt!
Mr. B
-
Mr. B schrieb:
WebFritzi schrieb:
Na, gebräuchlich bedeutet so viel wie geläufig. Ein deutsches Wort ist gebräuchlich, wenn es im Wortschatz fast aller deutschen Muttersprachler vorhanden ist und auch so ungefähr jeder weiß, was es bedeutet. "Marathon", "Masturbation" sowie "Masse" gehören dazu.
nein, gebräuchlich bedeutet nicht "so viel wie geläufig", sondern es bedeutet "so was wie" "häufig od. allgemein verwendet" ≈ "üblich". und genauso habe ich es in meiner vorherigen interpretation ausgelegt!
Hmm. Und woher nimmst du das? Ich will da mal deine Quellen sehen. Außerdem scheint mein Begriff von "gebräuchlich" der geläufigere zu sein.

-
WebFritzi schrieb:
Mr. B schrieb:
WebFritzi schrieb:
Na, gebräuchlich bedeutet so viel wie geläufig. Ein deutsches Wort ist gebräuchlich, wenn es im Wortschatz fast aller deutschen Muttersprachler vorhanden ist und auch so ungefähr jeder weiß, was es bedeutet. "Marathon", "Masturbation" sowie "Masse" gehören dazu.
nein, gebräuchlich bedeutet nicht "so viel wie geläufig", sondern es bedeutet "so was wie" "häufig od. allgemein verwendet" ≈ "üblich". und genauso habe ich es in meiner vorherigen interpretation ausgelegt!
Hmm. Und woher nimmst du das? Ich will da mal deine Quellen sehen. Außerdem scheint mein Begriff von "gebräuchlich" der geläufigere zu sein.

meine quelle ist encarta wörterbuch. zugegeben, nicht die zuverlässigste quelle, aber ich kann extra und nur für dich auch im duden schauen!
Mr. B
-
Der Duden definiert "gebräuchlich" als "allgemein üblich".
Ändert natürlich nichts an der Sache mitm ollen Zipf.
Und falls hier jemand einfach nur an dem Vokabular der Leute in diesem Thread zweifelt, hab ich das ganze noch schnell auf die selbe Art für die deutschen Texte des Project Gutenberg geplotet.
Die Datengrundlage ist diesmal also sowas wie:$ head -10 gutenberg.org/txt/2229.txt | egrep '\w'
Faust: Der Tragödie erster Teil
Johann Wolfgang von GoetheBei der Häufigkeitsverteilung dieses Threads konnte ich noch normale Skalierung verwenden. Diesmal musste ich aber für beide Achsen eine logarithmische Skala verwenden. Die Datenmenge ist einfach zu groß und die Häufigkeiten sinken einfach zu schnell und zu krass, als dass man ohne logarithmische Skalierung überhaupt was sehen könnte ...
Das Vokabular klassischer deutscher Schriftsteller:
http://img137.imageshack.us/img137/9236/logaz0.jpg
Man beachte, dass die Achsen nicht linear sondern logarithmisch skaliert sind!
-
Was ist den das Häufigste Wort beim Projekt Gutenberg?
Wär noch interessant..
-
Ja klar, überhaupt kein Problem. Liegt eh noch im Müll

$ head -10 .Trash/*.frq ==> .Trash/cpp.frq <== 23 nicht 19 die 18 der 16 c 15 und 14 Mitglied 14 ist 14 ich 13 in 12 Beiträge ==> .Trash/gutenberg.frq <== 414328 und 350239 der 342185 die 207503 in 176030 zu 156097 den 136336 das 130903 sich 128828 nicht 127887 sieDa sind jetzt auch gleich die häufigsten 10 von der vorigen Threadseite dabei

Die Häufigkeiten bei cpp.frq sind zwar doch sehr klein, aber man hat ja bereits gesehen, dass das ebenfalls schon die für die natürliche Sprache typische Verteilung ergibt.
Aber Marc++us kann ja auch gerne an seine Datenbank gehen
Das ist übrigens das eigentlich interessante. Die Art der Verteilung hängt weder von der Textart noch vom Umfang ab - nicht mal von der Sprache. So weit ich mich erinner, hat Zipf in seiner entsprechenden Arbeit sogar nur Englisch und Chinesisch untersucht. Hätte hier übrigens auch noch umfangreiche Frequenzlisten für Finnisch, Russisch und Italienisch - falls es wen interessiert
