Selbstbefriedigung für den guten Zweck?!?

WebFritzi

Na, gebräuchlich bedeutet so viel wie geläufig. Ein deutsches Wort ist gebräuchlich, wenn es im Wortschatz fast aller deutschen Muttersprachler vorhanden ist und auch so ungefähr jeder weiß, was es bedeutet. "Marathon", "Masturbation" sowie "Masse" gehören dazu.

Lupo4u2

PeterTheMaster schrieb:

wie jetzt, kriegt man da im normalen abendprogramm massig geschlechtsteile und so zu sehen? wie soll das genau ablaufen? auch mal grossaufnahmen um die individuelle technik zu kommentieren? ich stell mir grad einen kommentator wie bei sportereignissen vor.

hehe, Werner hansch (die Stimme würde so geil passen ;)): "und da geht es auch schon in die zweite runde... ein gelungener Start für Gerd Müller... wenn er die Geschwindigkeit beibehält könnte das eine neue Bestzeit werden... und... AHHH!!!! SCHAAAAAAADE! auf den letzten Metern wurde er durch eine Verstauchung in seiner rechten Hand dazu gezwungen sich eine auszeit zu nehmen... so wird das nix mit einer Medaille für Deutchland..."

Und ich weiss auch wie es anfangen wird:
Michael Buffer (ehem. Ansager beim Wrestling + Boxen - wer ihn kennt, weiss wie geil der ist :)) macht seine berühmte Ansage in leicht abgewandelter Form: "LET'S GET READY TO FUMBLE!!!!!!"

ndT Lupo

Anpassung ist der Weg des geringsten Widerstandes -
doch der führt nirgendwo hin.
^Else Pannek^

Polofreak

oder so:

der Regen prasselt unaufhörlich im Fersehstadion in ?? und keiner wankt.....

broschnik, broschnik immer wieder broschnik ....

aus dem Hintergrund müsste Rahn schieße Rahn schießt Toooooor Tooooor Tooooor...

3:2 für Deutschland halten sie mich für verrückt halten sie mich für übergeschnappt ...

auch Wixerlaien sollten ein Herz fürs wixen zeigen ein Massenmasturbationsmarathon ist nur alle 4 Jahre ...

na wer hats erkannt??

minhen

Daniel E. schrieb:

minhen schrieb:

Quizfrage, wer weiß, was man hier sieht?

Zipf's Law?

Jupp, das ist es. Eine Definition von "gebräuchlichen Wörtern" über deren Verwendungshäufigkeit ist also sehr, sehr problematisch. Deutlich sinnvoller ist dagegen WebFritzis Vorschlag.
Gut, wenn man typische "Stop-Words" wie
$ zcat Korpora/freq.german.u8.gz | head -10
100286636 der
90699945 und
83970551 die
52774582 in
35725527 von
33774448 den
30064225 zu
28554052 mit
28536419 für
26141651 des
als die einzigen "gebräuchlichen" Wörter ansehen will, kann man natürich auch über die Häufigkeit gehen ...

Mr. B

WebFritzi schrieb:

Na, gebräuchlich bedeutet so viel wie geläufig. Ein deutsches Wort ist gebräuchlich, wenn es im Wortschatz fast aller deutschen Muttersprachler vorhanden ist und auch so ungefähr jeder weiß, was es bedeutet. "Marathon", "Masturbation" sowie "Masse" gehören dazu.

nein, gebräuchlich bedeutet nicht "so viel wie geläufig", sondern es bedeutet "so was wie" "häufig od. allgemein verwendet" ≈ "üblich". und genauso habe ich es in meiner vorherigen interpretation ausgelegt!

Mr. B

WebFritzi

Mr. B schrieb:

WebFritzi schrieb:

Na, gebräuchlich bedeutet so viel wie geläufig. Ein deutsches Wort ist gebräuchlich, wenn es im Wortschatz fast aller deutschen Muttersprachler vorhanden ist und auch so ungefähr jeder weiß, was es bedeutet. "Marathon", "Masturbation" sowie "Masse" gehören dazu.

nein, gebräuchlich bedeutet nicht "so viel wie geläufig", sondern es bedeutet "so was wie" "häufig od. allgemein verwendet" ≈ "üblich". und genauso habe ich es in meiner vorherigen interpretation ausgelegt!

Hmm. Und woher nimmst du das? Ich will da mal deine Quellen sehen. Außerdem scheint mein Begriff von "gebräuchlich" der geläufigere zu sein.

Mr. B

WebFritzi schrieb:

Mr. B schrieb:

WebFritzi schrieb:

Na, gebräuchlich bedeutet so viel wie geläufig. Ein deutsches Wort ist gebräuchlich, wenn es im Wortschatz fast aller deutschen Muttersprachler vorhanden ist und auch so ungefähr jeder weiß, was es bedeutet. "Marathon", "Masturbation" sowie "Masse" gehören dazu.

nein, gebräuchlich bedeutet nicht "so viel wie geläufig", sondern es bedeutet "so was wie" "häufig od. allgemein verwendet" ≈ "üblich". und genauso habe ich es in meiner vorherigen interpretation ausgelegt!

Hmm. Und woher nimmst du das? Ich will da mal deine Quellen sehen. Außerdem scheint mein Begriff von "gebräuchlich" der geläufigere zu sein.

meine quelle ist encarta wörterbuch. zugegeben, nicht die zuverlässigste quelle, aber ich kann extra und nur für dich auch im duden schauen!

Mr. B

minhen

Der Duden definiert "gebräuchlich" als "allgemein üblich".

Ändert natürlich nichts an der Sache mitm ollen Zipf.
Und falls hier jemand einfach nur an dem Vokabular der Leute in diesem Thread zweifelt, hab ich das ganze noch schnell auf die selbe Art für die deutschen Texte des Project Gutenberg geplotet.
Die Datengrundlage ist diesmal also sowas wie:

$ head -10 gutenberg.org/txt/2229.txt | egrep '\w'
Faust: Der Tragödie erster Teil
Johann Wolfgang von Goethe

Bei der Häufigkeitsverteilung dieses Threads konnte ich noch normale Skalierung verwenden. Diesmal musste ich aber für beide Achsen eine logarithmische Skala verwenden. Die Datenmenge ist einfach zu groß und die Häufigkeiten sinken einfach zu schnell und zu krass, als dass man ohne logarithmische Skalierung überhaupt was sehen könnte ...

Das Vokabular klassischer deutscher Schriftsteller:
http://img137.imageshack.us/img137/9236/logaz0.jpg
Man beachte, dass die Achsen nicht linear sondern logarithmisch skaliert sind!

THX 1138

Was ist den das Häufigste Wort beim Projekt Gutenberg?
Wär noch interessant..

minhen

Ja klar, überhaupt kein Problem. Liegt eh noch im Müll

$ head -10 .Trash/*.frq
==> .Trash/cpp.frq <==
     23 nicht
     19 die
     18 der
     16 c
     15 und
     14 Mitglied
     14 ist
     14 ich
     13 in
     12 Beiträge

==> .Trash/gutenberg.frq <==
 414328 und
 350239 der
 342185 die
 207503 in
 176030 zu
 156097 den
 136336 das
 130903 sich
 128828 nicht
 127887 sie

Da sind jetzt auch gleich die häufigsten 10 von der vorigen Threadseite dabei
Die Häufigkeiten bei cpp.frq sind zwar doch sehr klein, aber man hat ja bereits gesehen, dass das ebenfalls schon die für die natürliche Sprache typische Verteilung ergibt.
Aber Marc++us kann ja auch gerne an seine Datenbank gehen

Das ist übrigens das eigentlich interessante. Die Art der Verteilung hängt weder von der Textart noch vom Umfang ab - nicht mal von der Sprache. So weit ich mich erinner, hat Zipf in seiner entsprechenden Arbeit sogar nur Englisch und Chinesisch untersucht. Hätte hier übrigens auch noch umfangreiche Frequenzlisten für Finnisch, Russisch und Italienisch - falls es wen interessiert