Selbstbefriedigung für den guten Zweck?!?



  • Na, gebräuchlich bedeutet so viel wie geläufig. Ein deutsches Wort ist gebräuchlich, wenn es im Wortschatz fast aller deutschen Muttersprachler vorhanden ist und auch so ungefähr jeder weiß, was es bedeutet. "Marathon", "Masturbation" sowie "Masse" gehören dazu.



  • PeterTheMaster schrieb:

    wie jetzt, kriegt man da im normalen abendprogramm massig geschlechtsteile und so zu sehen? wie soll das genau ablaufen? auch mal grossaufnahmen um die individuelle technik zu kommentieren? ich stell mir grad einen kommentator wie bei sportereignissen vor.

    hehe, Werner hansch (die Stimme würde so geil passen ;)): "und da geht es auch schon in die zweite runde... ein gelungener Start für Gerd Müller... wenn er die Geschwindigkeit beibehält könnte das eine neue Bestzeit werden... und... AHHH!!!! SCHAAAAAAADE! auf den letzten Metern wurde er durch eine Verstauchung in seiner rechten Hand dazu gezwungen sich eine auszeit zu nehmen... so wird das nix mit einer Medaille für Deutchland..."

    Und ich weiss auch wie es anfangen wird:
    Michael Buffer (ehem. Ansager beim Wrestling + Boxen - wer ihn kennt, weiss wie geil der ist :)) macht seine berühmte Ansage in leicht abgewandelter Form: "LET'S GET READY TO FUMBLE!!!!!!" 😃

    ndT Lupo

    Anpassung ist der Weg des geringsten Widerstandes -
    doch der führt nirgendwo hin.

    ^Else Pannek^



  • oder so:

    der Regen prasselt unaufhörlich im Fersehstadion in ?? und keiner wankt.....

    broschnik, broschnik immer wieder broschnik ....

    aus dem Hintergrund müsste Rahn schieße Rahn schießt Toooooor Tooooor Tooooor...

    3:2 für Deutschland halten sie mich für verrückt halten sie mich für übergeschnappt ...

    auch Wixerlaien sollten ein Herz fürs wixen zeigen ein Massenmasturbationsmarathon ist nur alle 4 Jahre ...

    na wer hats erkannt??



  • Daniel E. schrieb:

    minhen schrieb:

    Quizfrage, wer weiß, was man hier sieht?

    Zipf's Law?

    Jupp, das ist es. Eine Definition von "gebräuchlichen Wörtern" über deren Verwendungshäufigkeit ist also sehr, sehr problematisch. Deutlich sinnvoller ist dagegen WebFritzis Vorschlag.
    Gut, wenn man typische "Stop-Words" wie
    $ zcat Korpora/freq.german.u8.gz | head -10
    100286636 der
    90699945 und
    83970551 die
    52774582 in
    35725527 von
    33774448 den
    30064225 zu
    28554052 mit
    28536419 für
    26141651 des
    als die einzigen "gebräuchlichen" Wörter ansehen will, kann man natürich auch über die Häufigkeit gehen ...



  • WebFritzi schrieb:

    Na, gebräuchlich bedeutet so viel wie geläufig. Ein deutsches Wort ist gebräuchlich, wenn es im Wortschatz fast aller deutschen Muttersprachler vorhanden ist und auch so ungefähr jeder weiß, was es bedeutet. "Marathon", "Masturbation" sowie "Masse" gehören dazu.

    nein, gebräuchlich bedeutet nicht "so viel wie geläufig", sondern es bedeutet "so was wie" "häufig od. allgemein verwendet" ≈ "üblich". und genauso habe ich es in meiner vorherigen interpretation ausgelegt!

    Mr. B



  • Mr. B schrieb:

    WebFritzi schrieb:

    Na, gebräuchlich bedeutet so viel wie geläufig. Ein deutsches Wort ist gebräuchlich, wenn es im Wortschatz fast aller deutschen Muttersprachler vorhanden ist und auch so ungefähr jeder weiß, was es bedeutet. "Marathon", "Masturbation" sowie "Masse" gehören dazu.

    nein, gebräuchlich bedeutet nicht "so viel wie geläufig", sondern es bedeutet "so was wie" "häufig od. allgemein verwendet" ≈ "üblich". und genauso habe ich es in meiner vorherigen interpretation ausgelegt!

    Hmm. Und woher nimmst du das? Ich will da mal deine Quellen sehen. Außerdem scheint mein Begriff von "gebräuchlich" der geläufigere zu sein. 😉



  • WebFritzi schrieb:

    Mr. B schrieb:

    WebFritzi schrieb:

    Na, gebräuchlich bedeutet so viel wie geläufig. Ein deutsches Wort ist gebräuchlich, wenn es im Wortschatz fast aller deutschen Muttersprachler vorhanden ist und auch so ungefähr jeder weiß, was es bedeutet. "Marathon", "Masturbation" sowie "Masse" gehören dazu.

    nein, gebräuchlich bedeutet nicht "so viel wie geläufig", sondern es bedeutet "so was wie" "häufig od. allgemein verwendet" ≈ "üblich". und genauso habe ich es in meiner vorherigen interpretation ausgelegt!

    Hmm. Und woher nimmst du das? Ich will da mal deine Quellen sehen. Außerdem scheint mein Begriff von "gebräuchlich" der geläufigere zu sein. 😉

    meine quelle ist encarta wörterbuch. zugegeben, nicht die zuverlässigste quelle, aber ich kann extra und nur für dich auch im duden schauen!

    Mr. B



  • Der Duden definiert "gebräuchlich" als "allgemein üblich".

    Ändert natürlich nichts an der Sache mitm ollen Zipf.
    Und falls hier jemand einfach nur an dem Vokabular der Leute in diesem Thread zweifelt, hab ich das ganze noch schnell auf die selbe Art für die deutschen Texte des Project Gutenberg geplotet.
    Die Datengrundlage ist diesmal also sowas wie:

    $ head -10 gutenberg.org/txt/2229.txt | egrep '\w'
    Faust: Der Tragödie erster Teil
    Johann Wolfgang von Goethe

    Bei der Häufigkeitsverteilung dieses Threads konnte ich noch normale Skalierung verwenden. Diesmal musste ich aber für beide Achsen eine logarithmische Skala verwenden. Die Datenmenge ist einfach zu groß und die Häufigkeiten sinken einfach zu schnell und zu krass, als dass man ohne logarithmische Skalierung überhaupt was sehen könnte ...

    Das Vokabular klassischer deutscher Schriftsteller:
    http://img137.imageshack.us/img137/9236/logaz0.jpg
    Man beachte, dass die Achsen nicht linear sondern logarithmisch skaliert sind!



  • Was ist den das Häufigste Wort beim Projekt Gutenberg?
    Wär noch interessant..



  • Ja klar, überhaupt kein Problem. Liegt eh noch im Müll 😉

    $ head -10 .Trash/*.frq
    ==> .Trash/cpp.frq <==
         23 nicht
         19 die
         18 der
         16 c
         15 und
         14 Mitglied
         14 ist
         14 ich
         13 in
         12 Beiträge
    
    ==> .Trash/gutenberg.frq <==
     414328 und
     350239 der
     342185 die
     207503 in
     176030 zu
     156097 den
     136336 das
     130903 sich
     128828 nicht
     127887 sie
    

    Da sind jetzt auch gleich die häufigsten 10 von der vorigen Threadseite dabei 😉
    Die Häufigkeiten bei cpp.frq sind zwar doch sehr klein, aber man hat ja bereits gesehen, dass das ebenfalls schon die für die natürliche Sprache typische Verteilung ergibt.
    Aber Marc++us kann ja auch gerne an seine Datenbank gehen 😃

    Das ist übrigens das eigentlich interessante. Die Art der Verteilung hängt weder von der Textart noch vom Umfang ab - nicht mal von der Sprache. So weit ich mich erinner, hat Zipf in seiner entsprechenden Arbeit sogar nur Englisch und Chinesisch untersucht. Hätte hier übrigens auch noch umfangreiche Frequenzlisten für Finnisch, Russisch und Italienisch - falls es wen interessiert 😉


Anmelden zum Antworten