Selbstbefriedigung für den guten Zweck?!?
-
minhen schrieb:
Du hast doch mehr als gezeigt, dass du keine Ahnung hast. Also was gibt's an dem Kommentar auszusetzen? Außer natürlich dass du ihn nicht magst.
Schutzbehauptung! 
-
minhen schrieb:
Mr. B schrieb:
Ich weiß nicht, ob "Massenmasturbationsmarathon" zum letzten Beispiel passen würde
Natürlich nicht. Lies doch noch mal was da steht

jo, ich kann lesen. ich kann sogar verstehen / interpretieren (lernt man im deutschunterricht [wenigstens n bisschen!]; man stelle sich das bitte einmal vor!)
* Neue Wortkombinationen: Dabei kann das Zusammenziehen von gebräuchlichen Wörtern (Internetcafe, Laptop-Tasche, auch als Retronym: Analoguhr)
noch mal: gebräuchliche wörter. und jetzt: Massenmasturbationsmarathon. besteht aus drei wörtern: Masse, die, Masturbation, die, Marathon, der.
Gebräuchliche Wörter? na ja... ich benutze sie vllt. einmal im monat... (und bitte komm mir nicht mit ner diskussion à la "armer wortschatz"; solche wörter benutzt ein normaler mensch, der nicht gerade für eine derartige branche arbeitet, nun mal selten im vergleich zu anderen wörtern.)von metaphorischen Neubildungen unterschieden werden. Bei letzteren ist für die Verwendung eines der Wörter nicht die tatsächliche Bedeutung, sondern eine charakteristische Eigenschaft entscheidend (Modezar, Literaturpapst, Börsenzwerg, Wirtschaftsauguren).
so. drei weitere schlagworte: metaphorisch, nicht die tatsächliche Bedeutung", charakteristische Eigenschaft. und jetzt noch mal: Massenmasturbationsmarathon.
irgendwelche der oben genannten drei kriterien, die zutreffen?"metaphorisch" - eher nicht, wie wir im post von lupo4u2 gelesen haben
"nicht die tatsächliche Bedeutung" - nein
"harakteristische Eigenschaft" - neinmeiner meinung nach nicht...
Mr. B
-
@Mr. B: Ich glaube, du missdeutest die Bedeutung von "gebräuchlich".
-
Zum Thema gebräuchliche Wörter, weil ich das schon lange nicht mehr gemacht habe:
$ lynx -dump -display_charset=utf8 http://www.c-plusplus.net/forum/viewtopic-var-t-is-153723-and-postdays-is-0-and-postorder-is-asc-and-start-is-30.html | grep -v '//' | egrep -io '[a-zäöüß]+' | sort | uniq -ci | sort -nr | tee cpp.frq | awk '{print $1}' > cpp.data
$ gnuplot
gnuplot> set ylabel "Haeufigkeit"
gnuplot> set xlabel "Rang"
gnuplot> set terminal jpeg
gnuplot> set output "cpp.jpg"
gnuplot> plot "cpp.data"Ergebnis: cpp.jpg
Quizfrage, wer weiß, was man hier sieht?
Hat was mit "gebräuchlichen Wörtern" zu tun - und lernt man ganz sicher nicht im Deutschunterricht
Wer das ganze nachmacht, kann ja mal einen klärenden Blick in die Datei "cpp.frq" werfen

-
wie jetzt, kriegt man da im normalen abendprogramm massig geschlechtsteile und so zu sehen? wie soll das genau ablaufen? auch mal grossaufnahmen um die individuelle technik zu kommentieren? ich stell mir grad einen kommentator wie bei sportereignissen vor.
-
minhen schrieb:
Quizfrage, wer weiß, was man hier sieht?
Zipf's Law?
-
-
Na, gebräuchlich bedeutet so viel wie geläufig. Ein deutsches Wort ist gebräuchlich, wenn es im Wortschatz fast aller deutschen Muttersprachler vorhanden ist und auch so ungefähr jeder weiß, was es bedeutet. "Marathon", "Masturbation" sowie "Masse" gehören dazu.
-
PeterTheMaster schrieb:
wie jetzt, kriegt man da im normalen abendprogramm massig geschlechtsteile und so zu sehen? wie soll das genau ablaufen? auch mal grossaufnahmen um die individuelle technik zu kommentieren? ich stell mir grad einen kommentator wie bei sportereignissen vor.
hehe, Werner hansch (die Stimme würde so geil passen ;)): "und da geht es auch schon in die zweite runde... ein gelungener Start für Gerd Müller... wenn er die Geschwindigkeit beibehält könnte das eine neue Bestzeit werden... und... AHHH!!!! SCHAAAAAAADE! auf den letzten Metern wurde er durch eine Verstauchung in seiner rechten Hand dazu gezwungen sich eine auszeit zu nehmen... so wird das nix mit einer Medaille für Deutchland..."
Und ich weiss auch wie es anfangen wird:
Michael Buffer (ehem. Ansager beim Wrestling + Boxen - wer ihn kennt, weiss wie geil der ist :)) macht seine berühmte Ansage in leicht abgewandelter Form: "LET'S GET READY TO FUMBLE!!!!!!"
ndT Lupo
Anpassung ist der Weg des geringsten Widerstandes -
doch der führt nirgendwo hin.
^Else Pannek^
-
oder so:
der Regen prasselt unaufhörlich im Fersehstadion in ?? und keiner wankt.....
broschnik, broschnik immer wieder broschnik ....
aus dem Hintergrund müsste Rahn schieße Rahn schießt Toooooor Tooooor Tooooor...
3:2 für Deutschland halten sie mich für verrückt halten sie mich für übergeschnappt ...
auch Wixerlaien sollten ein Herz fürs wixen zeigen ein Massenmasturbationsmarathon ist nur alle 4 Jahre ...
na wer hats erkannt??
-
Daniel E. schrieb:
minhen schrieb:
Quizfrage, wer weiß, was man hier sieht?
Zipf's Law?
Jupp, das ist es. Eine Definition von "gebräuchlichen Wörtern" über deren Verwendungshäufigkeit ist also sehr, sehr problematisch. Deutlich sinnvoller ist dagegen WebFritzis Vorschlag.
Gut, wenn man typische "Stop-Words" wie
$ zcat Korpora/freq.german.u8.gz | head -10
100286636 der
90699945 und
83970551 die
52774582 in
35725527 von
33774448 den
30064225 zu
28554052 mit
28536419 für
26141651 des
als die einzigen "gebräuchlichen" Wörter ansehen will, kann man natürich auch über die Häufigkeit gehen ...
-
WebFritzi schrieb:
Na, gebräuchlich bedeutet so viel wie geläufig. Ein deutsches Wort ist gebräuchlich, wenn es im Wortschatz fast aller deutschen Muttersprachler vorhanden ist und auch so ungefähr jeder weiß, was es bedeutet. "Marathon", "Masturbation" sowie "Masse" gehören dazu.
nein, gebräuchlich bedeutet nicht "so viel wie geläufig", sondern es bedeutet "so was wie" "häufig od. allgemein verwendet" ≈ "üblich". und genauso habe ich es in meiner vorherigen interpretation ausgelegt!
Mr. B
-
Mr. B schrieb:
WebFritzi schrieb:
Na, gebräuchlich bedeutet so viel wie geläufig. Ein deutsches Wort ist gebräuchlich, wenn es im Wortschatz fast aller deutschen Muttersprachler vorhanden ist und auch so ungefähr jeder weiß, was es bedeutet. "Marathon", "Masturbation" sowie "Masse" gehören dazu.
nein, gebräuchlich bedeutet nicht "so viel wie geläufig", sondern es bedeutet "so was wie" "häufig od. allgemein verwendet" ≈ "üblich". und genauso habe ich es in meiner vorherigen interpretation ausgelegt!
Hmm. Und woher nimmst du das? Ich will da mal deine Quellen sehen. Außerdem scheint mein Begriff von "gebräuchlich" der geläufigere zu sein.

-
WebFritzi schrieb:
Mr. B schrieb:
WebFritzi schrieb:
Na, gebräuchlich bedeutet so viel wie geläufig. Ein deutsches Wort ist gebräuchlich, wenn es im Wortschatz fast aller deutschen Muttersprachler vorhanden ist und auch so ungefähr jeder weiß, was es bedeutet. "Marathon", "Masturbation" sowie "Masse" gehören dazu.
nein, gebräuchlich bedeutet nicht "so viel wie geläufig", sondern es bedeutet "so was wie" "häufig od. allgemein verwendet" ≈ "üblich". und genauso habe ich es in meiner vorherigen interpretation ausgelegt!
Hmm. Und woher nimmst du das? Ich will da mal deine Quellen sehen. Außerdem scheint mein Begriff von "gebräuchlich" der geläufigere zu sein.

meine quelle ist encarta wörterbuch. zugegeben, nicht die zuverlässigste quelle, aber ich kann extra und nur für dich auch im duden schauen!
Mr. B
-
Der Duden definiert "gebräuchlich" als "allgemein üblich".
Ändert natürlich nichts an der Sache mitm ollen Zipf.
Und falls hier jemand einfach nur an dem Vokabular der Leute in diesem Thread zweifelt, hab ich das ganze noch schnell auf die selbe Art für die deutschen Texte des Project Gutenberg geplotet.
Die Datengrundlage ist diesmal also sowas wie:$ head -10 gutenberg.org/txt/2229.txt | egrep '\w'
Faust: Der Tragödie erster Teil
Johann Wolfgang von GoetheBei der Häufigkeitsverteilung dieses Threads konnte ich noch normale Skalierung verwenden. Diesmal musste ich aber für beide Achsen eine logarithmische Skala verwenden. Die Datenmenge ist einfach zu groß und die Häufigkeiten sinken einfach zu schnell und zu krass, als dass man ohne logarithmische Skalierung überhaupt was sehen könnte ...
Das Vokabular klassischer deutscher Schriftsteller:
http://img137.imageshack.us/img137/9236/logaz0.jpg
Man beachte, dass die Achsen nicht linear sondern logarithmisch skaliert sind!
-
Was ist den das Häufigste Wort beim Projekt Gutenberg?
Wär noch interessant..
-
Ja klar, überhaupt kein Problem. Liegt eh noch im Müll

$ head -10 .Trash/*.frq ==> .Trash/cpp.frq <== 23 nicht 19 die 18 der 16 c 15 und 14 Mitglied 14 ist 14 ich 13 in 12 Beiträge ==> .Trash/gutenberg.frq <== 414328 und 350239 der 342185 die 207503 in 176030 zu 156097 den 136336 das 130903 sich 128828 nicht 127887 sieDa sind jetzt auch gleich die häufigsten 10 von der vorigen Threadseite dabei

Die Häufigkeiten bei cpp.frq sind zwar doch sehr klein, aber man hat ja bereits gesehen, dass das ebenfalls schon die für die natürliche Sprache typische Verteilung ergibt.
Aber Marc++us kann ja auch gerne an seine Datenbank gehen
Das ist übrigens das eigentlich interessante. Die Art der Verteilung hängt weder von der Textart noch vom Umfang ab - nicht mal von der Sprache. So weit ich mich erinner, hat Zipf in seiner entsprechenden Arbeit sogar nur Englisch und Chinesisch untersucht. Hätte hier übrigens auch noch umfangreiche Frequenzlisten für Finnisch, Russisch und Italienisch - falls es wen interessiert
