Statistik: Vergleich zweier geschätzter Verteilungen
-
Hallo zusammen,
ich hoffe mal, hier gibt es jemanden, der sich ein wenig mit Statistik auskennt:
Ich habe da ein Problem mit einem statistischen Test. Ich habe zwei Stichproben aus zwei mir unbekannten Verteilungen. Die funktionale Form der Verteilungen ist leider vollkommen unbekannt und hat augenscheinlich auch keine Ähnlichkeit mit irgendwelchen Standardverteilungen. Die beste Schätzung für die Verteilungen die ich aus den Stichproben bekommen kann ist daher wohl einfach eine Stufenfunktion, indem ich aus den Stichproben ein Histogramm mache.
Kennt jemand einen Test, mit dem man angeben kann, ob die beiden Stichproben aus der selben Verteilung stammen? Ich kenne nur Tests, die mir sagen, ob die Stichproben den selben Mittelwert oder die selbe Streuung haben. Gibt es das auch für ganze Verteilungen? Das Problem sollte doch eigentlich recht häufig auftauchen.
Was mir bisher eingefallen ist, aber mit dem ich nicht wirklich zufrieden bin: Ich nehme die Schätzungen der beiden Verteilungen (also die Histogramme) und rechne aus, wie stark diese sich überdecken. Das Ergebnis ist dann allerdings abhängig davon, wie fein ich die Abschnitte des histogrammes wähle. Daher habe ich mir auch noch keine großen Gedanken gemacht, wie signifikant die Ergebnisse dieser Methode sind.
Hat jemand irgendeine Idee das besser zu machen oder kennt eine Methode die dies leistet?
Danke schonmal im voraus!
P.S.: Das ganze ist übrigens zweidimensional, für den Fall das diese Information weiterhilft.
-
Hallo!
Ich finde, darüber lohnt es sich nicht nachzudenken.
Selbst wenn Du eine Korrelation zwischen den Histogrammen vermutest, so kann man bei zwei Verteilungen nicht von einer Signifikanz sprechen. Zumal die Korrelation bei den Histogrammintervalen wahrscheinlich immer unschärfer werden sollten.
cu
P84
-
SeppJ schrieb:
Hallo zusammen,
ich hoffe mal, hier gibt es jemanden, der sich ein wenig mit Statistik auskennt:
Ich habe da ein Problem mit einem statistischen Test. Ich habe zwei Stichproben aus zwei mir unbekannten Verteilungen.[...]
Du könntest es mit dem Chi-Quadrat und Kolmogorov-Smirnov-Test versuchen. Ich bin mir da aber gerade nicht sicher ob man die auch auf mehrdimensionale Merkmale anwenden kann. Und schau mal im Netz nach "BestFit" von Palisade, das ist IMO ein Excel Plugin womit du schnell schätzen lassen kannst auf welche Verteilung deine Daten passen, manchmal sieht es nicht so aus das es sich bei den gegebenen Daten um Verteilung X handelt.
EDIT: Ich bin mir recht sicher das R auch die multivariaten Versionen kennt.
-
TheTester schrieb:
...
Du könntest es mit dem Chi-Quadrat und Kolmogorov-Smirnov-Test versuchen.
...Den betrachte ich eigentlich nur als eine Korrelationsuntersuchung und hat für Signifikanz keinerlei Bedeutung.
-
Prof84 schrieb:
TheTester schrieb:
...
Du könntest es mit dem Chi-Quadrat und Kolmogorov-Smirnov-Test versuchen.
...Den betrachte ich eigentlich nur als eine Korrelationsuntersuchung und hat für Signifikanz keinerlei Bedeutung.
Von welcher Signifikanz sprichst du denn? *kopfkratz*
-
Vielen Dank für die Antworten!
Das Stichwort "Kolmogorov-Smirnov Test" hat mir sehr geholfen. Ist zwar wie schon gesagt erstmal nur eindimensional, aber nach kurzer Suche fand ich dann eine zweidimensionale Variante. Das ist haargenau das was ich brauchte.
Zu Schade, dass man bei diesen ganzen statistischen Tests immer erst den Namen kennen muss um sie zu finden.