Frage zu wahrscheinlichkeit



  • Hallo,

    ich hab leider nie statistik in der Schule gehabt, und muss mich nun mit diesem Thema auseinandersetzen in einem Projekt. Folgende Problemstellung:

    ich habe Daten für 30 Tage. Aus diesen Daten ergibt sich dass jeden 2. Tag ein Ereignis eintritt. d. h. "ich kaufe jeden 2. Tag Brötchen beim Bäcker X" mit einer Wahrscheinlichkeit von 100 Prozent. Ist es statistisch logisch dass diese Wahrscheinlichkeit von 100 Prozent dann auch bei 100 Tagen bzw. 365 Tagen gilt? Also was ich fragen will. ich hab keine Datenreihen für 100 Tage bzw. 365 Tage, kann ich trotzdem eine Aussage darüber machen?



  • Hi,

    Nein, du kannst eine Glutenunverträglichkeit entwickeln, Dich tot fahren, ein Vielfraß werden und 2 mal täglich ein Brötchen kaufen...
    Was Du willst ist reine Extrapolation ohne irgendwelche Stützstellen.
    Basis einer Wahrscheinlichkeitsrechnung ist ja eine zufällig gezogene Probe.
    Klar kann man annehmen, dass jemand der jeden zweiten Tag Brötchen kauft, dass er das auch weiterhin macht, aber ich glaube nicht das man das quantifizieren kann von der Wahrscheinlichkeit her.

    Gruß Mümmel



  • eigentlich müsstest du die wahrscheinlichkeiten für "kauft stattdessen jeden dritten tag", "mag keine brötchen mehr" usw. für die nächsten 100 oder 365 tage ermitteln und (denke ich mal) aufsummieren, um die gesamtwahrscheinlichkeit dafür zu erhalten, dass dann keine brötchen mehr gekauft werden.

    die wahrscheinlichkeit, dass noch in 100 oder 365 tagen brötchen gekauft werden, ist dann die entsprechende gegenwahrscheinlichkeit, also 1 - p und das wird nicht 1 sein.



  • ich versteh das Problem schon. mein Betrachtungszeitraum ist eigentlich eine Woche. wenn ich jeden 2. tag brötchen kaufen würde(es wäre auch egal ob jeden 2. oder 3.oder 4.) dann wäre die Wochenbedingung immer erfüllt (außer mich überfährt auf dem weg zur Bäckerei ein Auto). Meine eigentliche Frage ist: Wie kann ich aus den Daten einer kurzen Messreihe eine Hochrechnung für die Zukunft anstellen und welchen Fehleranteil(also z. b. 1 mal nicht zur Bäckerei weil ich im Urlaub bin) soll ich einplanen? wie machen das die statistiker?



  • Es sieht so aus als wolltest du anhand einer Stichprobe auf eine Gesamtheit schließen. Dann bekommst du eine Aussage mit einer bestimmten Wahrscheinlichkeit. Doch wie es bei Wahrscheinlichkeiten so ist, es ist alles möglich. Beim Lotto den Hauptgewinn zu bekommen ist 1 zu 0,000000007, und trotzdem gewinnt pro Monat jemand. Die Wahrscheinlichkeit ist dann die Aussagegenauigkeit.



  • Du musst irgendein Vorwissen hineinstecken, um aus den wenigen Beobachtungen etwas vorhersagen zu können.

    Du könntest z.B. annehmen, dass jede Woche aus einer fixen Wahrscheinlichkeitsverteilung gezogen wird, ob der Mann zum Bäcker geht oder nicht.
    Dann wärst du bei ner unbekannten Bernoulli-Verteilung aus der n mal Bäcker und 0 mal nicht Bäcker gezogen wurde.
    Wenn du dann noch Vorwissen über den Verteilungsparameter hineinsteckst, kannst du mit Bayes etwas aussagen.
    (siehe z.B. https://en.wikipedia.org/wiki/Checking_whether_a_coin_is_fair , https://en.wikipedia.org/wiki/Beta_distribution#Bayesian_inference)

    Konkret wäre deine posteriore Verteilung über den Verteilungsparameter p(x)=Beta(n+1,1)=(n+1)xnp(x) = \mathrm{Beta}(n+1,1) = (n+1) \: x^n
    und die Wahrscheinlichkeit für m weitere Wochen mit Bäcker-Besuchen wäre dann
    dxp(x)xm=n+1n+m+1nn+m\int \mathrm{d}x \: p(x)\: x^m = \frac{n+1}{n+m+1} \approx \frac{n}{n+m}.

    In der Realität solltest du natürlich versuchen, ein besseres Modell auf der Grundlage von viel mehr Daten
    (Bäckerbesuche von vielen Leuten analysieren...) aufzustellen.



  • Man kann sich Gedanken über den Ereignishorizont machen.

    Das Beispiel mit dem Bäcker ist solala, es gibt doch kaum noch Bäcker und auch Großbäckereien werden von Supermärkten verdrängt.

    Außerdem kann man die Brötchen durchaus auch noch am dritten Tag benutzen.

    Allerdings sind mit dem Ereignishorizont die konkurrierenden Ereignisse gemeint (nicht verzählen!).
    Bai Daten der angesprochenen Art könnte man noch die Wahrscheinlichkeit für solche Handlungsklassen dazunehmen, quasi als Grundwahrscheinlichkeit.

    Ein wenig herumprobieren schadet auch nicht, z.B. an die Tankstelle setzen und die Auftrittshäufigkeiten von roten versus silbergrauen Autos zu einer bestimmten Zeit notieren - oder die generelle Frequenz der tankenden Autos - oder oder..

    Bei Supermarktpreisen kann man eine Weile die Preise mitzeichnen und dann kann man auch schon ganz gut Vorhersagen über bestimmte Entwicklungen machen.



  • Hi Nachtfeuer,

    nachtfeuer schrieb:

    Bei Supermarktpreisen kann man eine Weile die Preise mitzeichnen und dann kann man auch schon ganz gut Vorhersagen über bestimmte Entwicklungen machen.

    Ja, Du kannst dann einen "Wahrscheinlichkeitsfächer" bilden, ähnlich wie bei den Temperaturwarscheinlichkeiten für die nächsten Tage, der dann immer mehr auffächert.

    Aber das ist was ganz anderes, als darauf zu wetten, ob etwas was bisher regelmäßig eintrat zu 100% weiter genau so eintritt.

    Bei einem HarzIV-Empfänger, der sich 15 Tage jeden Tag 2 Flaschen Wodka kauft ist die Wahrscheinlichkeit fast null, weil in der Mitte des Monats das Geld alle ist.
    Bei einem Typ-1-Diabetiker, der sich jeden Tag seine Insulinspritze setzt ist die Wahrscheinlichkeit auch für die nächsten 100 Tage fast = 1, es sei denn er ist lebensmüde.

    Bei den Brötchen reicht es, wenn ich Urlaub habe und irgendwo AI untergebracht bin. Wobei man das Eintreffen von Urlaub von der Wahrscheinlichkeit her noch zahlenmäßig quantifizieren kann.
    Was man nicht vorhersehen kann, ist die Frage, ob nicht am nächsten Tag ein Bericht über unhaltbare hygenische Zustände in der Bäckerei (Schimmel, Ratten...) den Appetit auf Brötchen des Bäckers gegen null gehen lässt.

    Gruß Mümmel



  • Ja, wir könnten wetten, ob die Straßenlaterne gegenüber auch wieder am Abend angeht, wie in den letzten Tagen. Worauf wettest du? Ich wette, die geht morgen und die nächsten Tage auch wieder an. Und Du? Aber nicht manipulieren oder cheaten.



  • Hi Nachtfeuer,

    nachtfeuer schrieb:

    Ja, wir könnten wetten, ob die Straßenlaterne gegenüber auch wieder am Abend angeht, wie in den letzten Tagen. Worauf wettest du? Ich wette, die geht morgen und die nächsten Tage auch wieder an. Und Du? Aber nicht manipulieren oder cheaten.

    Besser nicht wetten, hab da kein glückliches Händchen, hab schon damals meine Wette mit Chrische5 verloren. 😉

    Gruß Mümmel



  • polubo schrieb:

    Hallo,
    ich habe Daten für 30 Tage. Aus diesen Daten ergibt sich dass jeden 2. Tag ein Ereignis eintritt. [...] Also was ich fragen will. ich hab keine Datenreihen für 100 Tage bzw. 365 Tage, kann ich trotzdem eine Aussage darüber machen?

    wenn du das Problem hypergeometrisch modellieren würdest, indem du 100 Tage einteilst in E Tage mit Ereignis und 100-E Tage ohne Ereignis, und die Beobachtung der ersten 30 Tage als ein ungeordnetes Ziehen einer Stichprobe vom Umfang 30 ohne Zurücklegen modellierst, dann wäre die Ws, dass du für 100 Tage genau E Ereignis-Tage erwischst, (15 aus E)(15 aus 100-E)/(30 aus 100). Dies dürfte maximal sein für E=50 (nachprüfen; habe es nicht selber nachgerechnet), es ergäbe sich eine Maximum-Likelihood-Schätzung E=50=100*15/30. Diese Modellierung berücksichtigt aber nicht den Abstand der Ereignisse von 2 Tagen, sondern nur die Anzahl.