Fragen zu Konfidenzintervallen



  • Hallo,

    bin am versuchen Konfidenzintervalle besser zu verstehen und zu berechnen.

    Aus Wikipedia habe ich die Verteilung von Mittelwerten der Stichprobengrösse nn normalverteilter Zufallsvariablen: X¯N(μ,σn)\bar X \sim N \left( \mu, \frac{ \sigma}{\sqrt{n} } \right)
    Aus math.stackexchange.com die Verteilung von Mittelwerten der Stichprobengösse nn von exponentialverteilten Zufallsvariablen: X¯Γ(n,nλ)\bar X \sim \Gamma(n, n\lambda)

    Mit boost Math/Statistical Distributions habe ich ein 95% Konfidenzintervall oder 95% Zentrales Schwankungsintervall berechnet und anhand eines Beispiels (normalverteilt und gegebene bekannte Varianz) n=10n=10, x¯=10\bar x=10, σ=2\sigma=2 (Lothar Papula, Mathematik für Ingenieure und Naturwissenschaftler, Band 3, Seite 524) verglichen und kam zum gleichen Ergebnis (Beispiel aus Buch ist auf drei Nachkommastellen gerundet).

    interval normal: 8.76041 11.2396
    length_a: 1.23959 lenght_b: 1.23959 lenght: 2.47918
    

    Bild

    Dann noch die Ausgabe für Exponentialverteilung λ=0.25\lambda=0.25 und der Vergleich mit der Näherung mit dem Zentralen Grenzwertsatz.

    Generate Samples ... done
    Calculate SampleFunctionResults ... done
    Generate R script ...
    
    interval normal: 1.52082 6.47918
    length_a: 2.47918 lenght_b: 2.47918 lenght: 4.95836
    
    interval gamma: 1.91816 6.83392
    length_a: 2.08184 lenght_b: 2.83392 lenght: 4.91577
    
    difference a: 0.397336 difference b: 0.354741 difference: 0.0425944
    
    Write to file samples.csv ...done
    done
    Run R script
    null device
              1
    open png file
    

    Bild (Stil "center location")
    Bild (Stil 2)

    Wollte Fragen, ob jemand Bücher oder Links kennt für eine Liste mit Verteilungen von Stichprobenfunktionen und deren Herleitungen. Nehme an, dass die Summe von Zufallvariablen mit der Faltung berechnet werden kann. Die anderen Operatoren fehlen mir und auch Operatoren zwischen Zufallsvariable und Variable. Also der Schritt der Division mit der nicht-Zufallsvariable nn (oder Multiplikation mit 1n\frac{1}{n}) verstehe ich nicht.

    Oder ganz allgemein gefragt, kennt jemand Bücher zur Wahrscheinlichkeitsrechnung (z.B. ohne Lookup-Table für die Quantilsfunktion, dafür z.B. mit Fehlerfunktion).

    Habe hoffentlich alles richtig geschrieben 😟 🤔, Korrekturen sind sehr willkommen.

    Edit 1: Weiss denn jemand ob es eine englische Wikipediaseite vom Zentralen Schwankungsintervall gibt und wie dieses auf Englisch heisst?

    Edit 2: Beim zweiten Bild ist mir gerade aufgefallen, dass die Schätzfunktion bzw. Stichprobenfunktion arithmetischer Mittelwert als Modalwert (der häufigste wahrscheinlichste Wert) nicht den wahren oder tatsächlichen Wert (1λ=10.25=4)\frac{1}{\lambda}=\frac{1}{0.25}=4) hat, wenn ich mich nicht täusche (auto gammamode = mode(gammadist);ergibt 3.6). Ist das etwas ähnliches wie bei der sog. korrigierten bzw. "unkorrigierten" Stichprobenvarianz? Kann man Schätzfunktionen als Teilmenge von Stichprobenfunktionen auffassen?

    Edit 3: Dann ist mir noch aufgefallen, dass die Länge des Konfidenzintervalls (in den Beispielen) nicht nur von der Stichprobengrösse abhängig ist, sondern auch von der Varianz bzw. Standardabweichung.



  • Habe "auf diese Thema trotzdem Antworten" geklickt 🧟

    Wieso antwortet denn niemand? Habe ich die Fragen falsch gestellt?

    Die Buchtipps dürfen auch englischsprachig sein.



  • Weiss denn wenigstens jemand welche Bücher über mathematische Statistik nicht zu empfehlen sind?



  • also ich hab hier 2 bücher in meinem regal stehen: schwarze, grundlagen der statistik, band 1 + 2. damit solltest du klar kommen.



  • @Wade1234 Vielen Dank für die Antwort. Hat es dort eine Herleitung der t-Verteilung drin?



  • nein nur die dichtefunktion, erwartungswert und varianz, ein hinweis auf die approximationsmöglichkeit und ein paar übungsaufgaben. willst du rechnen oder mathematik betreiben? edit: wenn du wirklich die herleitung brauchst, frag doch mal die professoren an den universitäten.



  • @Wade1234 sagte in Fragen zu Konfidenzintervallen:

    willst du rechnen oder mathematik betreiben? edit: wenn du wirklich die herleitung brauchst, frag doch mal die professoren an den universitäten.

    Also die Grenzen zwischen Mathematik und (numerischem) Rechnen sind ja eher fliessend, finde ich.

    Kann man einfach in die nächste Uni reinspazieren und Professoren fragen gehen? Was wenn sie nicht antworten?

    Also zur Approximation. Ich habe irgendwie einmal mitbekommen (bin mir aber nicht sicher), dass die t-Verteilung nur genau auf die Normalverteilung "zugeschnitten" ist (deshalb suche ich ja ein Buch mit Herleitung).

    Also z.B. eine offene Frage ist. Nehmen wir an, man hat eine Stichprobe mit z.B. geometrisch verteilten Zufallsvariablen. Wenn ich jetzt die geschätzte Varianz für die Approximation über den Zentralen Grenzwertsatz in die Normalverteilung einsetze, muss ich dann zuerst die Varianz über die Formel der geometrischen Verteilung schätzen? Ich bin mir da ziemlich sicher, dass man das glaube ich sollte (oder doch nicht?). Wenn man direkt folgende Stichprobenfunktion (angeblich für beliebige Verteilungen) braucht, kommt man dann glaube ich zum falschen Ergebnis oder eben doch nicht?



  • also eigentlich würde ich da einfach mal anrufen. bei uns an der fh war das immer so, dass man sich da am besten einen termin geholt hat. aber grundsätzlich ist das ja irgendwie deren job, wissenschaftliche fragen zu beantworten.



  • Fand die Quelle wieder. jbstatistics

    Again this i a very rough guideline. We can easily construct scenarios in wich a sample size of a hundred trillion is not nearly enough to give us approximate normality, ...

    Eine Stichprobengrösse von hundert Trillionen 100000000000000100'000'000'000'000 kann zu wenig sein, um eine Approximation mit der Normalverteilung zu ermöglichen!

    Leider ist kein Beispiel einer solchen Verteilung im Beitrag beschrieben.

    Und offen ist auch immer noch die Frage wegen der Berechnung von Konfidenzintervallen. Also wenn auch die Verteilung der Stichprobenfunktion von Mittelwerten bekannt ist, kann man dadurch ja noch nicht das Konfidenzintervall berechnen, wenn die Varianz geschätzt werden muss. Wenn die Varianz wie bei der Exponentialverteilung keine völlig unabhängige Zufallsvariable ist, anhand welcher Verteilung kann das exakte Konfidenzintervall konstruiert werden?



  • Hallo Forum,

    Ich habe gestern ein wenig versucht weiter zu rechnen. Verstanden habe ich auch die Definition der Erwartungstreue:

    Ein Schätzer heißt erwartungstreu, wenn sein Erwartungswert gleich dem wahren Wert des zu schätzenden Parameters ist.

    Welche Vorteile das hat, ist mir aber nicht klar.

    Ich finde wenn der Modus eines Schätzers/Schätzfunktion/Stichprobenfunktion dem wahren Wert entspricht, kann es doch auch sein, dass es wahrscheinlicher ist, den wahren Wert zu schätzen.

    Anhand der Stichprobenverteilung einer Stichprobenfunktion lässt sich ja dann das entsprechende Konfidenzintervall berechnen, natürlich nur, wenn einem die Stichprobenverteilung bekannt ist 😨 .

    Aber auch dann bleibt immer noch bei der Exponentialverteilung die Varianz bzw. die dadurch veränderte Länge des Konfidenzintervalls (auf Basis der Gammaverteilung, Verteilung von Mittelwerten exponentialverteilter Zufallsvariablen, siehe oben) wenn ein geschätzter Wert als Parameter verwendet wird und der wahre Wert unbekannt ist.

    Gestern habe ich versucht ein bestimmtes Integral mit Funktionen als Integrationsgrenzen zu bestimmen, um für die Dichte in einem Intervall der Gammaverteilung eine Funktion zu bekommen und den Maximalwert dieser Funktion zu finden.

    WxMaxima packte es bei meiner Vorgehensweise irgendwann nicht mehr, aber mit Wolfram Alpha bin ich weiter gekommen.

    Dichte mit den Parametern von oben: 1953125x9e5x274317824\frac{1953125 {{x}^{9}}\, {{e}^{-\frac{5 x}{2}}}}{74317824}

    Funktionen als Integrationsgrenzen: xx+4.91577\int_{x}^{x+4.91577}
    4.91577 entspricht der Länge des oben angegebenen Konfidenzintervalls.

    Also kurzum, ich bin mir zwar nicht sicher, aber der Modus oben liegt bei 3.6 und der errechnete Wert auf der x-Achse für das Intervall mit am meisten Fläche lag bei ca. 3.76.

    Edit: Bin mir nicht mehr sicher, welchen Sinn dieses Ergebnis macht. Die Funktionen für die Integrationsgrenzen sollten glaube ich eher aus der Quantilsfunktion errechnet werden.



  • @titan99_ sagte in Fragen zu Konfidenzintervallen:

    Hallo Forum,

    Was für Werte versuchst Du da u verarbeiten? Sind das Werte aus physikalischen Modelle? D.h. es wurden Messwerte von physikalischen Versuchen erfasst und nun versuchst Du eine Statistik darüber zu machen?



  • Bei den Werten aus den Buch wurde mit der Excel-Funktion CHIINV gearbeitet:
    Beispiel
    ((CHIINV(0,005;(Stichprobenumfang)-1))/(Stichprobenumfang-1))^0,5

    Vorab:
    Innerhalb der Grenzen von Gu und Go befindet sich der Teil welcher innerhalb der Warngrenzen und Eingriffsgrenzen sind.
    Außerhalb befindet sich also der "Murks", wenn du zum Beispiel Wellen kontollieren würdest.
    Im deutschsprachigen Raum werden 95/99 Prozent, im englischsprachigen Raum 95,44/ 99,97 für EG und WG (Rinne Seite 337) verwendet. Also Vorsicht beim Einkauf von Teilen im Ausland.
    Im oberen Beispiel bezeichnet 0.005 die 0.5 Prozent, die außerhalb einer Grenze Gu oder Go liegt. Ein Zahl von 1 würde 100 Prozent angeben. Auf einer Seite von µ. Entweder darunter oder darüber. Das heißt, vom Mittelwert µ aus jeweils etwa 2,5758293035489 aus gerechnet befinden sich die Eingriffsgrenzen. Je etwa 1,95996398454005 die Warngrenzen.
    Zuerst sucht man sich also zur Zahl 0.005 den dazugehörigen Abstand zu µ in sigma heraus. Ausgehend davon, das
    die Standardabweichung 1 sigma ist.
    Mit
    NORMINV(Zahl;Mittelwert;Standardabweichung);
    Beispiel:
    Für die Berechnung des Abstandes von Go oder Gu zur Mittellinie µ hier folgendes Beispiel:
    2,5758293035489 = NORMINV(0,995; 0; 1)
    Nun teilt man die Standardabweichung (hier 1 angeben) durch die Wurzel von n und multipliziert das Ergebnis mit dem von Norminv:
    Folgendes ist ein Ersatz für die Excel-Funktion KONFIDENZ();
    EE = Ergebnis_der_Konfidenz=NORMINV(0,995; 0; 1) *(1/WURZEL(Stichprobenumfang))

    Bei www.dev-communiy.de wurde ein kleines Beispiel in c++ rein gestellt. Die Funktionen können aber auch für c
    verwendet werden.
    Beim Mittelwert der Standardabweichung wird der Faktor zur Berechnung der Lage der Mittellinie so angegeben:
    =WURZEL(2/(n-1))*((EXP(GAMMALN(n/2)))/(EXP(GAMMALN((n-1)/2))));
    Wobei n die Größe der Strichprobe (Freiheitsgrade) angibt.
    Aber Vorsicht bei der Umsetzung mit c oder c++ denn gcc bietet zwei Versionen an gamma() und tgamma()
    Vielleicht kannst du dir irgendwo Bücher von der DGQ (Deutsche Gesellschaft für Qualität) grabschen.

    Damit kannst
    du dich dann selber foltern.

    Bei www.libreoffice-forum.de gibt es was für selbiges Programm. Kannst ja auch mal rein schauen.


Log in to reply