Henrick Böhm
Was ist das Besondere an einer Glockenkurve? Ich verstehe diese Normalverteilung nicht.
Antworten (16)
Das Besondere ist ihre ästhetische Form, oder was willst du wissen? Mit 1000 Zeichen kann man keine umfassende Erklärung geben, wenn man gar nicht weiß, welche Vorkenntnisse du hast und was du speziell wissen willst. Falls du keine Kenntnisse in Mathematik haben solltest, vergiss es. Man kann auch glücklich im Leben werden, ohne die Normalverteilung verstanden zu haben.
Ein Beispiel sagt mehr als tausend Worte: TKKG hat in den letzten Monaten ca. 1.500 Antworten gegeben. Einige wenige sind unterirdisch schlecht, eine ganze Reihe o.k. und viele Antworten sind entweder lustig oder informativ. Dann sind einige so, dass man was lernen kann oder Denkanstöße bekommt (die Häufigkeit nimmt hier aber schon wieder ab) und ganz wenige sind geradezu genial. Diese kommen nach dem Zufallsprinzip aber genauso oft vor wie die unterdisch schlechten. Und schon haste deine Glockenkurve.
Normalverweilung: Mittelwert (Erwartungswert) kommt am häufigsten vor, die Werte, die weit entfernt vom Mittelwert liegen selten. Wichtig ist noch, dass die Kurve symmetrisch ist. und die Wahrscheinlichkeitsdichte einer bestimmten Gleichung genügt. Eine Normalverteilung kann übrigens durchaus auch vorliegen, wenn dumme Fragen überwiegen. Die Qualität der Fragen ist ein gutes Beispiel für die Normalverteilung, da es keine feste Begrenzung hinsichtlich der Qualität gibt. Ein Beispiel für eine nichtnormalverteilte Zufallsvariable ist die Anzahl der Buchstaben eines Wortes. In der einen Richtung ist diese durch eins beschränkt, in der anderen im Deutschen unbeschränkt, was zu einer asymmetrischen Kurve führt.
Teil 1 (weil es anscheinend nötig ist)
Eigentlich ist es ganz einfach. Man misst z. B. eine Länge von 25 mm mit einer Messuhr. Wenn man das mehrmals macht, bekommt man in der Regel verschiedene Werte. (25,0 – 25,2 – 24,9 – 25,0 - 25,0 – 25,2 – 24,8 usw.) Dann trägt man diese Werte in ein Diagramm ein, auf der waagerechten Achse die Länge (meinetwegen von 20 mm bis 30 mm), auf der senkrechten Achse die Anzahl. Bis hier könnte ich bei 25,0 eine Linie bis 3 ziehen, bei 25,2 bis 2, und bei 24,8 und 24,9 jeweils bis 1. Wenn man das oft genug macht, ergeben die Linien über der Länge die Gauß’sche Glockenkurve, bei weniger Werten kann man sie einfitten. Das ist die Normalverteilung. Sie muss nicht immer symmetrisch sein, bei TKKGs Beispiel mit den dummen Fragen ergäbe sich eine sogenannte „Schiefe Normalverteilung“.
Eigentlich ist es ganz einfach. Man misst z. B. eine Länge von 25 mm mit einer Messuhr. Wenn man das mehrmals macht, bekommt man in der Regel verschiedene Werte. (25,0 – 25,2 – 24,9 – 25,0 - 25,0 – 25,2 – 24,8 usw.) Dann trägt man diese Werte in ein Diagramm ein, auf der waagerechten Achse die Länge (meinetwegen von 20 mm bis 30 mm), auf der senkrechten Achse die Anzahl. Bis hier könnte ich bei 25,0 eine Linie bis 3 ziehen, bei 25,2 bis 2, und bei 24,8 und 24,9 jeweils bis 1. Wenn man das oft genug macht, ergeben die Linien über der Länge die Gauß’sche Glockenkurve, bei weniger Werten kann man sie einfitten. Das ist die Normalverteilung. Sie muss nicht immer symmetrisch sein, bei TKKGs Beispiel mit den dummen Fragen ergäbe sich eine sogenannte „Schiefe Normalverteilung“.
Teil 2 (der Vollständigkeit halber)
Die Normalverteilung liefert zwei Ergebnisse. Einmal den Mittelwert einer Messreihe, einer statistischen Erhebung oder der Verteilung wie Sand aus einer Baggerschaufel fällt (deswegen sieht ein Sandhaufen ähnlich aus, nur rutscht der Sand). Das zweite Ergebnis ist die Brteite der Glockenkurve. Wenn die Messwerte dicht beieinander liegen, ist sie schmal, wenn sie weit streuen ist sie breit. Diese Breite nennt sich Varianz, sie ist der Abstand vom Mittelwert zum Wendepunkt der Gaußkurve, ihre Quadratwurzel nennt sich Standardabweichung, und die Gesamtbreite der Glockenkurve ist das plusminus Dreifache der Standardabweichung. Alles klar?
Die Normalverteilung liefert zwei Ergebnisse. Einmal den Mittelwert einer Messreihe, einer statistischen Erhebung oder der Verteilung wie Sand aus einer Baggerschaufel fällt (deswegen sieht ein Sandhaufen ähnlich aus, nur rutscht der Sand). Das zweite Ergebnis ist die Brteite der Glockenkurve. Wenn die Messwerte dicht beieinander liegen, ist sie schmal, wenn sie weit streuen ist sie breit. Diese Breite nennt sich Varianz, sie ist der Abstand vom Mittelwert zum Wendepunkt der Gaußkurve, ihre Quadratwurzel nennt sich Standardabweichung, und die Gesamtbreite der Glockenkurve ist das plusminus Dreifache der Standardabweichung. Alles klar?
@ingenious
Wieder mal ein Zitat von Wikipedia: hier
"Da die Gaußsche Normalverteilung symmetrisch ist, d.h. eine Schiefe von Null besitzt, ist die Schiefe eine mögliche Maßzahl, um eine Verteilung mit der Normalverteilung zu vergleichen."
Wieder mal ein Zitat von Wikipedia: hier
"Da die Gaußsche Normalverteilung symmetrisch ist, d.h. eine Schiefe von Null besitzt, ist die Schiefe eine mögliche Maßzahl, um eine Verteilung mit der Normalverteilung zu vergleichen."
@ UlliVonPulli
Fleißig, bravo. Hast du das auch verstanden, was du da verlinkt hast? Ich habe bei meiner Antwort lediglich auf mein Fachwissen zurückgegriffen.
P.S.: Das mit dem ingenious (bastard) war anfangs ja originell, aber so etwas nutzt sich schnell ab. Dann wirkt es nur ideenlos.
Fleißig, bravo. Hast du das auch verstanden, was du da verlinkt hast? Ich habe bei meiner Antwort lediglich auf mein Fachwissen zurückgegriffen.
P.S.: Das mit dem ingenious (bastard) war anfangs ja originell, aber so etwas nutzt sich schnell ab. Dann wirkt es nur ideenlos.
@ingenious
Das mit dem Abstand stimmt auch nicht ganz. Der Abstand der Abszisse des Wendepunktes zum Mittelwert entspricht der Standardabweichung nicht der Varianz.
Ich habe das verlinkte verstanden. Nur bei dir nicht so sicher ehrlich gesagt.
Das mit dem Abstand stimmt auch nicht ganz. Der Abstand der Abszisse des Wendepunktes zum Mittelwert entspricht der Standardabweichung nicht der Varianz.
Ich habe das verlinkte verstanden. Nur bei dir nicht so sicher ehrlich gesagt.
Das ist jetzt meine fünfte und damit letzte Antwort.
@ UlliVonPulli
OK, du hast Recht, aber ich habe das aus dem Gedächtnis geschrieben, es sollte nur das Prinzip darstellen. Du hast dafür sicher lange gegooglet.
@ TKKG
Es gibt den Begriff der schiefen wie auch der logarithmischen Normalverteilung. Das sind Gaußkurven, die mit einer anderen Funktion gefaltet werden oder so ähnlich, ganz genau weiß ich das nicht. Das macht Sinn, weil es ja auch andere statistische Verteilungen gibt, z.B. Rechteck oder Poisson.
Vertrauensbereiche habe ich noch nie berechnet, brauchte ich auch nicht, wir hatten damals Tabellen der DGQ (Deutsche Gesellschaft für Qualitätssicherung), mit deren Hilfe man das bestimmen konnte. Aber aus dem Geschäft bin ich schon lange raus.
@ UlliVonPulli
OK, du hast Recht, aber ich habe das aus dem Gedächtnis geschrieben, es sollte nur das Prinzip darstellen. Du hast dafür sicher lange gegooglet.
@ TKKG
Es gibt den Begriff der schiefen wie auch der logarithmischen Normalverteilung. Das sind Gaußkurven, die mit einer anderen Funktion gefaltet werden oder so ähnlich, ganz genau weiß ich das nicht. Das macht Sinn, weil es ja auch andere statistische Verteilungen gibt, z.B. Rechteck oder Poisson.
Vertrauensbereiche habe ich noch nie berechnet, brauchte ich auch nicht, wir hatten damals Tabellen der DGQ (Deutsche Gesellschaft für Qualitätssicherung), mit deren Hilfe man das bestimmen konnte. Aber aus dem Geschäft bin ich schon lange raus.
@ingenious
War ja immerhin fast richtig ;) Jedenfalls finde ich gut, dass man bei solchen fachlichen Diskussionen oft was dazulernt.
War ja immerhin fast richtig ;) Jedenfalls finde ich gut, dass man bei solchen fachlichen Diskussionen oft was dazulernt.
Gut finde ich die Erklärung von hier
einfachstes Beispiel hierfür ist das Würfeln mit zwei Würfeln. Du hast jeweils nur eine Kombinationsmöglichkeit eine zwei oder eine 12 zu werfen. Dagegen gibt es 6 KOmbinationen mit dem Ergebnis 7. Dementsprechend steigt die Wahrscheinlichkeit eine 7 zu würfeln. Die Verteilung für alle Zahlen bildet dann diese Kurve.
@wally
Meiner Meinung nach nicht korrekt, da der Anstieg bzw. das Abfallen der Wahrscheinlichkeitsdichtefunktion für das Würfeln mit zwei Würfeln linear ist, aber nicht die Form einer Glockenkurve hat.
Meiner Meinung nach nicht korrekt, da der Anstieg bzw. das Abfallen der Wahrscheinlichkeitsdichtefunktion für das Würfeln mit zwei Würfeln linear ist, aber nicht die Form einer Glockenkurve hat.
Die Normalverteilung sagt nichts anderes aus, als dass ein bestimmtes Merkmal gleichmäßig in der Bevölkerung vorkommt. Nehmen wir als Beispiel die Körpergröße. Die meisten Menschen bewegen sich in einem Mittelfeld, wenige Menschen sind besonders klein bzw. extrem groß. Diese Tatsache wird in der Statistik durch diese Kurve graphisch veranschaulicht.
Die von meinem Vorredner erwähnte Körpergröße ist sicherlich ein gutes Beispiel für eine Normalverteilung. Beim Würfeln müsste man schon mit unendlich vielen Würfeln würfeln um gemäß dem zentralen Grenzwerttheorem eine Normalverteilung zu erhalten.
Der zentrale Grenzwertsatz ist die Grundlage für die Bedeutung der Normalverteilung. Dieser besagt, dass eine Summe von "n" unabhängigen, identisch verteilen Zufallsvariablen im Grenzwert normal verteilt ist. Siehe: http://de.wikipedia.org/wiki/Normalverteilung.