Probability density functions | Probability and Statistics | Khan Academy - YouTube

Channel: Khan Academy

[0]
.
[0]
Im letzten Video habe ich den Begriff der Wahrscheinlichkeits...
[4]
wir haben eigentlich mit Zufallsvariablen begonnen,
[5]
dann fuhren wir fort mit zwei Arten von Zufallsvariablen,
[9]
Wir hatten die diskreten, die eine endliche Anzahl von Werten annehmen konnten,
[13]
und ich wollte sagen, dass diese häufig ganze Zahlen seien,
[16]
aber sie müssen nicht immer ganze Zahlen sein.
[18]
Man hat die diskreten, und "endlich" heißt hier, dass man nicht
[22]
unendlich viele Werte für eine diskrete Zufallsvariable haben kann.
[25]
Und dann haben wir die kontinuierlichen, die eine
[29]
unendliche Anzahl von Werten annehmen können.
[34]
Und das Beispiel, das ich gab, für kontinuierlich, war:
[36]
wir haben eine Zufallsvariable x
[37]
und man benutzt - ich ändere das ein bisschen,
[40]
so dass man sieht, dass es auch anders heißen kann als x,
[43]
sagen wir, wir haben die Zufallsvariable Groß-Y
[45]
- man verwendet häufig Großbuchstaben -
[48]
entspricht der genauen Menge von Regen am morgigen Tag.
[61]
Und ich meine auch Regen, weil ich komme aus Nord-Kalifornien.
[64]
Es regnet tatsächlich ganz schön stark zur Zeit.
[66]
Es war trocken bislang, insofern ist es positiv.
[70]
Wir waren in so etwas wie einer Dürrezeit, also ist alles gut.
[71]
Also die genau Menge an Regen am morgigen Tag.
[75]
Und sagen wir mal, ich weiß nicht genau, wie die
[79]
Wahrscheinlichkeitsverteilung dafür aussieht, aber ist wähle eine
[82]
und wir versuchen, diese zu verstehen.
[83]
Nur damit ihr versteht, wie man kontinuierliche Zufallsvariablen
[89]
auffassen kann.
[90]
Ich zeichne jetzt eine Wahrscheinlichkeitsverteilung oder man
[93]
sagt auch, es ist ihre Wahrscheinlichkeitsdichte.
[97]
Und das zeichnet man so...
[100]
Sagen wir mal, so... es sieht ungefähr so aus.
[109]
.
[113]
Ungefähr so.
[115]
Gut, und ich weiß nicht, was die Höhe bedeutet.
[120]
Also die x-Achse ist die Menge an Regen.
[123]
Das hier ist 0 Inch, das ist 1 Inch, das ist 2 Inch,
[129]
das ist 3 Inch, 4 Inch.
[133]
Und dann gibt es eine Höhe.
[134]
Sagen wir, es ist hier am höchsten, weiß nicht,
[138]
vielleicht 0,5.
[142]
.
[145]
Also wie versteht man das? Wenn du das anschaust und
[148]
ich frag dich, was ist die Wahrscheinlichkeit, dass Y
[155]
- denn das ist unsere Zufallsvariable - dass Y ganz
[160]
genau 2 Inch groß ist?
[162]
Dass Y genau 2 Inch groß ist.
[166]
Wie hoch ist die Wahrscheinlichkeit, dass das der Fall ist?
[167]
Naja, wenn bedenken, wie wir die Wahrscheinlichkeitsverteilung
[170]
für diskrete Zufallsvariablen benutzt haben, dann
[173]
sagen wir OK, mal sehen.
[175]
2 Inch, das wollen wir haben.
[178]
Wir gehen hier hoch.
[180]
Du würdest sagen, es sieht so nach 0,5 aus.
[181]
Und du würdest sagen, weiß nicht, ist die Wahrscheinlichkeit vielleicht 0,5?
[186]
Und ich würde sagen, nein, es ist nicht 0,5.
[188]
Und bevor wir das jetzt visuell interpretieren,
[190]
sollten wir logisch darüber nachdenken.
[193]
Wie hoch ist die Wahrscheinlichkeit, dass wir morgen
[196]
genau 2 Inch Regen haben werden?
[197]
Nicht 2,01 Inch Regen, nicht 1,99 Inch Regen.
[203]
Nicht 1,99999 Inch Regen, nicht 2,0000001 Inch Regen.
[212]
Haargenau 2 Inch Regen.
[215]
Ich meine, nicht mal ein einziges Atom, also Wassermolekül,
[220]
mehr als die 2-Inch-Marke.
[222]
Und nicht ein einziges Wassermolekül unter der 2-Inch-Marke.
[227]
Das ist im Grunde Null, richtig?
[230]
Das mag jetzt unintuitiv sein, weil ihr vielleicht gehört habt,
[232]
dass wir 2 Inch Regen hatten letzte Nacht.
[234]
Aber denkt mal nach, ganz genau 2 Inch?
[236]
Normalerweise, wenn es 2,01 ist, dann sagt man 2.
[239]
Aber wir sagen hier nein, das zählt nicht.
[241]
Das sind nicht 2 Inch.
[242]
Wir wollen haargenau 2.
[243]
1,99 zählt nicht.
[245]
Normalerweise haben wir noch nicht mal Messgeräte,
[248]
um zu messen, ob es genau 2 Inch sind.
[251]
Kein Lineal kann exakt 2 Inch messen.
[255]
An irgendeiner Stelle, so sind die Dinge nun mal,
[258]
wird es ein überzähliges Atom geben, hier und da.
[261]
Also ist die Wahrscheinlichkeit, dass irgendwas ganz genau
[263]
einer Maßzahl entspricht, bis in alle Nachkommastellen,
[266]
ist eigentlich Null.
[269]
Wenn wir über kontinuierliche Zufallsvariablen sprechen,
[272]
könnte man fragen: Wie hoch ist die Wahrscheinlichkeit, dass Y ungefähr 2 ist?
[279]
Wenn wir also sagen: der Betrag von Y - 2 ist
[286]
geringer als ein Tolenranzwert?
[288]
Ist geringer als 0,1.
[290]
.
[293]
Wenn ihr das seltsam findet, dann kann man
[295]
auch sagen: wie hoch ist die Wahrscheinlichkeit, dass Y
[299]
größer ist als 1,9 und kleiner als 2,1?
[307]
Die beiden Aussagen sind äquivalent.
[309]
Ich lass euch mal drüber nachdenken.
[311]
Aber vielleicht klingt es jetzt weniger seltsam.
[312]
Jetzt haben wir hier ein Intervall.
[314]
Wir haben alle Y's zwischen 1,9 und 2,1.
[319]
Das heißt jetzt geht es um diese Fläche hier.
[324]
Und das ist wichtig: die Fläche.
[325]
Wenn man wissen will, wie hoch die Wahrscheinlichkeit ist, dass das passiert,
[328]
dann muss man die Fläche unterhalb der Kurve messen,
[333]
von diesem Punkt bis zu diesem Punkt.
[334]
Und wenn ihr Analysis gemacht habt, dann wisst ihr,
[338]
das entspricht dem bestimmten Integral dieser
[340]
Wahrscheinlichkeitsdichte-Funktion von hier bis hier.
[345]
Also von... wartet mal, ich hab keinen Platz mehr.
[348]
Sagen wir, dieser Graph... ich zeichne den mal
[350]
in einer anderen Farbe.
[352]
Wenn diese Linie definiert wird durch f(x).
[360]
Ich könnte es auch p von x nennen oder sonstwie.
[362]
Die Wahrscheinlichkeit, dass das passiert, ist gleich
[367]
dem Integral, für alle, die Analysis gemacht haben,
[370]
von 1,9 bis 2,1 von f(x) dx.
[375]
Wobei das hier die x-Achse ist.
[378]
Also das ist echt wichtig.
[381]
Denn wenn eine Zufallsvariable eine unendliche Anzahl von Werten
[385]
annehmen kann oder wenn es jeden Wert innerhalb eines Intervalls annehmen kann,
[389]
wenn man dann einen exakten Wert nimmt, zum Beispiel 1,999,
[394]
dann ist die Wahrscheinlichkeit gleich Null.
[395]
Das ist, als ob du fragst, wie groß ist die Fläche unterhalb
[398]
der Kurve auf nur dieser Linie hier.
[400]
Oder, noch genauer, als ob du fragst,
[402]
was ist die Fläche einer Linie?
[405]
Die Fläche einer Linie, wenn du eine Linie zeichnest,
[408]
würdest du sagen, Fläche ist Höhe mal Breite.
[410]
Nun ja, die Höhe ist vorhanden, aber die Breite,
[413]
wie breit ist eine Linie?
[415]
So wie wir normalerweise eine Linie definieren, hat sie keine Breite
[419]
und deshalb hat sie auch keine Fläche.
[420]
Und das sollte intuitiv klar sein.
[422]
Dass die Wahrscheinlichkeit, dass ein superexaktes Ding stattfindet
[426]
ziemlich genau Null ist.
[428]
Deshalb musst du eigentlich fragen, OK, wie hoch ist die
[430]
Wahrscheinlichkeit, dass wir der 2 nahekommen?
[432]
Und dann kannst du die Fläche definieren.
[434]
Und wenn du sagst, oh, wie hoch ist denn die Wahrscheinlichkeit,
[436]
dass 1-3 Inch Regen fallen, dann ist
[438]
die Wahrscheinlichkeit viel höher.
[440]
Die Wahrscheinlichkeit viel höher.
[441]
Das entspricht dem ganzen hier.
[445]
Du kannst auch fragen, wie hoch ist die Wahrscheinlichkeit,
[447]
dass wir weniger als 0,1 Inch Regen haben?
[450]
Dann schaut man hier und wenn hier 0,1 wäre, dann
[454]
berechnest du diese Fläche hier.
[456]
Und du kannst fragen, wie hoch ist die Wahrscheinlichkeit, dass wir
[458]
mehr als 4 Inch Regen haben morgen?
[460]
Dann startest du hier und berechnest die Fläche der Kurve
[463]
bis nach Unendlich, wenn die Kurve eine Fläche bis
[466]
Unendlich hat.
[466]
Und hoffentlich wird das keine unendliche Größe, richtig?
[469]
Dann würde nämlich der Wahrscheinlichkeitswert keinen Sinn ergeben.
[471]
Aber hoffentlich bekommt man aus dieser Summe eine endliche Zahl.
[474]
Und, sagen wir mal, es gibt nur eine 10%ige Chance, dass
[478]
morgen über 4 Inch Regen fallen.
[480]
Und das alles sollte direkt zu der Erkenntnis führen,
[484]
dass die Wahrscheinlichkeit von allen Möglichkeiten,
[487]
die vorkommen könnten, nicht größer als 100% sein sollte.
[490]
Richtig?
[491]
Alle Möglichkeiten zusammen genommen - die Wahrscheinlichkeit,
[495]
dass eine dieser Möglichkeiten eintritt, ist eins.
[497]
Das heißt, die gesamte Fläche unter dieser Kurve
[500]
ist eins.
[502]
Wenn wir also das Integral von f(x) von 0 bis Unendlichkeit nähmen,
[508]
so wie ich es gezeichnet habe, sollte gleich 1 sein.
[512]
Für alle, die Analysis gemacht haben.
[513]
Für alle anderen: ein Integral ist einfach
[515]
die Fläche unter einer Kurve.
[516]
Schaut euch einfach das Analysis-Video an, wenn ihr
[519]
ein bisschen mehr darüber erfahren wollt.
[521]
Und das gleiche gilt für diskrete Wahrscheinlichkeits-
[526]
verteilungen.
[527]
Ich zeichne mal eine.
[529]
Die Summe aller dieser Wahrscheinlichkeiten
[532]
muss eins sein.
[533]
Und das Beispiel mit den Würfeln... oder nehmen wir
[536]
die Münze, das geht schneller - die zwei Wahrscheinlichkeiten
[541]
müssen gleich eins sein.
[542]
Das ist 1 und 0, wobei x gleich 1, wenn es Kopf ist
[551]
oder gleich 0, wenn es Zahl ist.
[553]
Jede muss 0,5 sein.
[555]
Also sie müssen nicht 0,5 sein, aber wenn eine 0,6 wäre,
[557]
dann müsste die andere 0,4 sein.
[559]
Sie müssen sich zu 1 aufaddieren.
[560]
Wenn eine davon - du kannst nicht eine 60%-ige Wahrscheinlichkeit
[564]
für Kopf haben und auch eine 60%-ige Wahrscheinlichkeit
[566]
für Zahl.
[567]
Weil dann hätte man eine 120%-ige Wahrscheinlichkeit,
[571]
dass eins von beiden passiert und das
[573]
macht wirklich keinen Sinn.
[575]
Es ist also wichtig einzusehen, dass die Funktion
[577]
einer Wahrscheinlichkeitsverteilung, in diesem Fall von einer diskreten Zufallsvariablen,
[582]
sich immer zu 1 aufaddiert.
[584]
Also 0,5 plus 0,5.
[586]
Und in diesem Fall muss die Fläche unter der Dichtefunktion
[588]
gleich 1 sein.
[592]
So, die Zeit ist um.
[594]
Im nächsten Video werde ich das Konzept
[597]
eines Erwartungswerts vorstellen.
[598]
Bis bald.
[600]
.