1 00:00:00,610 --> 00:00:04,100 Behandeln wir ein weiteres Beispiel vom Abschnitt Normalverteilung 2 00:00:04,100 --> 00:00:10,120 aus dem AP Statistikbuch von ck12.org. 3 00:00:10,120 --> 00:00:11,770 Ich nutze ihres, da es Open Source ist und 4 00:00:11,770 --> 00:00:13,990 eigentlich ein ganz gutes Buch ist. 5 00:00:13,990 --> 00:00:16,475 Die Beispiele sind, denke ich, gute Übung für uns. 6 00:00:16,475 --> 00:00:19,070 Also, schauen wir, Nummer 3. 7 00:00:19,070 --> 00:00:20,390 Man kann auf ihre Webseite gehen und 8 00:00:20,390 --> 00:00:21,690 ich denke, auch ihr Buch runterladen. 9 00:00:21,690 --> 00:00:26,180 "Angenommen der Durchschnitt acht 1 Jahre alter Mädchen in den USA 10 00:00:26,180 --> 00:00:28,920 ist normalverteilt bzw. normalverteilt mit 11 00:00:28,920 --> 00:00:32,330 im Schnitt 9,5 g." 12 00:00:32,330 --> 00:00:33,820 Das müssen Kilogramm sein. 13 00:00:33,820 --> 00:00:35,930 Ich habe einen 10 Monate alten Sohn, der 14 00:00:35,930 --> 00:00:39,570 ca. 20 Pfund, also ca. 9 kg wiegt, nicht 9,5 g. 15 00:00:39,570 --> 00:00:41,040 9,5 g sind nichts. 16 00:00:41,040 --> 00:00:43,900 Da wären wir bei kleinen Mäusen oder so. 17 00:00:43,900 --> 00:00:44,940 Das müssen kg sein. 18 00:00:44,940 --> 00:00:47,350 Aber egal, es sind ca. 9,5 kg mit einer 19 00:00:47,350 --> 00:00:51,050 Standardabweichung von ca. 1,1 g. 20 00:00:51,050 --> 00:00:56,400 Der Durchschnitt ist also gleich 9,5 kg 21 00:00:56,400 --> 00:01:01,130 und die Standardabweichung gleich 1,1 g. 22 00:01:01,130 --> 00:01:04,840 Ohne Taschenrechner zu nutzen - ein interessanter Hinweis - 23 00:01:04,840 --> 00:01:08,950 schätze den Prozentsatz 1 Jahr alter Mädchen in den USA, 24 00:01:08,950 --> 00:01:09,995 die folgende Bedingungen erfüllen. 25 00:01:09,995 --> 00:01:12,910 Wenn gesagt wird "ohne Taschenrechner", 26 00:01:12,910 --> 00:01:15,250 ist das ein wichtiger Hinweis darauf, dass man 27 00:01:15,250 --> 00:01:16,350 die Empirische Regel anwenden muss. 28 00:01:20,040 --> 00:01:27,480 Empirische Regel wird manchmal 68-95-99.7 Regel genannt. 29 00:01:27,480 --> 00:01:29,960 Wenn ihr euch erinnert, das ist der Name der Regel, 30 00:01:29,960 --> 00:01:31,500 ihr habt euch einfach die Regel gemerkt. 31 00:01:31,500 --> 00:01:33,520 Sie sagt uns, dass wir eine Normalverteilung haben. 32 00:01:33,520 --> 00:01:35,800 Ich erkläre es zunächst ein wenig, bevor wir 33 00:01:35,800 --> 00:01:36,750 uns diesem Problem widmen. 34 00:01:36,750 --> 00:01:38,750 Haben wir eine Normalverteilung - 35 00:01:38,750 --> 00:01:40,480 lasst mich eine Normalverteilung zeichnen. 36 00:01:40,480 --> 00:01:42,900 Sie sieht etwa so aus. 37 00:01:42,900 --> 00:01:44,240 Meine Normalverteilung. 38 00:01:44,240 --> 00:01:45,940 Sie sieht nicht perfekt aus, aber ihr versteht, was ich meine. 39 00:01:45,940 --> 00:01:47,560 Es sollte symmetrisch sein. 40 00:01:47,560 --> 00:01:49,980 Das hier ist unser Durchschnitt. 41 00:01:49,980 --> 00:01:50,840 Das hier ist unser Durchschnitt. 42 00:01:50,840 --> 00:01:54,810 Gehen wir eine Standardabweichung über und 43 00:01:54,810 --> 00:02:00,350 1 unter den Durchschnitt... das ist unser Durchschnitt 44 00:02:00,350 --> 00:02:01,780 plus 1 Standardabweichung. 45 00:02:01,780 --> 00:02:05,730 Und das unser Durchschnitt minus 1 Standardabweichung. 46 00:02:05,730 --> 00:02:08,710 Die Wahrscheinlichkeit, bei perfekter Normalverteilung 47 00:02:08,710 --> 00:02:12,080 ein Ergebnis zu finden, welches zwischen 1 Standardabweichung 48 00:02:12,080 --> 00:02:14,640 unter und 1 Standardabweichung über dem Durchschnitt liegt, 49 00:02:14,640 --> 00:02:19,320 dieser Bereich hier, das wären, 50 00:02:19,320 --> 00:02:23,040 ihr könnt schätzen, 68%. 51 00:02:23,040 --> 00:02:26,430 68% Chance, dass man einen Wert innerhalb 1 52 00:02:26,430 --> 00:02:27,750 Standardabweichung vom Durchschnitt erhält. 53 00:02:27,750 --> 00:02:30,140 Entweder 1 Standardabweichung über oder unter 54 00:02:30,140 --> 00:02:31,450 oder irgendwie dazwischen. 55 00:02:31,450 --> 00:02:34,500 Sprechen wir nun über Standardabweichungen um den Durchschnitt 56 00:02:34,500 --> 00:02:37,170 herum -- gehen wir eine weitere Standardabweichung runter, 57 00:02:37,170 --> 00:02:39,570 und nochmal eine Standardabweichung hierhin, 58 00:02:39,570 --> 00:02:41,780 und eine weitere Standardabweichung über den Durchschnitt-- 59 00:02:41,780 --> 00:02:43,190 und wir müssten uns fragen, wie hoch die Wahrscheinlichkeit ist, 60 00:02:43,190 --> 00:02:47,360 etwas zwischen diesen beiden, in diesem Abschnitt zu finden, 61 00:02:47,360 --> 00:02:50,740 dann sind es, ihr könnt es erraten, 95%. 62 00:02:50,740 --> 00:02:53,060 Und das schließt diesen mittleren Abschnitt hier ein. 63 00:02:53,060 --> 00:02:56,510 DIe 68% sind eine Teilmenge dieser 95%. 64 00:02:56,510 --> 00:02:58,140 Und ich denke ihr wisst, wo das hinführt. 65 00:02:58,140 --> 00:03:01,360 Gehen wir 3 Standardabweichungen unter und 66 00:03:01,360 --> 00:03:06,820 über den Durchschnitt, sagt uns die Empirische Regel bzw. die 68-95-99,7 Regel, 67 00:03:06,820 --> 00:03:15,740 dass eine 99,7%ige Chance besteht, eine Ergebnis in 68 00:03:15,740 --> 00:03:19,120 der Normalverteilung zu finden, welches innerhalb 69 00:03:19,120 --> 00:03:20,110 3 Standardabweichungen vom Durchschnitt liegt. 70 00:03:20,110 --> 00:03:23,230 Also 3 Standardabweichungen unter und 71 00:03:23,230 --> 00:03:26,030 3 Standardabweichungen über dem Durchschnitt. 72 00:03:26,030 --> 00:03:27,870 Das sagt uns die Empirische Regel. 73 00:03:27,870 --> 00:03:30,960 Schauen wir nun, ob wir sie bei dieser Aufgabe anwenden können. 74 00:03:30,960 --> 00:03:33,140 Sie geben uns den Durchschnitt und die Standardabweichung vor. 75 00:03:33,140 --> 00:03:34,550 Ich zeichne das mal auf. 76 00:03:34,550 --> 00:03:38,550 Zuerst meine Achse, so gut wie ich kann. 77 00:03:38,550 --> 00:03:39,600 Zuerst meine Achse, so gut wie ich kann. 78 00:03:39,600 --> 00:03:41,410 Dann die glockenförmige Kurve. 79 00:03:45,920 --> 00:03:49,090 Das das beste, was ich freihand zeichnen kann. 80 00:03:49,090 --> 00:03:50,920 Das das beste, was ich freihand zeichnen kann. 81 00:03:50,920 --> 00:03:54,140 Und der Durchschnitt hier ist 9, das sollte symmetrisch sein. 82 00:03:54,140 --> 00:03:55,710 Diese Höhe sollte gleich dieser hier sein. 83 00:03:55,710 --> 00:03:57,600 Ich denke ihr versteht das Konzept. 84 00:03:57,600 --> 00:03:59,260 Ich bin kein Computer. 85 00:03:59,260 --> 00:04:02,390 9,5 ist der Durchschnitt. 86 00:04:02,390 --> 00:04:03,370 Ich schreibe keine Einheiten. 87 00:04:03,370 --> 00:04:04,580 Es ist alles in kg. 88 00:04:04,580 --> 00:04:11,330 1 Standardabweichung über dem Durchschnitt sollten wir 1,1 dazuaddieren, 89 00:04:11,330 --> 00:04:14,220 da sie uns die Standardabweichung von 1,1 vorgeben. 90 00:04:14,220 --> 00:04:16,820 Das ist 10,6. 91 00:04:16,820 --> 00:04:19,620 Ich zeichne hier noch eine gestrichelte Linie. 92 00:04:19,620 --> 00:04:25,990 Gehen wir 1 Standardabweichung unter den Durchschnitt, 93 00:04:25,990 --> 00:04:34,110 subtrahieren wir 1,1 von 9,5 und erhalten 8,4. 94 00:04:34,110 --> 00:04:37,620 Gehen wir 2 Standardabweichungen über den Durchschnitt, 95 00:04:37,620 --> 00:04:40,400 addieren wir hier nochmal eine Standardabweichung. 96 00:04:40,400 --> 00:04:40,610 Richtig? 97 00:04:40,610 --> 00:04:41,890 Wir gehen 1 Standardabweichung, 98 00:04:41,890 --> 00:04:42,700 2 Standardabweichungen. 99 00:04:42,700 --> 00:04:44,435 Das führt uns zu 11,7. 100 00:04:44,435 --> 00:04:47,040 Und gingen wir 3 Standardweichungen, 101 00:04:47,040 --> 00:04:48,910 würden wir wieder 1,1 addieren. 102 00:04:48,910 --> 00:04:50,720 Das brächte uns zu 12,8. 103 00:04:50,720 --> 00:04:53,820 Auf der anderen Seite, 1 Standardabweichung 104 00:04:53,820 --> 00:04:55,380 unter dem Durchschnitt ist 8,4. 105 00:04:55,380 --> 00:04:58,480 2 Standardabweichungen unter dem Durchschnitt-- 106 00:04:58,480 --> 00:05:00,910 wieder 1,1 subtrahieren-- wären 7,3. 107 00:05:00,910 --> 00:05:03,380 Und dann 3 Standardabweichungen unter dem Durchschnitt-- 108 00:05:03,380 --> 00:05:07,280 das schreiben wir hier hin-- wären 6,2 kg. 109 00:05:07,280 --> 00:05:08,860 Das ist nun also der Aufbau unseres Problems. 110 00:05:08,860 --> 00:05:12,070 Wie hoch ist die Wahrscheinlichkeit, ein 1 Jahr altes 111 00:05:12,070 --> 00:05:17,730 Mädchen in den USA zu finden, das weniger als 8,4 kg wiegt. 112 00:05:17,730 --> 00:05:19,330 Oder ich sollte besser sagen, wessen 113 00:05:19,330 --> 00:05:21,640 Masse ist weniger als 8,4 kg. 114 00:05:21,640 --> 00:05:25,150 Hier: Die Wahrscheinlichkeit, ein weibliches Baby zu finden, 115 00:05:25,150 --> 00:05:28,070 welches 1 Jahr alt ist und eine Masse bzw. Gewicht 116 00:05:28,070 --> 00:05:30,920 von weniger als 8,4 kg, das ist diese Fläche hier. 117 00:05:30,920 --> 00:05:31,610 von weniger als 8,4 kg, das ist diese Fläche hier. 118 00:05:31,610 --> 00:05:35,070 Ich sage Masse, da kg die Einheit für Masse ist. 119 00:05:35,070 --> 00:05:36,940 Die meisten nutzen es auch als Gewicht. 120 00:05:36,940 --> 00:05:38,470 Das ist also diese Fläche hier. 121 00:05:38,470 --> 00:05:40,950 Wie können wir nun die Fläche unter dieser 122 00:05:40,950 --> 00:05:43,900 Normalverteilung mithifle der Empirischen Regel ermitteln? 123 00:05:43,900 --> 00:05:47,280 Nun, wir kennen diese Fläche. 124 00:05:47,280 --> 00:05:52,370 Wir wissen, was diese Fläche zwischen -1 Standardabweichung 125 00:05:52,370 --> 00:05:54,500 und +1 Standardabweichung ist. 126 00:05:54,500 --> 00:05:55,920 Wir wissen, dass sie 68% ist. 127 00:05:58,430 --> 00:06:01,720 Sind das hier 68%, dann heißt das auch, das die 128 00:06:01,720 --> 00:06:04,360 Fläche außerhalb der Mitte 32% ist. 129 00:06:04,360 --> 00:06:07,200 Denn die Fläche unter der ganzen Normalverteilung 130 00:06:07,200 --> 00:06:11,380 ist 100 oder 100% oder 1, abhängig davon, wie man es betrachtet. 131 00:06:11,380 --> 00:06:14,490 Denn alle Möglichkeiten miteinander 132 00:06:14,490 --> 00:06:17,880 kombiniert können nur 1 ergeben. 133 00:06:17,880 --> 00:06:21,480 Man kann nicht mehr als 100% haben. 134 00:06:21,480 --> 00:06:27,270 Addieren wir diesen und diesen Abschnitt, 135 00:06:27,270 --> 00:06:29,490 ergibt das den Rest. 136 00:06:29,490 --> 00:06:32,590 Also 100 minus 68, sind 32. 137 00:06:32,590 --> 00:06:33,920 32% 138 00:06:33,920 --> 00:06:37,820 32% erhält man bei Addieren dieses und 139 00:06:37,820 --> 00:06:39,240 dieses Abschnittes hier. 140 00:06:39,240 --> 00:06:41,120 Und das ist eine perfekte Normalverteilung. 141 00:06:41,120 --> 00:06:42,535 Eine Normalverteilung war vorgegeben. 142 00:06:42,535 --> 00:06:44,780 Damit ist es also perfekt symmetrisch. 143 00:06:44,780 --> 00:06:48,730 Wenn diese beiden Abschnitte also zusammen 32 ergeben, 144 00:06:48,730 --> 00:06:51,820 beide aber symmetrisch sind, also dieselbe Fläche haben, 145 00:06:51,820 --> 00:06:56,490 dann ist diese Seite hier-- ich mache es in pink-- 146 00:06:56,490 --> 00:07:00,020 sieht mehr wie violett aus-- 16%. 147 00:07:00,020 --> 00:07:02,700 Und diese Seite hier wäre 16%. 148 00:07:02,700 --> 00:07:05,900 Die Wahrscheinlichkeit, ein Ergebnis von mehr als 149 00:07:05,900 --> 00:07:08,280 1 Standardabweichung über dem Durchschnitt zu erhalten, 150 00:07:08,280 --> 00:07:09,760 also diese Seite hier, wäre 16% 151 00:07:09,760 --> 00:07:13,040 Oder die Wahrscheinlichkeit, ein Ergebnis von weniger als 152 00:07:13,040 --> 00:07:17,050 1 Standardabweichung unter dem Durchschnitt zu haben, genau hier, 16%. 153 00:07:17,050 --> 00:07:19,060 Sie wollen also die Wahrscheinlichkeit eines 154 00:07:19,060 --> 00:07:23,140 1 Jahr alten Babys von weniger als 8,4 kg haben. 155 00:07:23,140 --> 00:07:27,970 Weinger als 8,4 kg ist diese Fläche genau hier. 156 00:07:27,970 --> 00:07:29,500 Und das sind 16%. 157 00:07:29,500 --> 00:07:33,270 Also 16% für Teil (a). 158 00:07:33,270 --> 00:07:38,280 Jetzt Teil (b): "Zwischen 7,3 und 11,7 kg." 159 00:07:38,280 --> 00:07:41,130 Zwischen 7,3 - das ist genau hier. 160 00:07:41,130 --> 00:07:47,120 Das sind 2 Standardabweichungen unter dem Durchschnitt- und 11,7 - 1, 161 00:07:47,120 --> 00:07:49,100 2 Standardabweichungen über dem Durchschnitt. 162 00:07:49,100 --> 00:07:51,260 Es wird im Prinzip nach der Wahrscheinlichkeit gefragt, 163 00:07:51,260 --> 00:07:54,340 ein Ergebnis innerhalb 2 Standardabweichungen 164 00:07:54,340 --> 00:07:55,230 vom Durchschnitt zu erhalten, richtig? 165 00:07:55,230 --> 00:07:57,040 Das hier ist der Durchschnitt. 166 00:07:57,040 --> 00:08:00,250 Das sind 2 Standardabweichungen darunter. 167 00:08:00,250 --> 00:08:02,630 Das sind 2 Standardabweichungen darüber. 168 00:08:02,630 --> 00:08:04,130 Nun, das ist relativ direkt. 169 00:08:04,130 --> 00:08:07,490 Die Empirische Regel sagt uns, dass man zwischen 2 Standardabweichungen 170 00:08:07,490 --> 00:08:13,950 eine 95%ige Chance hat, ein Ergebnis zu erhalten, welches innerhalb 171 00:08:13,950 --> 00:08:15,140 2 Standardabweichungen liegt. 172 00:08:15,140 --> 00:08:17,740 Die Empirische Regel gibt uns diese Antwort einfach. 173 00:08:17,740 --> 00:08:21,440 Und schließlich Teil (c): Die Wahrscheinlichkeit, ein 1 Jahr 174 00:08:21,440 --> 00:08:25,510 altes US weibliches Baby mit mehr als 12,8 kg zu haben. 175 00:08:25,510 --> 00:08:28,310 12,8 kg ist 3 Standardabweichungen über dem Durchschnitt. 176 00:08:28,310 --> 00:08:29,770 12,8 kg ist 3 Standardabweichungen über dem Durchschnitt. 177 00:08:29,770 --> 00:08:34,100 Wir wollen also die Wahrscheinlichkeit wissen, ein Ergebnis mehr 178 00:08:34,100 --> 00:08:36,250 als 3 Standardabweichungen über dem Durchschnitt zu haben. 179 00:08:36,250 --> 00:08:42,170 Das ist diese Fläche hier in orange gekennzeichnet. 180 00:08:42,170 --> 00:08:44,310 Vielleicht sollte ich eine andere Farbe dafür nehmen, 181 00:08:44,310 --> 00:08:45,280 um es hervorzuheben. 182 00:08:45,280 --> 00:08:48,575 Das ist dieser lange Abfall hier, diese kleine Fläche. 183 00:08:48,575 --> 00:08:51,020 Was ist also diese Wahrscheinlichkeit? 184 00:08:51,020 --> 00:08:53,420 Gehen wir wieder zur Empirischen Regel zurück. 185 00:08:53,420 --> 00:08:56,230 Wir kennen die Wahrscheinlichkeit-- diese Fläche. 186 00:08:56,230 --> 00:08:59,740 Wir kennen die Fläche zwischen -3 und +3 187 00:08:59,740 --> 00:09:01,960 Standardabweichungen. 188 00:09:01,960 --> 00:09:04,090 Da das die letzte Aufgabe ist, kann ich die ganze 189 00:09:04,090 --> 00:09:08,200 Fläche hier einfärben. Wir wissen, dass diese Fläche hier 190 00:09:08,200 --> 00:09:14,300 zwischen -3 und +3 gleich 99,7% ist. 191 00:09:14,300 --> 00:09:16,830 Der Großteil der Ergebnisse fällt hierunter. 192 00:09:16,830 --> 00:09:17,940 Eigentlich fast alle. 193 00:09:17,940 --> 00:09:20,320 Was bleibt also für die beiden Enden überig. 194 00:09:20,320 --> 00:09:21,220 Merkt euch: Es gibt 2 Enden. 195 00:09:21,220 --> 00:09:22,330 Das ist eines davon. 196 00:09:22,330 --> 00:09:24,630 Dann hat man die Ergebnisse weniger als 3 197 00:09:24,630 --> 00:09:25,730 Standardabweichungen unter dem Durchschnitt. 198 00:09:25,730 --> 00:09:27,480 Dieses Ende genau hier. 199 00:09:27,480 --> 00:09:32,160 Das sagt uns, dass dies, weniger als 3 Standardabweichungen 200 00:09:32,160 --> 00:09:35,280 unter dem Durchschnitt und mehr als 3 Standardabweichungen 201 00:09:35,280 --> 00:09:39,150 über dem Durchschnitt, kombiniert den Rest ergeben muss. 202 00:09:39,150 --> 00:09:46,530 Der Rest, nun es bleiben nur 0,3% übrig. 203 00:09:46,530 --> 00:09:48,250 Und diese beiden hier sind asymmetrisch. 204 00:09:48,250 --> 00:09:49,620 Sie sind gleich. 205 00:09:49,620 --> 00:09:54,880 Das hier muss die Hälfte von diesem sein oder 0,15% 206 00:09:54,880 --> 00:09:59,160 und das hier ist 0,15%. 207 00:09:59,160 --> 00:10:03,650 Die Wahrscheinlichkeit, ein 1 Jahr altes weibliches Baby in 208 00:10:03,650 --> 00:10:07,250 den USA mit einem Gewicht von mehr als 12,8 kg zu haben, nimmt man 209 00:10:07,250 --> 00:10:10,490 eine perfekte Normalverteilung als Fläche unter dieser Kurve an, 210 00:10:10,490 --> 00:10:13,040 die Fläche, die mehr als 3 Standardabweichungen 211 00:10:13,040 --> 00:10:14,250 über dem Durchschnitt ist. 212 00:10:14,250 --> 00:10:21,760 Und das ist 0,15% 213 00:10:21,760 --> 00:10:24,410 Ich hoffe, ihr fandet dies hilfreich.