WEBVTT 00:00:00.610 --> 00:00:04.100 Behandeln wir ein weiteres Beispiel vom Abschnitt Normalverteilung 00:00:04.100 --> 00:00:10.120 aus dem AP Statistikbuch von ck12.org. 00:00:10.120 --> 00:00:11.770 Ich nutze ihres, da es Open Source ist und 00:00:11.770 --> 00:00:13.990 eigentlich ein ganz gutes Buch ist. 00:00:13.990 --> 00:00:16.475 Die Beispiele sind, denke ich, gute Übung für uns. 00:00:16.475 --> 00:00:19.070 Also, schauen wir, Nummer 3. 00:00:19.070 --> 00:00:20.390 Man kann auf ihre Webseite gehen und 00:00:20.390 --> 00:00:21.690 ich denke, auch ihr Buch runterladen. 00:00:21.690 --> 00:00:26.180 "Angenommen der Durchschnitt acht 1 Jahre alter Mädchen in den USA 00:00:26.180 --> 00:00:28.920 ist normalverteilt bzw. normalverteilt mit 00:00:28.920 --> 00:00:32.330 im Schnitt 9,5 g." 00:00:32.330 --> 00:00:33.820 Das müssen Kilogramm sein. 00:00:33.820 --> 00:00:35.930 Ich habe einen 10 Monate alten Sohn, der 00:00:35.930 --> 00:00:39.570 ca. 20 Pfund, also ca. 9 kg wiegt, nicht 9,5 g. 00:00:39.570 --> 00:00:41.040 9,5 g sind nichts. 00:00:41.040 --> 00:00:43.900 Da wären wir bei kleinen Mäusen oder so. 00:00:43.900 --> 00:00:44.940 Das müssen kg sein. 00:00:44.940 --> 00:00:47.350 Aber egal, es sind ca. 9,5 kg mit einer 00:00:47.350 --> 00:00:51.050 Standardabweichung von ca. 1,1 g. 00:00:51.050 --> 00:00:56.400 Der Durchschnitt ist also gleich 9,5 kg 00:00:56.400 --> 00:01:01.130 und die Standardabweichung gleich 1,1 g. 00:01:01.130 --> 00:01:04.840 Ohne Taschenrechner zu nutzen - ein interessanter Hinweis - 00:01:04.840 --> 00:01:08.950 schätze den Prozentsatz 1 Jahr alter Mädchen in den USA, 00:01:08.950 --> 00:01:09.995 die folgende Bedingungen erfüllen. 00:01:09.995 --> 00:01:12.910 Wenn gesagt wird "ohne Taschenrechner", 00:01:12.910 --> 00:01:15.250 ist das ein wichtiger Hinweis darauf, dass man 00:01:15.250 --> 00:01:16.350 die Empirische Regel anwenden muss. 00:01:20.040 --> 00:01:27.480 Empirische Regel wird manchmal 68-95-99.7 Regel genannt. 00:01:27.480 --> 00:01:29.960 Wenn ihr euch erinnert, das ist der Name der Regel, 00:01:29.960 --> 00:01:31.500 ihr habt euch einfach die Regel gemerkt. 00:01:31.500 --> 00:01:33.520 Sie sagt uns, dass wir eine Normalverteilung haben. 00:01:33.520 --> 00:01:35.800 Ich erkläre es zunächst ein wenig, bevor wir 00:01:35.800 --> 00:01:36.750 uns diesem Problem widmen. 00:01:36.750 --> 00:01:38.750 Haben wir eine Normalverteilung - 00:01:38.750 --> 00:01:40.480 lasst mich eine Normalverteilung zeichnen. 00:01:40.480 --> 00:01:42.900 Sie sieht etwa so aus. 00:01:42.900 --> 00:01:44.240 Meine Normalverteilung. 00:01:44.240 --> 00:01:45.940 Sie sieht nicht perfekt aus, aber ihr versteht, was ich meine. 00:01:45.940 --> 00:01:47.560 Es sollte symmetrisch sein. 00:01:47.560 --> 00:01:49.980 Das hier ist unser Durchschnitt. 00:01:49.980 --> 00:01:50.840 Das hier ist unser Durchschnitt. 00:01:50.840 --> 00:01:54.810 Gehen wir eine Standardabweichung über und 00:01:54.810 --> 00:02:00.350 1 unter den Durchschnitt... das ist unser Durchschnitt 00:02:00.350 --> 00:02:01.780 plus 1 Standardabweichung. 00:02:01.780 --> 00:02:05.730 Und das unser Durchschnitt minus 1 Standardabweichung. 00:02:05.730 --> 00:02:08.710 Die Wahrscheinlichkeit, bei perfekter Normalverteilung 00:02:08.710 --> 00:02:12.080 ein Ergebnis zu finden, welches zwischen 1 Standardabweichung 00:02:12.080 --> 00:02:14.640 unter und 1 Standardabweichung über dem Durchschnitt liegt, 00:02:14.640 --> 00:02:19.320 dieser Bereich hier, das wären, 00:02:19.320 --> 00:02:23.040 ihr könnt schätzen, 68%. 00:02:23.040 --> 00:02:26.430 68% Chance, dass man einen Wert innerhalb 1 00:02:26.430 --> 00:02:27.750 Standardabweichung vom Durchschnitt erhält. 00:02:27.750 --> 00:02:30.140 Entweder 1 Standardabweichung über oder unter 00:02:30.140 --> 00:02:31.450 oder irgendwie dazwischen. 00:02:31.450 --> 00:02:34.500 Sprechen wir nun über Standardabweichungen um den Durchschnitt 00:02:34.500 --> 00:02:37.170 herum -- gehen wir eine weitere Standardabweichung runter, 00:02:37.170 --> 00:02:39.570 und nochmal eine Standardabweichung hierhin, 00:02:39.570 --> 00:02:41.780 und eine weitere Standardabweichung über den Durchschnitt-- 00:02:41.780 --> 00:02:43.190 und wir müssten uns fragen, wie hoch die Wahrscheinlichkeit ist, 00:02:43.190 --> 00:02:47.360 etwas zwischen diesen beiden, in diesem Abschnitt zu finden, 00:02:47.360 --> 00:02:50.740 dann sind es, ihr könnt es erraten, 95%. 00:02:50.740 --> 00:02:53.060 Und das schließt diesen mittleren Abschnitt hier ein. 00:02:53.060 --> 00:02:56.510 DIe 68% sind eine Teilmenge dieser 95%. 00:02:56.510 --> 00:02:58.140 Und ich denke ihr wisst, wo das hinführt. 00:02:58.140 --> 00:03:01.360 Gehen wir 3 Standardabweichungen unter und 00:03:01.360 --> 00:03:06.820 über den Durchschnitt, sagt uns die Empirische Regel bzw. die 68-95-99,7 Regel, 00:03:06.820 --> 00:03:15.740 dass eine 99,7%ige Chance besteht, eine Ergebnis in 00:03:15.740 --> 00:03:19.120 der Normalverteilung zu finden, welches innerhalb 00:03:19.120 --> 00:03:20.110 3 Standardabweichungen vom Durchschnitt liegt. 00:03:20.110 --> 00:03:23.230 Also 3 Standardabweichungen unter und 00:03:23.230 --> 00:03:26.030 3 Standardabweichungen über dem Durchschnitt. 00:03:26.030 --> 00:03:27.870 Das sagt uns die Empirische Regel. 00:03:27.870 --> 00:03:30.960 Schauen wir nun, ob wir sie bei dieser Aufgabe anwenden können. 00:03:30.960 --> 00:03:33.140 Sie geben uns den Durchschnitt und die Standardabweichung vor. 00:03:33.140 --> 00:03:34.550 Ich zeichne das mal auf. 00:03:34.550 --> 00:03:38.550 Zuerst meine Achse, so gut wie ich kann. 00:03:38.550 --> 00:03:39.600 Zuerst meine Achse, so gut wie ich kann. 00:03:39.600 --> 00:03:41.410 Dann die glockenförmige Kurve. 00:03:45.920 --> 00:03:49.090 Das das beste, was ich freihand zeichnen kann. 00:03:49.090 --> 00:03:50.920 Das das beste, was ich freihand zeichnen kann. 00:03:50.920 --> 00:03:54.140 Und der Durchschnitt hier ist 9, das sollte symmetrisch sein. 00:03:54.140 --> 00:03:55.710 Diese Höhe sollte gleich dieser hier sein. 00:03:55.710 --> 00:03:57.600 Ich denke ihr versteht das Konzept. 00:03:57.600 --> 00:03:59.260 Ich bin kein Computer. 00:03:59.260 --> 00:04:02.390 9,5 ist der Durchschnitt. 00:04:02.390 --> 00:04:03.370 Ich schreibe keine Einheiten. 00:04:03.370 --> 00:04:04.580 Es ist alles in kg. 00:04:04.580 --> 00:04:11.330 1 Standardabweichung über dem Durchschnitt sollten wir 1,1 dazuaddieren, 00:04:11.330 --> 00:04:14.220 da sie uns die Standardabweichung von 1,1 vorgeben. 00:04:14.220 --> 00:04:16.820 Das ist 10,6. 00:04:16.820 --> 00:04:19.620 Ich zeichne hier noch eine gestrichelte Linie. 00:04:19.620 --> 00:04:25.990 Gehen wir 1 Standardabweichung unter den Durchschnitt, 00:04:25.990 --> 00:04:34.110 subtrahieren wir 1,1 von 9,5 und erhalten 8,4. 00:04:34.110 --> 00:04:37.620 Gehen wir 2 Standardabweichungen über den Durchschnitt, 00:04:37.620 --> 00:04:40.400 addieren wir hier nochmal eine Standardabweichung. 00:04:40.400 --> 00:04:40.610 Richtig? 00:04:40.610 --> 00:04:41.890 Wir gehen 1 Standardabweichung, 00:04:41.890 --> 00:04:42.700 2 Standardabweichungen. 00:04:42.700 --> 00:04:44.435 Das führt uns zu 11,7. 00:04:44.435 --> 00:04:47.040 Und gingen wir 3 Standardweichungen, 00:04:47.040 --> 00:04:48.910 würden wir wieder 1,1 addieren. 00:04:48.910 --> 00:04:50.720 Das brächte uns zu 12,8. 00:04:50.720 --> 00:04:53.820 Auf der anderen Seite, 1 Standardabweichung 00:04:53.820 --> 00:04:55.380 unter dem Durchschnitt ist 8,4. 00:04:55.380 --> 00:04:58.480 2 Standardabweichungen unter dem Durchschnitt-- 00:04:58.480 --> 00:05:00.910 wieder 1,1 subtrahieren-- wären 7,3. 00:05:00.910 --> 00:05:03.380 Und dann 3 Standardabweichungen unter dem Durchschnitt-- 00:05:03.380 --> 00:05:07.280 das schreiben wir hier hin-- wären 6,2 kg. 00:05:07.280 --> 00:05:08.860 Das ist nun also der Aufbau unseres Problems. 00:05:08.860 --> 00:05:12.070 Wie hoch ist die Wahrscheinlichkeit, ein 1 Jahr altes 00:05:12.070 --> 00:05:17.730 Mädchen in den USA zu finden, das weniger als 8,4 kg wiegt. 00:05:17.730 --> 00:05:19.330 Oder ich sollte besser sagen, wessen 00:05:19.330 --> 00:05:21.640 Masse ist weniger als 8,4 kg. 00:05:21.640 --> 00:05:25.150 Hier: Die Wahrscheinlichkeit, ein weibliches Baby zu finden, 00:05:25.150 --> 00:05:28.070 welches 1 Jahr alt ist und eine Masse bzw. Gewicht 00:05:28.070 --> 00:05:30.920 von weniger als 8,4 kg, das ist diese Fläche hier. 00:05:30.920 --> 00:05:31.610 von weniger als 8,4 kg, das ist diese Fläche hier. 00:05:31.610 --> 00:05:35.070 Ich sage Masse, da kg die Einheit für Masse ist. 00:05:35.070 --> 00:05:36.940 Die meisten nutzen es auch als Gewicht. 00:05:36.940 --> 00:05:38.470 Das ist also diese Fläche hier. 00:05:38.470 --> 00:05:40.950 Wie können wir nun die Fläche unter dieser 00:05:40.950 --> 00:05:43.900 Normalverteilung mithifle der Empirischen Regel ermitteln? 00:05:43.900 --> 00:05:47.280 Nun, wir kennen diese Fläche. 00:05:47.280 --> 00:05:52.370 Wir wissen, was diese Fläche zwischen -1 Standardabweichung 00:05:52.370 --> 00:05:54.500 und +1 Standardabweichung ist. 00:05:54.500 --> 00:05:55.920 Wir wissen, dass sie 68% ist. 00:05:58.430 --> 00:06:01.720 Sind das hier 68%, dann heißt das auch, das die 00:06:01.720 --> 00:06:04.360 Fläche außerhalb der Mitte 32% ist. 00:06:04.360 --> 00:06:07.200 Denn die Fläche unter der ganzen Normalverteilung 00:06:07.200 --> 00:06:11.380 ist 100 oder 100% oder 1, abhängig davon, wie man es betrachtet. 00:06:11.380 --> 00:06:14.490 Denn alle Möglichkeiten miteinander 00:06:14.490 --> 00:06:17.880 kombiniert können nur 1 ergeben. 00:06:17.880 --> 00:06:21.480 Man kann nicht mehr als 100% haben. 00:06:21.480 --> 00:06:27.270 Addieren wir diesen und diesen Abschnitt, 00:06:27.270 --> 00:06:29.490 ergibt das den Rest. 00:06:29.490 --> 00:06:32.590 Also 100 minus 68, sind 32. 00:06:32.590 --> 00:06:33.920 32% 00:06:33.920 --> 00:06:37.820 32% erhält man bei Addieren dieses und 00:06:37.820 --> 00:06:39.240 dieses Abschnittes hier. 00:06:39.240 --> 00:06:41.120 Und das ist eine perfekte Normalverteilung. 00:06:41.120 --> 00:06:42.535 Eine Normalverteilung war vorgegeben. 00:06:42.535 --> 00:06:44.780 Damit ist es also perfekt symmetrisch. 00:06:44.780 --> 00:06:48.730 Wenn diese beiden Abschnitte also zusammen 32 ergeben, 00:06:48.730 --> 00:06:51.820 beide aber symmetrisch sind, also dieselbe Fläche haben, 00:06:51.820 --> 00:06:56.490 dann ist diese Seite hier-- ich mache es in pink-- 00:06:56.490 --> 00:07:00.020 sieht mehr wie violett aus-- 16%. 00:07:00.020 --> 00:07:02.700 Und diese Seite hier wäre 16%. 00:07:02.700 --> 00:07:05.900 Die Wahrscheinlichkeit, ein Ergebnis von mehr als 00:07:05.900 --> 00:07:08.280 1 Standardabweichung über dem Durchschnitt zu erhalten, 00:07:08.280 --> 00:07:09.760 also diese Seite hier, wäre 16% 00:07:09.760 --> 00:07:13.040 Oder die Wahrscheinlichkeit, ein Ergebnis von weniger als 00:07:13.040 --> 00:07:17.050 1 Standardabweichung unter dem Durchschnitt zu haben, genau hier, 16%. 00:07:17.050 --> 00:07:19.060 Sie wollen also die Wahrscheinlichkeit eines 00:07:19.060 --> 00:07:23.140 1 Jahr alten Babys von weniger als 8,4 kg haben. 00:07:23.140 --> 00:07:27.970 Weinger als 8,4 kg ist diese Fläche genau hier. 00:07:27.970 --> 00:07:29.500 Und das sind 16%. 00:07:29.500 --> 00:07:33.270 Also 16% für Teil (a). 00:07:33.270 --> 00:07:38.280 Jetzt Teil (b): "Zwischen 7,3 und 11,7 kg." 00:07:38.280 --> 00:07:41.130 Zwischen 7,3 - das ist genau hier. 00:07:41.130 --> 00:07:47.120 Das sind 2 Standardabweichungen unter dem Durchschnitt- und 11,7 - 1, 00:07:47.120 --> 00:07:49.100 2 Standardabweichungen über dem Durchschnitt. 00:07:49.100 --> 00:07:51.260 Es wird im Prinzip nach der Wahrscheinlichkeit gefragt, 00:07:51.260 --> 00:07:54.340 ein Ergebnis innerhalb 2 Standardabweichungen 00:07:54.340 --> 00:07:55.230 vom Durchschnitt zu erhalten, richtig? 00:07:55.230 --> 00:07:57.040 Das hier ist der Durchschnitt. 00:07:57.040 --> 00:08:00.250 Das sind 2 Standardabweichungen darunter. 00:08:00.250 --> 00:08:02.630 Das sind 2 Standardabweichungen darüber. 00:08:02.630 --> 00:08:04.130 Nun, das ist relativ direkt. 00:08:04.130 --> 00:08:07.490 Die Empirische Regel sagt uns, dass man zwischen 2 Standardabweichungen 00:08:07.490 --> 00:08:13.950 eine 95%ige Chance hat, ein Ergebnis zu erhalten, welches innerhalb 00:08:13.950 --> 00:08:15.140 2 Standardabweichungen liegt. 00:08:15.140 --> 00:08:17.740 Die Empirische Regel gibt uns diese Antwort einfach. 00:08:17.740 --> 00:08:21.440 Und schließlich Teil (c): Die Wahrscheinlichkeit, ein 1 Jahr 00:08:21.440 --> 00:08:25.510 altes US weibliches Baby mit mehr als 12,8 kg zu haben. 00:08:25.510 --> 00:08:28.310 12,8 kg ist 3 Standardabweichungen über dem Durchschnitt. 00:08:28.310 --> 00:08:29.770 12,8 kg ist 3 Standardabweichungen über dem Durchschnitt. 00:08:29.770 --> 00:08:34.100 Wir wollen also die Wahrscheinlichkeit wissen, ein Ergebnis mehr 00:08:34.100 --> 00:08:36.250 als 3 Standardabweichungen über dem Durchschnitt zu haben. 00:08:36.250 --> 00:08:42.170 Das ist diese Fläche hier in orange gekennzeichnet. 00:08:42.170 --> 00:08:44.310 Vielleicht sollte ich eine andere Farbe dafür nehmen, 00:08:44.310 --> 00:08:45.280 um es hervorzuheben. 00:08:45.280 --> 00:08:48.575 Das ist dieser lange Abfall hier, diese kleine Fläche. 00:08:48.575 --> 00:08:51.020 Was ist also diese Wahrscheinlichkeit? 00:08:51.020 --> 00:08:53.420 Gehen wir wieder zur Empirischen Regel zurück. 00:08:53.420 --> 00:08:56.230 Wir kennen die Wahrscheinlichkeit-- diese Fläche. 00:08:56.230 --> 00:08:59.740 Wir kennen die Fläche zwischen -3 und +3 00:08:59.740 --> 00:09:01.960 Standardabweichungen. 00:09:01.960 --> 00:09:04.090 Da das die letzte Aufgabe ist, kann ich die ganze 00:09:04.090 --> 00:09:08.200 Fläche hier einfärben. Wir wissen, dass diese Fläche hier 00:09:08.200 --> 00:09:14.300 zwischen -3 und +3 gleich 99,7% ist. 00:09:14.300 --> 00:09:16.830 Der Großteil der Ergebnisse fällt hierunter. 00:09:16.830 --> 00:09:17.940 Eigentlich fast alle. 00:09:17.940 --> 00:09:20.320 Was bleibt also für die beiden Enden überig. 00:09:20.320 --> 00:09:21.220 Merkt euch: Es gibt 2 Enden. 00:09:21.220 --> 00:09:22.330 Das ist eines davon. 00:09:22.330 --> 00:09:24.630 Dann hat man die Ergebnisse weniger als 3 00:09:24.630 --> 00:09:25.730 Standardabweichungen unter dem Durchschnitt. 00:09:25.730 --> 00:09:27.480 Dieses Ende genau hier. 00:09:27.480 --> 00:09:32.160 Das sagt uns, dass dies, weniger als 3 Standardabweichungen 00:09:32.160 --> 00:09:35.280 unter dem Durchschnitt und mehr als 3 Standardabweichungen 00:09:35.280 --> 00:09:39.150 über dem Durchschnitt, kombiniert den Rest ergeben muss. 00:09:39.150 --> 00:09:46.530 Der Rest, nun es bleiben nur 0,3% übrig. 00:09:46.530 --> 00:09:48.250 Und diese beiden hier sind asymmetrisch. 00:09:48.250 --> 00:09:49.620 Sie sind gleich. 00:09:49.620 --> 00:09:54.880 Das hier muss die Hälfte von diesem sein oder 0,15% 00:09:54.880 --> 00:09:59.160 und das hier ist 0,15%. 00:09:59.160 --> 00:10:03.650 Die Wahrscheinlichkeit, ein 1 Jahr altes weibliches Baby in 00:10:03.650 --> 00:10:07.250 den USA mit einem Gewicht von mehr als 12,8 kg zu haben, nimmt man 00:10:07.250 --> 00:10:10.490 eine perfekte Normalverteilung als Fläche unter dieser Kurve an, 00:10:10.490 --> 00:10:13.040 die Fläche, die mehr als 3 Standardabweichungen 00:10:13.040 --> 00:10:14.250 über dem Durchschnitt ist. 00:10:14.250 --> 00:10:21.760 Und das ist 0,15% 00:10:21.760 --> 00:10:24.410 Ich hoffe, ihr fandet dies hilfreich.