[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,0:00:00.00,0:00:01.10,Default,,0000,0000,0000,,. Dialogue: 0,0:00:01.10,0:00:03.32,Default,,0000,0000,0000,,Das Video hier ist etwas besonderes Dialogue: 0,0:00:03.32,0:00:05.34,Default,,0000,0000,0000,,aus verschiedenen Gründen. Dialogue: 0,0:00:05.34,0:00:09.91,Default,,0000,0000,0000,,Erstens: ich zeige Euch die Varianz einer Stichprobe, Dialogue: 0,0:00:09.91,0:00:11.75,Default,,0000,0000,0000,,was allein schon interessant ist, Dialogue: 0,0:00:11.75,0:00:14.52,Default,,0000,0000,0000,,und ich versuche, das Video hier in HD aufzunehmen. Dialogue: 0,0:00:14.52,0:00:16.37,Default,,0000,0000,0000,,Und Ihr seht das hoffentlich größer und schärfer Dialogue: 0,0:00:16.37,0:00:17.03,Default,,0000,0000,0000,,als je zuvor. Dialogue: 0,0:00:17.03,0:00:19.15,Default,,0000,0000,0000,,Naja, wir werden sehen. Dialogue: 0,0:00:19.15,0:00:22.06,Default,,0000,0000,0000,,Ist also alles ein bisschen ein Experiment, ich bitte um Geduld. Dialogue: 0,0:00:22.06,0:00:25.18,Default,,0000,0000,0000,,Bevor wir die Varianz einer Stichprobe behandeln, Dialogue: 0,0:00:25.18,0:00:28.09,Default,,0000,0000,0000,,wäre es sinnvoll, die Varianz einer Population Dialogue: 0,0:00:28.09,0:00:28.87,Default,,0000,0000,0000,,zu wiederholen. Dialogue: 0,0:00:28.87,0:00:32.18,Default,,0000,0000,0000,,Dann können wir die Formeln vergleichen. Dialogue: 0,0:00:32.18,0:00:34.79,Default,,0000,0000,0000,,Die Varianz einer Population - das hier ist der Dialogue: 0,0:00:34.79,0:00:36.10,Default,,0000,0000,0000,,griechische Buchstabe Sigma. Dialogue: 0,0:00:36.10,0:00:37.42,Default,,0000,0000,0000,,Klein-Sigma zum Quadrat. Dialogue: 0,0:00:37.42,0:00:38.50,Default,,0000,0000,0000,,Das ist die Varianz. Dialogue: 0,0:00:38.50,0:00:41.01,Default,,0000,0000,0000,,Ich weiß, das ist komisch, dass eine Variable Dialogue: 0,0:00:41.01,0:00:41.71,Default,,0000,0000,0000,,direkt schon quadriert daherkommt. Dialogue: 0,0:00:41.71,0:00:42.84,Default,,0000,0000,0000,,Aber man nimmt hier nicht das Quadrat, Dialogue: 0,0:00:42.84,0:00:44.24,Default,,0000,0000,0000,,sondern die Variable ist eben Sigma Quadrat. Dialogue: 0,0:00:44.24,0:00:45.78,Default,,0000,0000,0000,,Sigma Quadrat heißt Varianz. Dialogue: 0,0:00:45.78,0:00:46.84,Default,,0000,0000,0000,,Ich schreib's mal hin. Dialogue: 0,0:00:46.84,0:00:48.00,Default,,0000,0000,0000,,Das ist die Varianz. Dialogue: 0,0:00:48.00,0:00:51.55,Default,,0000,0000,0000,,. Dialogue: 0,0:00:51.55,0:00:55.43,Default,,0000,0000,0000,,Und das ist gleich... Du nimmst jeden Datenpunkt.... Dialogue: 0,0:00:55.43,0:00:58.80,Default,,0000,0000,0000,,wir nennen die x Index i. Dialogue: 0,0:00:58.80,0:01:01.70,Default,,0000,0000,0000,,Du nimmst jeden Datenpunkt, schaust, wie weit der von Dialogue: 0,0:01:01.70,0:01:08.75,Default,,0000,0000,0000,,dem Mittelwert der Population weg ist, quadrierst das und Dialogue: 0,0:01:08.75,0:01:11.16,Default,,0000,0000,0000,,dann mittelst Du über alle diese. Dialogue: 0,0:01:11.16,0:01:12.90,Default,,0000,0000,0000,,Zum Mitteln, summierst Du alle auf. Dialogue: 0,0:01:12.90,0:01:14.20,Default,,0000,0000,0000,,Das geht von i gleich 1. Dialogue: 0,0:01:14.20,0:01:17.70,Default,,0000,0000,0000,,Also vom ersten Punkt, ganz bis zum n-ten Punkt. Dialogue: 0,0:01:17.70,0:01:19.94,Default,,0000,0000,0000,,Und dann, zum Mitteln, summierst Du alle auf und Dialogue: 0,0:01:19.94,0:01:21.97,Default,,0000,0000,0000,,teilst das durch n. Dialogue: 0,0:01:21.97,0:01:25.97,Default,,0000,0000,0000,,Die Varianz ist also das Mittel all dieser quadrierten Distanzen Dialogue: 0,0:01:25.97,0:01:27.39,Default,,0000,0000,0000,,von jedem Punkt und dem Mittelwert. Dialogue: 0,0:01:27.39,0:01:29.70,Default,,0000,0000,0000,,Und nur um eine Intuition zu haben, das bedeutet, Dialogue: 0,0:01:29.70,0:01:32.92,Default,,0000,0000,0000,,wie weit weg ungefähr die Datenpunkte Dialogue: 0,0:01:32.92,0:01:34.42,Default,,0000,0000,0000,,vom Mittelwert entfernt sind. Dialogue: 0,0:01:34.42,0:01:36.25,Default,,0000,0000,0000,,So stellt man sich am besten die Varianz vor. Dialogue: 0,0:01:36.25,0:01:37.64,Default,,0000,0000,0000,,Aber was, wenn wir... das hier war für Dialogue: 0,0:01:37.64,0:01:39.14,Default,,0000,0000,0000,,eine Population, nicht wahr? Dialogue: 0,0:01:39.14,0:01:42.05,Default,,0000,0000,0000,,Und wenn wir die Varianz der Körpergröße Dialogue: 0,0:01:42.05,0:01:44.58,Default,,0000,0000,0000,,aller Männer im Land haben wollten, Dialogue: 0,0:01:44.58,0:01:46.48,Default,,0000,0000,0000,,dann wäre das sehr schwierig. Dialogue: 0,0:01:46.48,0:01:48.91,Default,,0000,0000,0000,,Man müsste im Grunde die Größe Dialogue: 0,0:01:48.91,0:01:49.79,Default,,0000,0000,0000,,jedes Mannes messen. Dialogue: 0,0:01:49.79,0:01:51.36,Default,,0000,0000,0000,,250 Millionen Menschen. Dialogue: 0,0:01:51.36,0:01:55.08,Default,,0000,0000,0000,,Oder was wäre, wenn es um eine Population ginge, Dialogue: 0,0:01:55.08,0:01:56.86,Default,,0000,0000,0000,,an deren Daten man unmöglich rankäme oder um Dialogue: 0,0:01:56.86,0:01:57.64,Default,,0000,0000,0000,,eine Zufallsvariable. Dialogue: 0,0:01:57.64,0:01:59.10,Default,,0000,0000,0000,,Dazu später mehr. Dialogue: 0,0:01:59.10,0:02:02.66,Default,,0000,0000,0000,,Also in vielen Fällen will man diese Varianz nur abschätzen, Dialogue: 0,0:02:02.66,0:02:04.69,Default,,0000,0000,0000,,indem man die Varianz einer Stichprobe nimmt. Dialogue: 0,0:02:04.69,0:02:07.42,Default,,0000,0000,0000,,Genauso wie man niemals den Mittelwert einer Population messen kann, Dialogue: 0,0:02:07.42,0:02:09.57,Default,,0000,0000,0000,,aber vielleicht will man den abschätzen, indem man Dialogue: 0,0:02:09.57,0:02:11.06,Default,,0000,0000,0000,,den Mittelwert einer Stichprobe nimmt. Dialogue: 0,0:02:11.06,0:02:13.89,Default,,0000,0000,0000,,Das haben wir im ersten Video gelernt. Dialogue: 0,0:02:13.89,0:02:17.52,Default,,0000,0000,0000,,Wenn das hier die ganze Population ist. Dialogue: 0,0:02:17.52,0:02:20.28,Default,,0000,0000,0000,,Das sind Millionen von Datenpunkten, sogar Datenpunkte, Dialogue: 0,0:02:20.28,0:02:21.87,Default,,0000,0000,0000,,die in der Zukunft liegen, die Du niemals bekommst, Dialogue: 0,0:02:21.87,0:02:23.29,Default,,0000,0000,0000,,weil es eine Zufallsvariable ist. Dialogue: 0,0:02:23.29,0:02:24.24,Default,,0000,0000,0000,,Das ist also die Population. Dialogue: 0,0:02:24.24,0:02:26.92,Default,,0000,0000,0000,,. Dialogue: 0,0:02:26.92,0:02:32.39,Default,,0000,0000,0000,,Du willst vielleicht nur eine Schätzung, indem Du eine Stichprobe nimmst. Dialogue: 0,0:02:32.39,0:02:35.02,Default,,0000,0000,0000,,Darum geht es im Grunde bei der Dialogue: 0,0:02:35.02,0:02:36.36,Default,,0000,0000,0000,,induktiven Statistik. Dialogue: 0,0:02:36.36,0:02:38.72,Default,,0000,0000,0000,,Dass man deskriptive Statistikwerte einer Stichprobe herausfindet Dialogue: 0,0:02:38.72,0:02:40.89,Default,,0000,0000,0000,,und daraus Schlüsse über die Population zieht. Dialogue: 0,0:02:40.89,0:02:44.61,Default,,0000,0000,0000,,Lass uns diese Medizin bei 100 Leuten ausprobieren und Dialogue: 0,0:02:44.61,0:02:46.88,Default,,0000,0000,0000,,wenn es statistisch signifikante Ergebnisse bringt, Dialogue: 0,0:02:46.88,0:02:48.85,Default,,0000,0000,0000,,wird die Medizin wahrscheinlich auch bei der ganzen Population wirken. Dialogue: 0,0:02:48.85,0:02:49.80,Default,,0000,0000,0000,,Darum geht's im Grunde. Dialogue: 0,0:02:49.80,0:02:51.92,Default,,0000,0000,0000,,Es ist also echt wichtig, den Unterschied zwischen Dialogue: 0,0:02:51.92,0:02:53.58,Default,,0000,0000,0000,,Stichprobe und Population zu verstehen. Dialogue: 0,0:02:53.58,0:02:57.51,Default,,0000,0000,0000,,Und wenn man statistische Werte über eine Stichprobe findet, Dialogue: 0,0:02:57.51,0:03:00.16,Default,,0000,0000,0000,,die die Population größtenteils beschreiben können oder Dialogue: 0,0:03:00.16,0:03:03.72,Default,,0000,0000,0000,,abschätzen können, dann nennen wir diese Werte Parameter für die Population. Dialogue: 0,0:03:03.72,0:03:07.33,Default,,0000,0000,0000,,Was ist also der Mittelwert von ... ich schreib diese Definitionen neu. Dialogue: 0,0:03:07.33,0:03:08.83,Default,,0000,0000,0000,,Was ist der Mittelwert einer Population? Dialogue: 0,0:03:08.83,0:03:09.94,Default,,0000,0000,0000,,Ich mach das mal in lila. Dialogue: 0,0:03:09.94,0:03:11.63,Default,,0000,0000,0000,,Lila für Population. Dialogue: 0,0:03:11.63,0:03:13.68,Default,,0000,0000,0000,,Der Mittelwert einer Population. Dialogue: 0,0:03:13.68,0:03:19.70,Default,,0000,0000,0000,,Du nimmst jeden Datenpunkt in der Population, x i. Dialogue: 0,0:03:19.70,0:03:21.85,Default,,0000,0000,0000,,Summierst sie auf. Dialogue: 0,0:03:21.85,0:03:23.83,Default,,0000,0000,0000,,Du beginnst mit dem ersten Punkt und gehst durch Dialogue: 0,0:03:23.83,0:03:25.62,Default,,0000,0000,0000,,bis zum n-ten Punkt. Dialogue: 0,0:03:25.62,0:03:26.74,Default,,0000,0000,0000,,Und teilst durch n. Dialogue: 0,0:03:26.74,0:03:27.80,Default,,0000,0000,0000,,Alles aufsummierren und durch n teilen. Dialogue: 0,0:03:27.80,0:03:28.92,Default,,0000,0000,0000,,Das ist der Mittelwert. Dialogue: 0,0:03:28.92,0:03:30.50,Default,,0000,0000,0000,,Dann fügen wir das in die Formel ein. Dialogue: 0,0:03:30.50,0:03:33.06,Default,,0000,0000,0000,,Und Du kannst sehen, wie weit jeder Punkt vom Dialogue: 0,0:03:33.06,0:03:34.27,Default,,0000,0000,0000,,zentralen Punkt entfernt ist, vom Mittelwert. Dialogue: 0,0:03:34.27,0:03:36.26,Default,,0000,0000,0000,,Und man bekommt die Varianz. Dialogue: 0,0:03:36.26,0:03:39.67,Default,,0000,0000,0000,,Was passiert jetzt bei einer Stichprobe? Dialogue: 0,0:03:39.67,0:03:43.35,Default,,0000,0000,0000,,Naja, wenn wir den Mittelwert einer Population abschätzen wollen, Dialogue: 0,0:03:43.35,0:03:46.60,Default,,0000,0000,0000,,indem wir den Mittelwert für einer Stichprobe berechnen, dann Dialogue: 0,0:03:46.60,0:03:49.17,Default,,0000,0000,0000,,ist es das Beste... und das sind alles menschengemachte Formeln. Dialogue: 0,0:03:49.17,0:03:51.14,Default,,0000,0000,0000,,Irgendwelche Menschen haben sich gefragt, was ist Dialogue: 0,0:03:51.14,0:03:51.71,Default,,0000,0000,0000,,der beste Weg das zu schätzen? Dialogue: 0,0:03:51.71,0:03:54.55,Default,,0000,0000,0000,,Das beste, was wir tun können, ist den Mittelwert unserer Stichprobe zu nehmen. Dialogue: 0,0:03:54.55,0:03:56.82,Default,,0000,0000,0000,,Und das ist dann der Stichproben-Mittelwert. Dialogue: 0,0:03:56.82,0:03:58.92,Default,,0000,0000,0000,,Wir haben im ersten Video gelernt, dass diese Notation Dialogue: 0,0:03:58.92,0:04:00.45,Default,,0000,0000,0000,,Die Formel ist fast identisch. Dialogue: 0,0:04:00.45,0:04:01.54,Default,,0000,0000,0000,,Nur die Notation ist anders. Dialogue: 0,0:04:01.54,0:04:04.99,Default,,0000,0000,0000,,Statt Mü schreibt man x mit einem Strich darauf. Dialogue: 0,0:04:04.99,0:04:08.62,Default,,0000,0000,0000,,Stichproben-Mittelwert ist gleich - wieder nimmt man Dialogue: 0,0:04:08.62,0:04:12.10,Default,,0000,0000,0000,,nur die Datenpunkte aus der Stichproben, nicht aus der ganzen Population. Dialogue: 0,0:04:12.10,0:04:16.37,Default,,0000,0000,0000,,Du summierst sie, vom ersten bis Dialogue: 0,0:04:16.37,0:04:17.38,Default,,0000,0000,0000,,zum n-ten, richtig? Dialogue: 0,0:04:17.38,0:04:20.64,Default,,0000,0000,0000,,Man sagt, da sind n Datenpunkte in dieser Stichprobe. Dialogue: 0,0:04:20.64,0:04:23.39,Default,,0000,0000,0000,,Und dann teilst du es durch die Anzahl der Datenpunkte. Dialogue: 0,0:04:23.39,0:04:24.32,Default,,0000,0000,0000,,So weit, so gut. Dialogue: 0,0:04:24.32,0:04:25.66,Default,,0000,0000,0000,,Es ist eigentlich die gleiche Formel. Dialogue: 0,0:04:25.66,0:04:27.50,Default,,0000,0000,0000,,Wie ich den Mittelwert der Population gerechnet habe, ich sag mal, Dialogue: 0,0:04:27.50,0:04:29.59,Default,,0000,0000,0000,,wenn ich nur eine Stichprobe habe, lass mich den Mittelwert genauso berechnen. Dialogue: 0,0:04:29.59,0:04:32.56,Default,,0000,0000,0000,,Dann ist das wohl eine gute Schätzung des Mittelwerts Dialogue: 0,0:04:32.56,0:04:33.93,Default,,0000,0000,0000,,der Population. Dialogue: 0,0:04:33.93,0:04:36.34,Default,,0000,0000,0000,,Bei der Varianz wird's jetzt spannend. Dialogue: 0,0:04:36.34,0:04:39.25,Default,,0000,0000,0000,,Die normale Reaktion wäre: OK, ich hab diese Stichprobe Dialogue: 0,0:04:39.25,0:04:43.26,Default,,0000,0000,0000,,und wenn ich die Varianz der Population schätzen will, Dialogue: 0,0:04:43.26,0:04:45.23,Default,,0000,0000,0000,,warum wende ich nicht die gleiche Formel an Dialogue: 0,0:04:45.23,0:04:46.15,Default,,0000,0000,0000,,aber eben über der Stichprobe? Dialogue: 0,0:04:46.15,0:04:49.33,Default,,0000,0000,0000,,Das könnte ich sagen - und das ist dann tatsächlich die Stichproben-Varianz. Dialogue: 0,0:04:49.33,0:04:54.57,Default,,0000,0000,0000,,Man verwendet s Quadrat. Dialogue: 0,0:04:54.57,0:04:58.22,Default,,0000,0000,0000,,Sigma ist ein griechischer Buchstabe, der äquivalent zu s ist. Dialogue: 0,0:04:58.22,0:04:59.98,Default,,0000,0000,0000,,Aber da wir hier mit der Stichprobe arbeiten, Dialogue: 0,0:04:59.98,0:05:01.00,Default,,0000,0000,0000,,schreiben wir hier s. Dialogue: 0,0:05:01.00,0:05:02.32,Default,,0000,0000,0000,,Das ist die Stichproben-Varianz. Dialogue: 0,0:05:02.32,0:05:03.07,Default,,0000,0000,0000,,Ich schreib's mal hin. Dialogue: 0,0:05:03.07,0:05:03.95,Default,,0000,0000,0000,,Stichproben-Varianz. Dialogue: 0,0:05:03.95,0:05:11.86,Default,,0000,0000,0000,,. Dialogue: 0,0:05:11.86,0:05:15.87,Default,,0000,0000,0000,,Wir könnten sagen, vielleicht ist es eine gute Idee, Dialogue: 0,0:05:15.87,0:05:17.34,Default,,0000,0000,0000,,die Stichproben-Varianz auf die gleiche Weise zu rechnen. Dialogue: 0,0:05:17.34,0:05:23.67,Default,,0000,0000,0000,,Wir nehmen die Distanz von jedem der Punkte in der Stichprobe. Dialogue: 0,0:05:23.67,0:05:26.60,Default,,0000,0000,0000,,Finden raus, wie weit die sind vom Stichproben-Mittelwert. Dialogue: 0,0:05:26.60,0:05:29.23,Default,,0000,0000,0000,,Hier haben die den Populations-Mittelwert benutzt, aber jetzt Dialogue: 0,0:05:29.23,0:05:31.45,Default,,0000,0000,0000,,benutzen wir den Stichproben-Mittelwert, weil wir nur den haben. Dialogue: 0,0:05:31.45,0:05:33.16,Default,,0000,0000,0000,,Den Populations-Mittelwert kennen wir nicht Dialogue: 0,0:05:33.16,0:05:35.51,Default,,0000,0000,0000,,ohne die ganze Population einzubeziehen. Dialogue: 0,0:05:35.51,0:05:36.40,Default,,0000,0000,0000,,Nimm das zum Quadrat. Dialogue: 0,0:05:36.40,0:05:38.16,Default,,0000,0000,0000,,Das macht es positiv und es weitere Eigenschaften, Dialogue: 0,0:05:38.16,0:05:40.16,Default,,0000,0000,0000,,auf die ich später komme. Dialogue: 0,0:05:40.16,0:05:42.73,Default,,0000,0000,0000,,Dann nimm den Durchschnitt von allen diesen quadierten Distanzen. Dialogue: 0,0:05:42.73,0:05:44.97,Default,,0000,0000,0000,,Summierst alle auf. Dialogue: 0,0:05:44.97,0:05:47.43,Default,,0000,0000,0000,,Es gibt n davon, richtig? Dialogue: 0,0:05:47.43,0:05:48.40,Default,,0000,0000,0000,,klein-n. Dialogue: 0,0:05:48.40,0:05:51.82,Default,,0000,0000,0000,,Du teilst durch klein-n. Dialogue: 0,0:05:51.82,0:05:53.23,Default,,0000,0000,0000,,Und du findest, das ist eine gute Schätzung. Dialogue: 0,0:05:53.23,0:05:55.58,Default,,0000,0000,0000,,Was auch immer die wahre Varianz ist, das könnte eine gute Schätzung sein Dialogue: 0,0:05:55.58,0:05:56.72,Default,,0000,0000,0000,,für die gesamte Population. Dialogue: 0,0:05:56.72,0:06:00.62,Default,,0000,0000,0000,,Das ist das, worüber die Leute reden, wenn sie Dialogue: 0,0:06:00.62,0:06:01.98,Default,,0000,0000,0000,,von Stichproben-Varianz sprechen. Dialogue: 0,0:06:01.98,0:06:05.26,Default,,0000,0000,0000,,Manchmal wird man darauf verwiesen. Dialogue: 0,0:06:05.26,0:06:07.52,Default,,0000,0000,0000,,Man schreibt ein klein-n hinein. Dialogue: 0,0:06:07.52,0:06:09.84,Default,,0000,0000,0000,,Der Grund ist, wir haben durch n geteilt. Dialogue: 0,0:06:09.84,0:06:11.84,Default,,0000,0000,0000,,Du fragst vielleicht: Sal, was ist das Problem? Dialogue: 0,0:06:11.84,0:06:14.00,Default,,0000,0000,0000,,Und das Problem... ich versuch mal, einen Eindruck zu vermitteln, Dialogue: 0,0:06:14.00,0:06:16.18,Default,,0000,0000,0000,,das hat mich wirklich immer etwas verwirrt. Dialogue: 0,0:06:16.18,0:06:19.34,Default,,0000,0000,0000,,Und selbst jetzt muss ich manchmal mit mir ringen, Dialogue: 0,0:06:19.34,0:06:21.53,Default,,0000,0000,0000,,um die Idee dahinter zu begreifen. Dialogue: 0,0:06:21.53,0:06:24.51,Default,,0000,0000,0000,,Ich habe so eine Idee, aber das etwas formaler Dialogue: 0,0:06:24.51,0:06:26.95,Default,,0000,0000,0000,,zu beweisen, dass das wirklich stimmt... Dialogue: 0,0:06:26.95,0:06:28.28,Default,,0000,0000,0000,,Stellt Euch das so vor. Dialogue: 0,0:06:28.28,0:06:29.90,Default,,0000,0000,0000,,Wenn ich ein paar Zahlen habe Dialogue: 0,0:06:29.90,0:06:32.74,Default,,0000,0000,0000,,und ich male einen Zahlenstrahl hier. Dialogue: 0,0:06:32.74,0:06:35.74,Default,,0000,0000,0000,,Wenn ich eine Zahl eintrage - sagen wir, man weiß... Dialogue: 0,0:06:35.74,0:06:39.43,Default,,0000,0000,0000,,Sagen wir ich habe ein paar Zahlen in meiner Population Dialogue: 0,0:06:39.43,0:06:41.66,Default,,0000,0000,0000,,Sagen wir... ich schreibe jetzt zufällig ein paar Dialogue: 0,0:06:41.66,0:06:44.28,Default,,0000,0000,0000,,Zahlen in meine Population. Dialogue: 0,0:06:44.28,0:06:45.93,Default,,0000,0000,0000,,Und die auf der rechten Seite sind größer als die Dialogue: 0,0:06:45.93,0:06:46.36,Default,,0000,0000,0000,,auf der linken Seite. Dialogue: 0,0:06:46.36,0:06:48.90,Default,,0000,0000,0000,,. Dialogue: 0,0:06:48.90,0:06:52.99,Default,,0000,0000,0000,,Wenn ich eine Stichprobe davon nehme, vielleicht .. Dialogue: 0,0:06:52.99,0:06:54.82,Default,,0000,0000,0000,,Die Stichprobe ist zufällig. Dialogue: 0,0:06:54.82,0:06:56.21,Default,,0000,0000,0000,,Man will wirklich eine zufällige Stichprobe nehmen. Dialogue: 0,0:06:56.21,0:06:57.32,Default,,0000,0000,0000,,Man will nicht, dass das unausgeglichen ist. Dialogue: 0,0:06:57.32,0:07:02.90,Default,,0000,0000,0000,,Vielleicht wähle ich diese Zahl, diese und diese Dialogue: 0,0:07:02.90,0:07:05.42,Default,,0000,0000,0000,,und diese, OK? Dialogue: 0,0:07:05.42,0:07:07.48,Default,,0000,0000,0000,,Wenn ich jetzt den Mittelwert dieser Zahl, Dialogue: 0,0:07:07.48,0:07:08.46,Default,,0000,0000,0000,,dieser Zahl, dieser Zahl und dieser Zahl nehme, Dialogue: 0,0:07:08.46,0:07:09.32,Default,,0000,0000,0000,,wird der irgendwo in der Mitte sein. Dialogue: 0,0:07:09.32,0:07:11.01,Default,,0000,0000,0000,,Vielleicht irgendwo hier drüben. Dialogue: 0,0:07:11.01,0:07:13.24,Default,,0000,0000,0000,,Und wenn ich die Stichproben-Varianz berechne Dialogue: 0,0:07:13.24,0:07:16.78,Default,,0000,0000,0000,,mit dieser Formel, dann nehme ich diese Distanz zum Quadrat plus Dialogue: 0,0:07:16.78,0:07:21.06,Default,,0000,0000,0000,,dieser Distanz zum Qudrat plus dieser Distanz zum Quadrat plus Dialogue: 0,0:07:21.06,0:07:23.52,Default,,0000,0000,0000,,dieser Distanz zum Quadrat und mittle über alles. Dialogue: 0,0:07:23.52,0:07:24.70,Default,,0000,0000,0000,,Dann würde ich diese Zahl bekommen Dialogue: 0,0:07:24.70,0:07:27.82,Default,,0000,0000,0000,,und das wäre wohl eine recht gute Schätzung der Dialogue: 0,0:07:27.82,0:07:30.26,Default,,0000,0000,0000,,Varianz der gesamten Population. Dialogue: 0,0:07:30.26,0:07:32.07,Default,,0000,0000,0000,,Die Population des Mittelwerts ist möglicherweise Dialogue: 0,0:07:32.07,0:07:33.03,Default,,0000,0000,0000,,weiß nicht Dialogue: 0,0:07:33.03,0:07:35.02,Default,,0000,0000,0000,,Es könnte ziemlich ähnlich zu dem hier sein. Dialogue: 0,0:07:35.02,0:07:37.15,Default,,0000,0000,0000,,Wenn wir alle Datenpunkte nehmen würden und dann das Mittel nähmen, Dialogue: 0,0:07:37.15,0:07:39.06,Default,,0000,0000,0000,,dann wäre das vielleicht irgendwo hier. Dialogue: 0,0:07:39.06,0:07:40.66,Default,,0000,0000,0000,,Und wenn du dann die Varianz ausrechnest, dann wäre das Dialogue: 0,0:07:40.66,0:07:43.59,Default,,0000,0000,0000,,vielleicht recht nah am Mittelwert der ganzen Linien hier, ja? Dialogue: 0,0:07:43.59,0:07:46.81,Default,,0000,0000,0000,,Von allen Varianz-Abständen der Stichprobe, ja? Dialogue: 0,0:07:46.81,0:07:47.25,Default,,0000,0000,0000,,So weit, so gut. Dialogue: 0,0:07:47.25,0:07:47.90,Default,,0000,0000,0000,,Jetzt sagst du, OK, Sal, Dialogue: 0,0:07:47.90,0:07:49.71,Default,,0000,0000,0000,,sieht ja ganz gut aus, Dialogue: 0,0:07:49.71,0:07:51.94,Default,,0000,0000,0000,,aber da ist ein Haken. Dialogue: 0,0:07:51.94,0:07:54.56,Default,,0000,0000,0000,,Was ist denn... Es besteht immer die Möglichkeit, dass man Dialogue: 0,0:07:54.56,0:07:56.99,Default,,0000,0000,0000,,nicht diese schön verteilten Zahlen als Stichprobe wählt, Dialogue: 0,0:07:56.99,0:08:00.80,Default,,0000,0000,0000,,sondern, was passiert, wenn ich eben diese Zahl, diese Zahl Dialogue: 0,0:08:00.80,0:08:03.92,Default,,0000,0000,0000,,und diese Zahl Dialogue: 0,0:08:03.92,0:08:05.40,Default,,0000,0000,0000,,als Stichprobe wähle? Dialogue: 0,0:08:05.40,0:08:08.37,Default,,0000,0000,0000,,Was auch immer deine Stichprobe ist, dein Stichproben-Mittelwert Dialogue: 0,0:08:08.37,0:08:10.21,Default,,0000,0000,0000,,wird immer in der Mitte davon sein, ja? Dialogue: 0,0:08:10.21,0:08:12.96,Default,,0000,0000,0000,,Also in diesem Fall ist dein Stichproben-Mittelwert hier. Dialogue: 0,0:08:12.96,0:08:15.01,Default,,0000,0000,0000,,Und bei diesen Zahlen würde man jetzt sagen, OK, die Zahl hier Dialogue: 0,0:08:15.01,0:08:17.81,Default,,0000,0000,0000,,ist nicht sehr weit von dieser Zahl entfernt und diese Zahl nicht sehr weit von jener und Dialogue: 0,0:08:17.81,0:08:19.10,Default,,0000,0000,0000,,diese Zahl ist auch nicht weit. Dialogue: 0,0:08:19.10,0:08:21.79,Default,,0000,0000,0000,,Also wird deine Stichproben-Varianz, wenn man's so macht, ziemlich Dialogue: 0,0:08:21.79,0:08:23.61,Default,,0000,0000,0000,,niedrig sein. Dialogue: 0,0:08:23.61,0:08:26.92,Default,,0000,0000,0000,,Einfach weil alle diese Zahlen ziemlich... Dialogue: 0,0:08:26.92,0:08:28.92,Default,,0000,0000,0000,,... ziemlich nah an ihrem Mittelwert Dialogue: 0,0:08:28.92,0:08:30.35,Default,,0000,0000,0000,,sein werden. Dialogue: 0,0:08:30.35,0:08:34.60,Default,,0000,0000,0000,,Aber in diesem Fall ist die Stichprobe irgendwie unausgeglichen und Dialogue: 0,0:08:34.60,0:08:37.98,Default,,0000,0000,0000,,der wirkliche Mittelwert der Population ist ja irgendwo hier drüben. Dialogue: 0,0:08:37.98,0:08:40.80,Default,,0000,0000,0000,,Also ist auch die wirkliche Varianz der Stichprobe, wenn man Dialogue: 0,0:08:40.80,0:08:43.67,Default,,0000,0000,0000,,den echten Mittelwert wüsste - ich weiß, es klingt verwirrend - Dialogue: 0,0:08:43.67,0:08:44.98,Default,,0000,0000,0000,,wenn du den echten Mittelwert wüsstest, würdest du sagen Dialogue: 0,0:08:44.98,0:08:46.83,Default,,0000,0000,0000,,"Wow!". Dialogue: 0,0:08:46.83,0:08:48.39,Default,,0000,0000,0000,,Du würdest dann diese Abstände hier sehen, die natürlich Dialogue: 0,0:08:48.39,0:08:51.32,Default,,0000,0000,0000,,viel größer wären. Dialogue: 0,0:08:51.32,0:08:53.64,Default,,0000,0000,0000,,Warum ich das alles erzähle ist, wenn du Dialogue: 0,0:08:53.64,0:08:58.28,Default,,0000,0000,0000,,eine Stichprobe nimmst, dann ist es möglich, dass dein Stichproben-Mittelwert Dialogue: 0,0:08:58.28,0:09:00.38,Default,,0000,0000,0000,,dem Populations-Mittelwert sehr ähnlich ist, ja? Dialogue: 0,0:09:00.38,0:09:02.61,Default,,0000,0000,0000,,Der Stichproben-Mittelwert ist vielleicht hier und der Dialogue: 0,0:09:02.61,0:09:03.36,Default,,0000,0000,0000,,Populations-Mittelwert hier. Dialogue: 0,0:09:03.36,0:09:05.77,Default,,0000,0000,0000,,Und dann funktioniert diese Formel ganz wunderbar, Dialogue: 0,0:09:05.77,0:09:07.77,Default,,0000,0000,0000,,jedenfalls, was die Stichprobenpunkte betrifft und was das Dialogue: 0,0:09:07.77,0:09:09.28,Default,,0000,0000,0000,,Berechnen der Varianz betrifft. Dialogue: 0,0:09:09.28,0:09:14.24,Default,,0000,0000,0000,,Aber es kann auch sein, dass dein Stichproben-Mittelwert... Dialogue: 0,0:09:14.24,0:09:16.73,Default,,0000,0000,0000,,also die Stichprobe ist immer in den Daten enthalten, ja? Dialogue: 0,0:09:16.73,0:09:18.74,Default,,0000,0000,0000,,Der Mittelwert ist immer in der Mitte der Stichproben-Daten. Dialogue: 0,0:09:18.74,0:09:21.47,Default,,0000,0000,0000,,Aber es ist durchaus möglich, dass der Populations-Mittelwert Dialogue: 0,0:09:21.47,0:09:22.59,Default,,0000,0000,0000,,außerhalb der Stichproben-Daten liegt. Dialogue: 0,0:09:22.59,0:09:24.75,Default,,0000,0000,0000,,Es kann einfach sein, dass du Werte gewählt hast, Dialogue: 0,0:09:24.75,0:09:28.11,Default,,0000,0000,0000,,die nicht den eigentlichen Populations-Mittelwert enthalten. Dialogue: 0,0:09:28.11,0:09:31.67,Default,,0000,0000,0000,,Und wenn du dann die Stichproben-Varianz auf diesem Weg berechnest, Dialogue: 0,0:09:31.67,0:09:34.99,Default,,0000,0000,0000,,dann unterschätzt du die eigentliche Dialogue: 0,0:09:34.99,0:09:36.24,Default,,0000,0000,0000,,Populations-Varianz, richtig? Dialogue: 0,0:09:36.24,0:09:38.23,Default,,0000,0000,0000,,Einfach, weil sie immer näher am eigenen Mittelwert sein werden Dialogue: 0,0:09:38.23,0:09:39.96,Default,,0000,0000,0000,,als am Mittelwert der Population. Dialogue: 0,0:09:39.96,0:09:43.46,Default,,0000,0000,0000,,Und wenn du nur 10% von all dem hier verstehst, Dialogue: 0,0:09:43.46,0:09:45.77,Default,,0000,0000,0000,,dann bist du bereits ein Student fortgeschrittener Statistik. Dialogue: 0,0:09:45.77,0:09:49.12,Default,,0000,0000,0000,,Ich erzähle all das nur, um dir - hoffentlich - Dialogue: 0,0:09:49.12,0:09:53.50,Default,,0000,0000,0000,,eine Ahnung davon zu geben, da das hier häufig... Dialogue: 0,0:09:53.50,0:09:57.24,Default,,0000,0000,0000,,diese Formel wird häufig die eigentliche Varianz der Population Dialogue: 0,0:09:57.24,0:09:59.11,Default,,0000,0000,0000,,unterschätzen. Dialogue: 0,0:09:59.11,0:10:01.42,Default,,0000,0000,0000,,Und es gibt eine Formel - und das wurde tatsächlich richtig Dialogue: 0,0:10:01.42,0:10:04.74,Default,,0000,0000,0000,,bewiesen - eine Formel, die eine bessere Schätzung, Dialogue: 0,0:10:04.74,0:10:08.00,Default,,0000,0000,0000,,oder sagen wir eine ausgeglichenere Schätzung der Dialogue: 0,0:10:08.00,0:10:09.03,Default,,0000,0000,0000,,Populations-Varianz darstellt. Dialogue: 0,0:10:09.03,0:10:11.39,Default,,0000,0000,0000,,Oder auch die ausgeglichene Stichproben-Varianz. Dialogue: 0,0:10:11.39,0:10:14.16,Default,,0000,0000,0000,,Und manchmal wird es einfach als s Quadrat geschrieben, Dialogue: 0,0:10:14.16,0:10:18.93,Default,,0000,0000,0000,,manchmal als s Index n-1 zum Quadrat. Dialogue: 0,0:10:18.93,0:10:20.72,Default,,0000,0000,0000,,Und ich zeig euch warum. Dialogue: 0,0:10:20.72,0:10:22.34,Default,,0000,0000,0000,,Es ist fast das gleiche. Dialogue: 0,0:10:22.34,0:10:24.73,Default,,0000,0000,0000,,Du nimmst jeden Datenpunkt, schaust, wie weit sie Dialogue: 0,0:10:24.73,0:10:28.17,Default,,0000,0000,0000,,vom Stichproben-Mittelwert weg sind Dialogue: 0,0:10:28.17,0:10:28.90,Default,,0000,0000,0000,,und quadrierst das. Dialogue: 0,0:10:28.90,0:10:31.83,Default,,0000,0000,0000,,Und dann nimmst du das Mittel dieser quadrierten Werte, Dialogue: 0,0:10:31.83,0:10:33.43,Default,,0000,0000,0000,,mit einem kleinen Unterschied: Dialogue: 0,0:10:33.43,0:10:35.72,Default,,0000,0000,0000,,i gleich 1 bis i gleich n... Dialogue: 0,0:10:35.72,0:10:39.37,Default,,0000,0000,0000,,statt durch n zu teilen, teilst du durch eine etwas Dialogue: 0,0:10:39.37,0:10:41.92,Default,,0000,0000,0000,,kleinere Zahl. Dialogue: 0,0:10:41.92,0:10:44.35,Default,,0000,0000,0000,,Du teilst durch n minus 1. Dialogue: 0,0:10:44.35,0:10:46.88,Default,,0000,0000,0000,,Wenn du durch n minus 1 teilst anstatt durch n zu teilen, Dialogue: 0,0:10:46.88,0:10:49.59,Default,,0000,0000,0000,,wirst du ein etwas größeres Ergebnis bekommen. Dialogue: 0,0:10:49.59,0:10:51.06,Default,,0000,0000,0000,,Und es stellt sich heraus, dass das Dialogue: 0,0:10:51.06,0:10:52.26,Default,,0000,0000,0000,,tatsächlich eine viel bessere Schätzung ist. Dialogue: 0,0:10:52.26,0:10:54.81,Default,,0000,0000,0000,,Und eines Tages werde ich ein Computerprogramm schreiben, Dialogue: 0,0:10:54.81,0:10:57.43,Default,,0000,0000,0000,,um mir das experimentell zu beweisen, dass das Dialogue: 0,0:10:57.43,0:11:01.75,Default,,0000,0000,0000,,eine bessere Abschätzung der Populations-Varianz ist. Dialogue: 0,0:11:01.75,0:11:03.43,Default,,0000,0000,0000,,Und man berechnet das auf die gleiche Weise, nur dass Dialogue: 0,0:11:03.43,0:11:05.27,Default,,0000,0000,0000,,man durch n minus 1 dividiert. Dialogue: 0,0:11:05.27,0:11:07.45,Default,,0000,0000,0000,,Man kann das auch so erklären... aber nein, Dialogue: 0,0:11:07.45,0:11:08.34,Default,,0000,0000,0000,,ich habe keine Zeit mehr. Dialogue: 0,0:11:08.34,0:11:09.50,Default,,0000,0000,0000,,Wir belassen es erstmal dabei. Dialogue: 0,0:11:09.50,0:11:10.71,Default,,0000,0000,0000,,Und im nächsten Video machen wir ein paar Dialogue: 0,0:11:10.71,0:11:12.59,Default,,0000,0000,0000,,Rechnungen, dass ihr nicht zu sehr von der Theorie Dialogue: 0,0:11:12.59,0:11:13.27,Default,,0000,0000,0000,,erschlagen werdet. Dialogue: 0,0:11:13.27,0:11:14.81,Default,,0000,0000,0000,,Weil wir doch recht abstrakt geworden sind. Dialogue: 0,0:11:14.81,0:11:16.66,Default,,0000,0000,0000,,Bis zum nächsten Video. Dialogue: 0,0:11:16.66,0:11:17.00,Default,,0000,0000,0000,,.