WEBVTT 00:00:00.494 --> 00:00:07.699 Wir beginnen nun unsere Reise in die Welt der Statistik, die wirklich ein Weg ist 00:00:07.699 --> 00:00:11.411 um Daten zu verstehen oder mit ihnen umzugehen. 00:00:11.411 --> 00:00:14.531 Statistik beschäftigt sich nur mit Daten. 00:00:14.531 --> 00:00:19.044 Und wenn wir unsere Reise in die Welt der Statistik beginnen, 00:00:19.044 --> 00:00:23.615 werden wir eine Menge sogenannte "deskriptive" (beschreibende) Statistik betreiben. 00:00:23.615 --> 00:00:29.728 Wenn wir eine Menge Daten haben und wollen einigen etwas erzählen über alle Daten, ohne ihnen alle Daten zu geben, 00:00:29.728 --> 00:00:34.196 können wir sie irgendwie beschreiben mit einem kleineren Satz an Zahlen? 00:00:34.196 --> 00:00:35.692 darauf wollen wir uns konzentrieren. 00:00:35.692 --> 00:00:39.096 Wir wollen unsere Werkzeuge der deskriptiven Statistik aufbauen 00:00:39.096 --> 00:00:52.059 dann können wir beginnen Folgerungen aus den Daten zu gewinnen, Schlüsse zu ziehen, Beurteilungen zu machen, vieles daraus abzuleiten. 00:00:52.059 --> 00:00:55.130 Deduktive Statistik, um Folgerungen abzuleiten. 00:00:55.130 --> 00:00:56.760 Wie können wir die Daten beschreiben? 00:00:56.760 --> 00:01:03.808 Sagen wir so: Wir haben eine Menge an Zahlen, die wir Daten nennen. 00:01:03.808 --> 00:01:06.379 Wir messen die Höhe unserer Pflanzen in unserem Garten. 00:01:06.379 --> 00:01:08.897 Wir haben 6 Pflanzen und die Höhen sind: 00:01:08.897 --> 00:01:18.159 4 Zoll, 3 Zoll, 1 Zoll, 6 Zoll, eine andere hat 1 Zoll und eine 7 Zoll. 00:01:18.159 --> 00:01:23.097 Und nun: Jemand aus einem anderm Raum, der deine Pfanzen nicht sieht, fragt: 00:01:23.097 --> 00:01:33.829 "wie hoch sind deine Pflanzen?" Und er will nur eine Zahl hören, die alle verschiedenen Höhen deiner Pflanzen repräsentiert. 00:01:33.829 --> 00:01:36.907 Wie willst du das machen? 00:01:36.907 --> 00:01:44.427 Wie kann ich eine typische Zahl finden? Vielleicht die mittlere Zahl? 00:01:44.427 --> 00:01:52.712 Oder die, die am öftesten vorkommt? Oder die Zahl, die die den Durchschnitt darstellt? 00:01:52.712 --> 00:01:57.194 Wenn du dies fragt, hast du schon die gleichen Dinge getan wie die Menschen, 00:01:57.194 --> 00:01:59.113 die die deskriptive Statistik erfunden haben. 00:01:59.113 --> 00:02:01.048 Wie können wir es machen? 00:02:01.048 --> 00:02:15.040 Sie begannen mit der Idee des Durchschnittswertes. Heute hat der Durchschnitt eine spezielle Bedeutung, und alle, die davon reden, meinen das arithmetische Mittel, wie wir gleich sehen werden. 00:02:15.040 --> 00:02:18.481 Aber in der Statistik meint der Durchschnitt etwas Allgemeineres: 00:02:18.481 --> 00:02:38.897 Gib mir eine "typische" Zahl oder gib mir eine "mittlere" Zahl. Oder gib mir eine zentralen Bezugswert. 00:02:38.897 --> 00:02:50.664 Als nochmals: Du hast eine Menge an Zahlen, und musst irgendwie versuchen, diese durch eine einzige Zahl darzustellen, die typisch ist oder die Mitte darstellt. 00:02:50.664 --> 00:02:55.095 Und wie man sieht, gibt es eine Menge Arten von Durchschnittswerten. 00:02:55.095 --> 00:03:03.865 Der erste ist derjenige, mit dem du am meisten vertraut bist, ist das arithmetische Mittel. 00:03:03.865 --> 00:03:13.843 Ich schreibe es in gelb.Arithmetisches Mittel. 00:03:13.843 --> 00:03:22.193 Arithemetisch ist ein Hauptwort, als Eigenschaftswort heißt es arithmetisch. 00:03:22.193 --> 00:03:26.761 Das ist die Summe all der Zahlen, dividiert durch 00:03:26.761 --> 00:03:29.756 - und das ist eine menschengemachte Definition, die wir sinnvoll fanden - 00:03:29.756 --> 00:03:35.581 die Summe all der zahlen geteuilt durch die Anzahl der Zahlen, die wir haben. 00:03:35.581 --> 00:03:39.809 Was ist das arithemtische Mittel dieser Daten-Menge? 00:03:39.809 --> 00:03:56.157 Es ist 4+3+1+6+1+7 geteilt durch die Anzahl der Werte. Wir haben 6 Werte, so teilen wir durch 6 und wir erhalten: 00:03:56.157 --> 00:04:14.776 4+3=7+1=8+6=14+1=15+7=22 00:04:14.776 --> 00:04:29.606 dies alles geteilt durch 6 ergibt 3 vier Sechstel, das ist 3 zwei Dritte, das kann man auch schreiben als 3 Komma Periode 6. 00:04:29.606 --> 00:04:40.768 Wir können das in jeder Form schreiben und es ist eine Art repräsentative Zahl, sie hat einen zentrale Bezug. 00:04:40.768 --> 00:04:44.043 Wie gesagt, es ist eine menschliche Erfindung. 00:04:44.043 --> 00:04:50.345 Es gibt keine religiöse Vorschrift, das arithmetische Mittel so zu definieren. 00:04:50.345 --> 00:05:00.446 Es ist nicht wie bei der Entdeckung des Kreises, der sich aus der beobachtung des Weltlalls ergibt. 00:05:00.446 --> 00:05:04.440 Es ist eine Menschliche Konstruiuktion, die wir für sinnvoll erachteten. 00:05:04.440 --> 00:05:10.765 Nun, es gibt andere Wege, einen Durchschnitt zu messen, um einen "typischen" oder Mittelwert zu finden. 00:05:10.765 --> 00:05:23.812 Der andere, sehr typische Weg ist der Median(wert) und ich schreibe Median in pink. 00:05:23.812 --> 00:05:28.024 Und der Median bedeutet, die mittlere Zahl zu finden. 00:05:28.024 --> 00:05:32.764 Wenn du alle deine Zahlen ordnest und die mittlere findest, ist das der Median. 00:05:32.764 --> 00:05:36.543 Was ist also der Median dieser Datenmenge? 00:05:36.543 --> 00:05:48.641 Wir versuchen es herauszufinden. Wir versuchen sie der Größe nach zu ordnen. 00:05:48.641 --> 00:05:52.691 Wir haben1 , eine andere 1, 3, 4, 6, und eine 7. Was ist die mittlere Zahl? 00:05:52.691 --> 00:06:02.765 Man sieht, dass wir eine gerade Anzahl an zahlen haben, da gibt es keine mittlere Zahl, es gibt zwei mittlere Zahlen. 00:06:02.765 --> 00:06:04.762 die 3 und die 4. 00:06:04.762 --> 00:06:10.856 Und in dem Fall, wo du zwei mittlere Zahlen hast,nimmst du die Mitte zwischen den beiden Zahlen, 00:06:10.856 --> 00:06:14.842 das heißt das arithmetische Mittel dieser beiden Zahlen, um den Median zu finden. 00:06:14.842 --> 00:06:25.096 Der Median ist hier in der Mitte dvon 3 und 4, das heißt 3,5. In diesem Fall ist der Median also 3,5. 00:06:25.096 --> 00:06:31.946 Falls man also eine gerade Anzahl an Zahlen hat, ist der Median das arithmetische Mittel der beiden mittleren Zahlen. 00:06:31.946 --> 00:06:35.761 Wenn man eine ungerade Anzahl an Zahlen hat, ist es etwas einfacher. 00:06:35.761 --> 00:06:38.730 Dazu gebe ich dir eine andere Datenmenge. 00:06:38.730 --> 00:06:41.829 Das ist die Datenmenge und ich habe sie schon geordnet: 00:06:41.829 --> 00:06:57.723 Unsere daten menge ist 0,0,7, 50,10.000, und 1.000.000. 00:06:57.723 --> 00:07:02.945 Eine verrückte Datenmenge. In dieser Situation, was ist der Median? 00:07:02.945 --> 00:07:08.249 Wir haben 5 Zahlen, eine ungerade Anzahl. Es ist einfach, die mittlere Zahl rauszusuchen. 00:07:08.249 --> 00:07:14.476 Die mittlere ist die Zahl, die größer ist als die zwei der Zahlen und kleiner als die andern beiden. 00:07:14.476 --> 00:07:19.481 Das ist exakt die Mitte. In diesem Fall ist unser Median 50. 00:07:19.481 --> 00:07:28.629 Nun, die dritte Messung eines zentralen Bezuges ist die am wenigsten häufig gebrauchte: der Modalwert. 00:07:28.629 --> 00:07:43.712 Er klingt sehr komplex, aber es zeigt sich, dass es die grundsätzlichste Idee ist: Der Modalwert ist die am häufigsten vorkommende Zahl in einer Daten-Menge. 00:07:43.712 --> 00:07:47.879 Und was ist der Modalwert? Wenn alle Werte nur einmal vorkommen, gibt es keinen Modalwert. 00:07:47.879 --> 00:08:05.280 Aber was ist der Modalwert in unserer Daten-Menge? Wir haben nur eine 4, eine 3, aber wir haben 2 Einser, wir haben eine 6 und eine 7. 00:08:05.280 --> 00:08:17.690 Die am häufigsten vorkommende Zahl ist die 1. Also ist der Modalwert 1. 00:08:17.690 --> 00:08:28.307 Man sieht, dass die verschiedenen Arten, eien Durchschnitt zu ermitteln, auf ganz unterschiedliche Weise und wir werden beim Studium der Statistik sehen, 00:08:28.307 --> 00:08:31.012 dass es für verschiedene Dinge gut ist. 00:08:31.012 --> 00:08:33.508 Dies ist sehr häufig genutzt für verschiedene Sachen, 00:08:33.508 --> 00:08:38.146 der Median ist wichtig, wenn man eine Menge verrückter Zahlen hat, um das arithmetische Mittel zu beruhigen. 00:08:38.146 --> 00:08:45.647 Der Modalwert kann auch nützlich sein in solchen Situationen, in denen ein Wert mehrfach vorkommt. 00:08:45.647 --> 00:08:52.700 OK, das wäre es einstweilen. Im nächsten Video werden wir die Statistik tiefer erforschen.