1 00:00:00,494 --> 00:00:07,699 Wir beginnen nun unsere Reise in die Welt der Statistik, die wirklich ein Weg ist 2 00:00:07,699 --> 00:00:11,411 um Daten zu verstehen oder mit ihnen umzugehen. 3 00:00:11,411 --> 00:00:14,531 Statistik beschäftigt sich nur mit Daten. 4 00:00:14,531 --> 00:00:19,044 Und wenn wir unsere Reise in die Welt der Statistik beginnen, 5 00:00:19,044 --> 00:00:23,615 werden wir eine Menge sogenannte "deskriptive" (beschreibende) Statistik betreiben. 6 00:00:23,615 --> 00:00:29,728 Wenn wir eine Menge Daten haben und wollen einigen etwas erzählen über alle Daten, ohne ihnen alle Daten zu geben, 7 00:00:29,728 --> 00:00:34,196 können wir sie irgendwie beschreiben mit einem kleineren Satz an Zahlen? 8 00:00:34,196 --> 00:00:35,692 darauf wollen wir uns konzentrieren. 9 00:00:35,692 --> 00:00:39,096 Wir wollen unsere Werkzeuge der deskriptiven Statistik aufbauen 10 00:00:39,096 --> 00:00:52,059 dann können wir beginnen Folgerungen aus den Daten zu gewinnen, Schlüsse zu ziehen, Beurteilungen zu machen, vieles daraus abzuleiten. 11 00:00:52,059 --> 00:00:55,130 Deduktive Statistik, um Folgerungen abzuleiten. 12 00:00:55,130 --> 00:00:56,760 Wie können wir die Daten beschreiben? 13 00:00:56,760 --> 00:01:03,808 Sagen wir so: Wir haben eine Menge an Zahlen, die wir Daten nennen. 14 00:01:03,808 --> 00:01:06,379 Wir messen die Höhe unserer Pflanzen in unserem Garten. 15 00:01:06,379 --> 00:01:08,897 Wir haben 6 Pflanzen und die Höhen sind: 16 00:01:08,897 --> 00:01:18,159 4 Zoll, 3 Zoll, 1 Zoll, 6 Zoll, eine andere hat 1 Zoll und eine 7 Zoll. 17 00:01:18,159 --> 00:01:23,097 Und nun: Jemand aus einem anderm Raum, der deine Pfanzen nicht sieht, fragt: 18 00:01:23,097 --> 00:01:33,829 "wie hoch sind deine Pflanzen?" Und er will nur eine Zahl hören, die alle verschiedenen Höhen deiner Pflanzen repräsentiert. 19 00:01:33,829 --> 00:01:36,907 Wie willst du das machen? 20 00:01:36,907 --> 00:01:44,427 Wie kann ich eine typische Zahl finden? Vielleicht die mittlere Zahl? 21 00:01:44,427 --> 00:01:52,712 Oder die, die am öftesten vorkommt? Oder die Zahl, die die den Durchschnitt darstellt? 22 00:01:52,712 --> 00:01:57,194 Wenn du dies fragt, hast du schon die gleichen Dinge getan wie die Menschen, 23 00:01:57,194 --> 00:01:59,113 die die deskriptive Statistik erfunden haben. 24 00:01:59,113 --> 00:02:01,048 Wie können wir es machen? 25 00:02:01,048 --> 00:02:15,040 Sie begannen mit der Idee des Durchschnittswertes. Heute hat der Durchschnitt eine spezielle Bedeutung, und alle, die davon reden, meinen das arithmetische Mittel, wie wir gleich sehen werden. 26 00:02:15,040 --> 00:02:18,481 Aber in der Statistik meint der Durchschnitt etwas Allgemeineres: 27 00:02:18,481 --> 00:02:38,897 Gib mir eine "typische" Zahl oder gib mir eine "mittlere" Zahl. Oder gib mir eine zentralen Bezugswert. 28 00:02:38,897 --> 00:02:50,664 Als nochmals: Du hast eine Menge an Zahlen, und musst irgendwie versuchen, diese durch eine einzige Zahl darzustellen, die typisch ist oder die Mitte darstellt. 29 00:02:50,664 --> 00:02:55,095 Und wie man sieht, gibt es eine Menge Arten von Durchschnittswerten. 30 00:02:55,095 --> 00:03:03,865 Der erste ist derjenige, mit dem du am meisten vertraut bist, ist das arithmetische Mittel. 31 00:03:03,865 --> 00:03:13,843 Ich schreibe es in gelb.Arithmetisches Mittel. 32 00:03:13,843 --> 00:03:22,193 Arithemetisch ist ein Hauptwort, als Eigenschaftswort heißt es arithmetisch. 33 00:03:22,193 --> 00:03:26,761 Das ist die Summe all der Zahlen, dividiert durch 34 00:03:26,761 --> 00:03:29,756 - und das ist eine menschengemachte Definition, die wir sinnvoll fanden - 35 00:03:29,756 --> 00:03:35,581 die Summe all der zahlen geteuilt durch die Anzahl der Zahlen, die wir haben. 36 00:03:35,581 --> 00:03:39,809 Was ist das arithemtische Mittel dieser Daten-Menge? 37 00:03:39,809 --> 00:03:56,157 Es ist 4+3+1+6+1+7 geteilt durch die Anzahl der Werte. Wir haben 6 Werte, so teilen wir durch 6 und wir erhalten: 38 00:03:56,157 --> 00:04:14,776 4+3=7+1=8+6=14+1=15+7=22 39 00:04:14,776 --> 00:04:29,606 dies alles geteilt durch 6 ergibt 3 vier Sechstel, das ist 3 zwei Dritte, das kann man auch schreiben als 3 Komma Periode 6. 40 00:04:29,606 --> 00:04:40,768 Wir können das in jeder Form schreiben und es ist eine Art repräsentative Zahl, sie hat einen zentrale Bezug. 41 00:04:40,768 --> 00:04:44,043 Wie gesagt, es ist eine menschliche Erfindung. 42 00:04:44,043 --> 00:04:50,345 Es gibt keine religiöse Vorschrift, das arithmetische Mittel so zu definieren. 43 00:04:50,345 --> 00:05:00,446 Es ist nicht wie bei der Entdeckung des Kreises, der sich aus der beobachtung des Weltlalls ergibt. 44 00:05:00,446 --> 00:05:04,440 Es ist eine Menschliche Konstruiuktion, die wir für sinnvoll erachteten. 45 00:05:04,440 --> 00:05:10,765 Nun, es gibt andere Wege, einen Durchschnitt zu messen, um einen "typischen" oder Mittelwert zu finden. 46 00:05:10,765 --> 00:05:23,812 Der andere, sehr typische Weg ist der Median(wert) und ich schreibe Median in pink. 47 00:05:23,812 --> 00:05:28,024 Und der Median bedeutet, die mittlere Zahl zu finden. 48 00:05:28,024 --> 00:05:32,764 Wenn du alle deine Zahlen ordnest und die mittlere findest, ist das der Median. 49 00:05:32,764 --> 00:05:36,543 Was ist also der Median dieser Datenmenge? 50 00:05:36,543 --> 00:05:48,641 Wir versuchen es herauszufinden. Wir versuchen sie der Größe nach zu ordnen. 51 00:05:48,641 --> 00:05:52,691 Wir haben1 , eine andere 1, 3, 4, 6, und eine 7. Was ist die mittlere Zahl? 52 00:05:52,691 --> 00:06:02,765 Man sieht, dass wir eine gerade Anzahl an zahlen haben, da gibt es keine mittlere Zahl, es gibt zwei mittlere Zahlen. 53 00:06:02,765 --> 00:06:04,762 die 3 und die 4. 54 00:06:04,762 --> 00:06:10,856 Und in dem Fall, wo du zwei mittlere Zahlen hast,nimmst du die Mitte zwischen den beiden Zahlen, 55 00:06:10,856 --> 00:06:14,842 das heißt das arithmetische Mittel dieser beiden Zahlen, um den Median zu finden. 56 00:06:14,842 --> 00:06:25,096 Der Median ist hier in der Mitte dvon 3 und 4, das heißt 3,5. In diesem Fall ist der Median also 3,5. 57 00:06:25,096 --> 00:06:31,946 Falls man also eine gerade Anzahl an Zahlen hat, ist der Median das arithmetische Mittel der beiden mittleren Zahlen. 58 00:06:31,946 --> 00:06:35,761 Wenn man eine ungerade Anzahl an Zahlen hat, ist es etwas einfacher. 59 00:06:35,761 --> 00:06:38,730 Dazu gebe ich dir eine andere Datenmenge. 60 00:06:38,730 --> 00:06:41,829 Das ist die Datenmenge und ich habe sie schon geordnet: 61 00:06:41,829 --> 00:06:57,723 Unsere daten menge ist 0,0,7, 50,10.000, und 1.000.000. 62 00:06:57,723 --> 00:07:02,945 Eine verrückte Datenmenge. In dieser Situation, was ist der Median? 63 00:07:02,945 --> 00:07:08,249 Wir haben 5 Zahlen, eine ungerade Anzahl. Es ist einfach, die mittlere Zahl rauszusuchen. 64 00:07:08,249 --> 00:07:14,476 Die mittlere ist die Zahl, die größer ist als die zwei der Zahlen und kleiner als die andern beiden. 65 00:07:14,476 --> 00:07:19,481 Das ist exakt die Mitte. In diesem Fall ist unser Median 50. 66 00:07:19,481 --> 00:07:28,629 Nun, die dritte Messung eines zentralen Bezuges ist die am wenigsten häufig gebrauchte: der Modalwert. 67 00:07:28,629 --> 00:07:43,712 Er klingt sehr komplex, aber es zeigt sich, dass es die grundsätzlichste Idee ist: Der Modalwert ist die am häufigsten vorkommende Zahl in einer Daten-Menge. 68 00:07:43,712 --> 00:07:47,879 Und was ist der Modalwert? Wenn alle Werte nur einmal vorkommen, gibt es keinen Modalwert. 69 00:07:47,879 --> 00:08:05,280 Aber was ist der Modalwert in unserer Daten-Menge? Wir haben nur eine 4, eine 3, aber wir haben 2 Einser, wir haben eine 6 und eine 7. 70 00:08:05,280 --> 00:08:17,690 Die am häufigsten vorkommende Zahl ist die 1. Also ist der Modalwert 1. 71 00:08:17,690 --> 00:08:28,307 Man sieht, dass die verschiedenen Arten, eien Durchschnitt zu ermitteln, auf ganz unterschiedliche Weise und wir werden beim Studium der Statistik sehen, 72 00:08:28,307 --> 00:08:31,012 dass es für verschiedene Dinge gut ist. 73 00:08:31,012 --> 00:08:33,508 Dies ist sehr häufig genutzt für verschiedene Sachen, 74 00:08:33,508 --> 00:08:38,146 der Median ist wichtig, wenn man eine Menge verrückter Zahlen hat, um das arithmetische Mittel zu beruhigen. 75 00:08:38,146 --> 00:08:45,647 Der Modalwert kann auch nützlich sein in solchen Situationen, in denen ein Wert mehrfach vorkommt. 76 00:08:45,647 --> 00:08:52,700 OK, das wäre es einstweilen. Im nächsten Video werden wir die Statistik tiefer erforschen.