1 00:00:00,000 --> 00:00:01,100 مرحبا 2 00:00:01,100 --> 00:00:03,320 هذا فيديو مستحدث 3 00:00:03,320 --> 00:00:05,340 لأسباب عدة 4 00:00:05,340 --> 00:00:09,910 أولا، سأعرض لكم تباين العينات 5 00:00:09,910 --> 00:00:11,750 وهو شيء شيق بحد ذاته 6 00:00:11,750 --> 00:00:14,520 أحاول تسجيل هذا الفيديو بدقة عالية 7 00:00:14,520 --> 00:00:16,370 آمل أن تسطيعوا رؤيته بشكل أكبر وأفضل 8 00:00:16,370 --> 00:00:17,030 عن ذي قبل 9 00:00:17,030 --> 00:00:19,150 ولكن سنرى ما سيحدث 10 00:00:19,150 --> 00:00:22,060 هذه تجربة إلى حد ما ، فتحملوني 11 00:00:22,060 --> 00:00:25,180 ولكن قبل أن نذهب إلى تباين العينات 12 00:00:25,180 --> 00:00:28,090 أعتقد أنه من المفيد إعادة النظر في تباين 13 00:00:28,090 --> 00:00:28,870 السكان 14 00:00:28,870 --> 00:00:32,180 ويمكننا مقارنة هذه الصيغ. 15 00:00:32,180 --> 00:00:34,790 تباين السكان.. وهذا هو الحرف اليوناني 16 00:00:34,790 --> 00:00:36,100 الحرف سيغما 17 00:00:36,100 --> 00:00:37,420 تربيع سيغما أحرف صغيرة. 18 00:00:37,420 --> 00:00:38,500 وهذا يعني الفرق. 19 00:00:38,500 --> 00:00:41,010 وأنا أعلم أنها ال من غريب أن يكون للمتغير 20 00:00:41,010 --> 00:00:41,710 فعلا تربيع 21 00:00:41,710 --> 00:00:42,840 أنت لا تربع المتغير. 22 00:00:42,840 --> 00:00:44,240 هذا هو المتغير. 23 00:00:44,240 --> 00:00:45,780 تربيع سيغما يعني الفرق 24 00:00:45,780 --> 00:00:46,840 في الواقع، دعوني اكتب ذلك 25 00:00:46,840 --> 00:00:48,005 هذا يساوي الفرق 26 00:00:51,550 --> 00:00:55,430 وهذا يساوي--تأخذ كل نقطة بيانات-و 27 00:00:55,430 --> 00:00:58,800 أننا سوف ندعوها X sub I 28 00:00:58,800 --> 00:01:01,700 يمكنك اخذ كل البيانات من نقطة، ومعرفة مدى بعدها عن 29 00:01:01,700 --> 00:01:08,750 السكان، تقوم بتربيعها، وثم تأخذ 30 00:01:08,750 --> 00:01:11,160 المتوسط للكل. 31 00:01:11,160 --> 00:01:12,900 إذن تأخذ المتوسط، وتجمع. 32 00:01:12,900 --> 00:01:14,200 تتنتقل من I يساوي 1. 33 00:01:14,200 --> 00:01:17,700 لذا من النقطة الأولى، وصولاً إلى الألف نقطة. 34 00:01:17,700 --> 00:01:19,940 وبعد ذلك، إلى المتوسط، تقوم بجمعها كلها 35 00:01:19,940 --> 00:01:21,970 ثم القسمة على n. 36 00:01:21,970 --> 00:01:25,970 لذلك الفرق هو متوسط هذه المسافات التربيعية 37 00:01:25,970 --> 00:01:27,390 لكل نقطة من الوسط. 38 00:01:27,390 --> 00:01:29,700 ومجرد أن تعطيك الحدس مرة أخرى، أنه أساسي 39 00:01:29,700 --> 00:01:32,920 لنقل، في المتوسط، كم تبعد كل نقطة عن 40 00:01:32,920 --> 00:01:34,420 الوسط تقريبا 41 00:01:34,420 --> 00:01:36,250 هذه هي أفضل طريقة للتفكير في الفرق. 42 00:01:36,250 --> 00:01:37,640 الآن ماذا إذا كنا نتعامل-كان لهذا 43 00:01:37,640 --> 00:01:39,140 لعدد سكان، صحيح؟ 44 00:01:39,140 --> 00:01:42,050 وقلنا أننا إذا أردنا معرفة الفرق من 45 00:01:42,050 --> 00:01:44,580 أطوال الرجال في البلاد،هذا سيكون شديد الصعوبة 46 00:01:44,580 --> 00:01:46,480 معرفة فرق للسكان. 47 00:01:46,480 --> 00:01:48,910 سيكون عليك الذهاب، وأساساً، قياس 48 00:01:48,910 --> 00:01:49,790 أطوال للجميع. 49 00:01:49,790 --> 00:01:51,360 250 مليون شخص. 50 00:01:51,360 --> 00:01:55,080 أو ما إذا كان لبعض السكان حيث أنه من 51 00:01:55,080 --> 00:01:56,860 المستحيل تماما الحصول على البيانات أو بعض 52 00:01:56,860 --> 00:01:57,640 المتغيرات العشوائية. 53 00:01:57,640 --> 00:01:59,100 وسوف نتعمق في ذلك في وقت لاحق. 54 00:01:59,100 --> 00:02:02,660 لذا الكثير من الأوقات التي تريد فيها فعلا تقدير هذا الفرق 55 00:02:02,660 --> 00:02:04,690 بأخذ الفرق من عينة. 56 00:02:04,690 --> 00:02:07,420 نفس الطريقة التي يمكن أن تحصل ابدأ على متوسط عدد السكان، 57 00:02:07,420 --> 00:02:09,570 ولكن ربما تحتاج إلى تقدير ذلك عن طريق الحصول على 58 00:02:09,570 --> 00:02:11,064 متوسط العينة. 59 00:02:11,064 --> 00:02:13,890 وتعلمنا ذلك في ذلك الفيديو الأول. 60 00:02:13,890 --> 00:02:17,520 إذا كان هذا--إذا كان هذا هو مجمل السكان. 61 00:02:17,520 --> 00:02:20,280 وتلك ملايين نقاط البيانات، أو نقاط البيانات حتى في 62 00:02:20,280 --> 00:02:21,870 المستقبل الذي لن تكون قادر على الحصول عليها لأنها 63 00:02:21,870 --> 00:02:23,290 متغير عشوائي. 64 00:02:23,290 --> 00:02:24,243 لذلك هذا هو عدد السكان. 65 00:02:26,920 --> 00:02:32,390 قد ترغب فقط في تقدير الأمور من خلال النظر في عينة. 66 00:02:32,390 --> 00:02:35,020 وهذا في الواقع ما تدور حوله معظم من الاستنتاجات 67 00:02:35,020 --> 00:02:36,360 الإحصاءاتية 68 00:02:36,360 --> 00:02:38,720 معرفة إحصائيات وصفية حول العينة 69 00:02:38,720 --> 00:02:40,890 والقيام استنتاجات حول السكان. 70 00:02:40,890 --> 00:02:44,610 اسمحوا لي أن أجرب هذا الدواء على 100 شخص، وإذا بدت عليهم 71 00:02:44,610 --> 00:02:46,880 نتائج يعتد بها إحصائيا، هذا الدواء سوف 72 00:02:46,880 --> 00:02:48,850 بنفع ربما على السكان ككل. 73 00:02:48,850 --> 00:02:49,800 هذا كل شيء. 74 00:02:49,800 --> 00:02:51,920 ولذلك فمن المهم حقاً أن نفهم هذه الفكرة من 75 00:02:51,920 --> 00:02:53,580 عينة مقابل عدد سكان. 76 00:02:53,580 --> 00:02:57,510 ونكون قادرين على العثور على إحصاءات تتعلق بعينه، 77 00:02:57,510 --> 00:03:00,160 للجزء الأكبر، يمكنها وصف السكان أو تساعدنا على 78 00:03:00,160 --> 00:03:03,720 تقدير ما يسمونه، بمعلمات السكان. 79 00:03:03,720 --> 00:03:07,330 فما متوسط أ--واسمحوا لي أن إعادة كتابة هذه التعاريف. 80 00:03:07,330 --> 00:03:08,830 ما هو متوسط عدد السكان؟ 81 00:03:08,830 --> 00:03:09,940 سأفعل ذلك الأرجواني. 82 00:03:09,940 --> 00:03:11,630 الأرجواني للسكان. 83 00:03:11,630 --> 00:03:13,680 متوسط عدد السكان. 84 00:03:13,680 --> 00:03:19,700 تأخذ فقط كل نقطة من نقاط البيانات في السكان، س وص. 85 00:03:19,700 --> 00:03:21,850 ثم تجمعها. 86 00:03:21,850 --> 00:03:23,830 تبدأ بقطة البيانات الأولى وتذهب كل 87 00:03:23,830 --> 00:03:25,620 الطريق إلى بيانات nth نقطة. 88 00:03:25,620 --> 00:03:26,740 ثم القسمة على n. 89 00:03:26,740 --> 00:03:27,800 ثم تجمعها وتقسم على n. 90 00:03:27,800 --> 00:03:28,920 وهذا هو المتوسط. 91 00:03:28,920 --> 00:03:30,500 حينها يمكنك ادراجه في هذه الصيغة. 92 00:03:30,500 --> 00:03:33,060 ويمكنك أن ترى كم تبعد كل نقطة من النقطة 93 00:03:33,060 --> 00:03:34,270 المركزية، عن المتوسط. 94 00:03:34,270 --> 00:03:36,260 ثم توجد الفرق 95 00:03:36,260 --> 00:03:39,670 الآن ماذا يحدث لو أننا نعمل ذلك لعينة؟ 96 00:03:39,670 --> 00:03:43,350 حسنا، إذا كنا نريد لتقدير متوسط عدد السكان من خلال 97 00:03:43,350 --> 00:03:46,600 حساب متوسط العينة،على نحو ما فضل شيء يمكن 98 00:03:46,600 --> 00:03:49,170 ان أفكر به --وحقاً هذه هي نوع من الصيغ المهندسة. 99 00:03:49,170 --> 00:03:51,140 هؤلاء بشر يقولون، حسنا ما هي أفضل 100 00:03:51,140 --> 00:03:51,710 طريقة لأخذ عينات؟ 101 00:03:51,710 --> 00:03:54,550 حسنا كل ما نقوم به حقاً هوأخذ متوسط العينة. 102 00:03:54,550 --> 00:03:56,820 وهذا هو متوسط العينة. 103 00:03:56,820 --> 00:03:58,920 وتعلمنا في الفيديو الأول أن هذا التدوين- 104 00:03:58,920 --> 00:04:00,450 الصيغة مطابقة تقريبا لذلك. 105 00:04:00,450 --> 00:04:01,540 مجرد اختلاف في التدوين. 106 00:04:01,540 --> 00:04:04,990 بدلاً من كتابة مو، يمكنك كتابة x بخط فوقها 107 00:04:04,990 --> 00:04:08,620 متوسط العينة يساوي--مرة أخرى، وتأخذ كل من 108 00:04:08,620 --> 00:04:12,100 نقاط البيانات الآن في العينة، وليس مجمل السكان. 109 00:04:12,100 --> 00:04:16,370 تجمعها من أول واحد ومن ثم إلى 110 00:04:16,370 --> 00:04:17,380 التاسع،صحيح؟ 111 00:04:17,380 --> 00:04:20,640 أنهم يقولون أن هناك نقاط البيانات n في هذه العينة. 112 00:04:20,640 --> 00:04:23,390 ومن ثم تقسم على عدد من نقاط البيانات لديك. 113 00:04:23,390 --> 00:04:24,320 عادل بما فيه الكفاية. 114 00:04:24,320 --> 00:04:25,660 أنها حقاً نفس الصيغة. 115 00:04:25,660 --> 00:04:27,500 الطريقة التي أخذت بها متوسط عدد السكان، قلت، حسنا، إذا 116 00:04:27,500 --> 00:04:29,590 كان لدي مجرد عينة، ودعوني فقط آخذ المتوسط بالطريقة نفسها 117 00:04:29,590 --> 00:04:32,560 وعلى الأرجح تقدير جيد 118 00:04:32,560 --> 00:04:33,930 لمتوسط السكان. 119 00:04:33,930 --> 00:04:36,340 الآن يصبح الأمر أكثر إثارة للاهتمام عندما نتحدث عن الفرق. 120 00:04:36,340 --> 00:04:39,250 إذن رد فعلك الطبيعي جيد، لدى هذه العينة. 121 00:04:39,250 --> 00:04:43,260 إذا أردت تقدير فرق السكان، لماذا 122 00:04:43,260 --> 00:04:45,230 لماذا لا أطبق هذه الصيغة نفسها 123 00:04:45,230 --> 00:04:46,150 أساسا للعينة؟ 124 00:04:46,150 --> 00:04:49,330 لذا يمكنني أن أقول-وهذا الواقع عينة فرق. 125 00:04:49,330 --> 00:04:54,570 وهم يستخدمون صيغة s التربيعية. 126 00:04:54,570 --> 00:04:58,220 إذن ، سيغما حرف يوناني يعادل s. 127 00:04:58,220 --> 00:04:59,980 الآن عندما نتعامل مع العينة، 128 00:04:59,980 --> 00:05:01,000 فقط نكتب s هناك. 129 00:05:01,000 --> 00:05:02,320 فهذا هو فارق العينة. 130 00:05:02,320 --> 00:05:03,070 دعوني أكتب هذا 131 00:05:03,070 --> 00:05:03,950 تباين العينة. 132 00:05:11,860 --> 00:05:15,870 وهذا-- يمكن أن نقول فقط، ربما وسيلة جيدة لاخذ 133 00:05:15,870 --> 00:05:17,340 تباين العينة بفعل ذلك بنفس الطريقة. 134 00:05:17,340 --> 00:05:23,670 لنأخذ المسافة من كل نقطة من النقاط في العينة. 135 00:05:23,670 --> 00:05:26,600 ومعرفة مدى بعدها عن متوسط العينة لدينا. 136 00:05:26,600 --> 00:05:29,230 هنا استخدمنا متوسط السكان، ولكن الآن سوف نستخدم فقط 137 00:05:29,230 --> 00:05:31,450 متوسط العينة لأن هذا كل ما يمكن أن يكون لدينا. 138 00:05:31,450 --> 00:05:33,160 نحن لا نعرف ما متوسط السكان 139 00:05:33,160 --> 00:05:35,510 دون النظر في مجمل السكان. 140 00:05:35,510 --> 00:05:36,400 نأخذ تربيع ذلك 141 00:05:36,400 --> 00:05:38,160 هذا يجعلها إيجابية ولها خصائص أخرى، 142 00:05:38,160 --> 00:05:40,160 والذي سوف نناقشه أكثر في وقت لاحق. 143 00:05:40,160 --> 00:05:42,730 ومن ثم أخذ المتوسط لكل من هذه المسافات التربيعية. 144 00:05:42,730 --> 00:05:44,970 حيث تأخذها من هناك--وتجمعها جميعا. 145 00:05:44,970 --> 00:05:47,430 وهناكn منهم إلى بعض ما يصل، صحيح؟ 146 00:05:47,430 --> 00:05:48,400 N أحرف صغيرة. 147 00:05:48,400 --> 00:05:51,820 و القسمة على n أحرف صغيرة. 148 00:05:51,820 --> 00:05:53,230 وأقول لكم، حسنا هذا تقدير جيد. 149 00:05:53,230 --> 00:05:55,580 حسنا بغض النظر عن ما قد يكون الفرق، قد يكون هذا تقدير جيد 150 00:05:55,580 --> 00:05:56,720 لعدد السكان بأسره. 151 00:05:56,720 --> 00:06:00,620 وهذا في الواقع ما يشير إليه بعض الناس عندما 152 00:06:00,620 --> 00:06:01,980 يتحدثون عن تباين العينة. 153 00:06:01,980 --> 00:06:05,260 وفي بعض الأحيان سوف يشار إليه فعلا على هذا النحو. 154 00:06:05,260 --> 00:06:07,520 سوف يضعون n صغيرة هناك. 155 00:06:07,520 --> 00:06:09,840 ويرجع السبب لذلك أننا قسمنا على n. 156 00:06:09,840 --> 00:06:11,840 لنقل، سال ما المشكلة هنا؟ 157 00:06:11,840 --> 00:06:14,000 و المشكلة--وسوف تعطي لك الحدس لأن هذا 158 00:06:14,000 --> 00:06:16,180 هو فعلا أمر يستخدم يحير الذهن. 159 00:06:16,180 --> 00:06:19,340 وأنا بصراحة لا أكافح 160 00:06:19,340 --> 00:06:21,530 الحدس وراء ذلك. 161 00:06:21,530 --> 00:06:24,510 حسنا لدي الحدس، ولكنه يميل أكثر إلى الصرامة 162 00:06:24,510 --> 00:06:26,950 في إثبات ذلك لنفسي أن هذا هو الأمر بالتأكيد. 163 00:06:26,950 --> 00:06:28,280 ولكن فكر في هذا. 164 00:06:28,280 --> 00:06:29,905 إذا كان لدى مجموعة من الأرقام، وسأرسم 165 00:06:29,905 --> 00:06:32,740 خط ارقام هنا. 166 00:06:32,740 --> 00:06:35,740 إذا رسمت خط أرقام هنا - دعونا نقول أنكم تعرفون ذلك- 167 00:06:35,740 --> 00:06:39,430 ولنفترض أن لدى مجموعة من الأرقام من عدد السكان. 168 00:06:39,430 --> 00:06:41,660 لذلك دعونا نقول-سأقوم بشكل عشوائي بوضح مجموعة 169 00:06:41,660 --> 00:06:44,280 أرقام في عدد السكان. 170 00:06:44,280 --> 00:06:45,928 تلك في اليمين آكبر 171 00:06:45,928 --> 00:06:46,355 منها إلى اليسار. 172 00:06:48,900 --> 00:06:52,990 وإذا تم أخذ عينة منها، وربما سآخذ- 173 00:06:52,990 --> 00:06:54,820 العينة، بشكل عشوائي. 174 00:06:54,820 --> 00:06:56,210 في الحقيقة تريد أن تأخذ عينة عشوائية. 175 00:06:56,210 --> 00:06:57,320 ولا تريد أن تكون منحرفا في أي شكل من الأشكال. 176 00:06:57,320 --> 00:07:02,900 ولذلك ربما أخذ هذه، وهذه، وهذه 177 00:07:02,900 --> 00:07:05,420 وهذه، حسنا؟ 178 00:07:05,420 --> 00:07:07,480 وبعد ذلك، اذا اردت اخذ متوسط هذا العدد و هذا 179 00:07:07,480 --> 00:07:08,460 العدد، هذا العدد، هذا العدد. 180 00:07:08,460 --> 00:07:09,320 سيكون في مكان ما في الوسط. 181 00:07:09,320 --> 00:07:11,010 قد يكون في مكان ما هناك. 182 00:07:11,010 --> 00:07:13,240 ومن ثم إذا أردت معرفة تباين العينة باستخدام 183 00:07:13,240 --> 00:07:16,780 هذه الصيغة،سأقول حسنا المسافة تربيع بالإضافة إلى 184 00:07:16,780 --> 00:07:21,060 تربيع المسافة هذا بالإضافة إلى المسافة التربيعية لهذا بالإضافة إلى 185 00:07:21,060 --> 00:07:23,520 تربيع المسافة لهذا ومتوسطها جميعا 186 00:07:23,520 --> 00:07:24,700 وبعد ذلك سوف تحصل على هذا الرقم. 187 00:07:24,700 --> 00:07:27,820 ربما يكون ذلك تقريب جيدة جداً 188 00:07:27,820 --> 00:07:30,260 تلباين جميع السكان. 189 00:07:30,260 --> 00:07:32,070 سيكون متوسط السكان على الأرجح 190 00:07:32,070 --> 00:07:33,030 -- لا أعرف. 191 00:07:33,030 --> 00:07:35,020 قد يكون هذا قريبا جداً. 192 00:07:35,020 --> 00:07:37,150 في الواقع إذا أخذنا كافة نقاط البيانات وأخذنا متوسطها 193 00:07:37,150 --> 00:07:39,060 ربما أنهم مثل هنا . 194 00:07:39,060 --> 00:07:40,660 وبعد ذلك ما إذا كان يمكنك معرفة الفرق، ربما سيكون 195 00:07:40,660 --> 00:07:43,590 قريبا جدا من المتوسط لكل من هذه الخطوط، صحيح؟ 196 00:07:43,590 --> 00:07:46,810 جميع مسافات تباين العينة، أليس كذلك؟ 197 00:07:46,810 --> 00:07:47,250 عادلة بما فيه الكفاية. 198 00:07:47,250 --> 00:07:47,900 لذلك كنت أقول، يا سأل. 199 00:07:47,900 --> 00:07:49,710 هذا تبدو جيدة الآن. 200 00:07:49,710 --> 00:07:51,940 ولكن هناك كمية الصيد صغيرة واحدة. 201 00:07:51,940 --> 00:07:54,560 ماذا لو-هناك دائماً احتمال بدلاً من 202 00:07:54,560 --> 00:07:56,990 انتقاء هذه الأرقام إلى حد ما موزعة بشكل جيد في 203 00:07:56,990 --> 00:08:00,800 العينة، ماذا سيحدث لو كنت اخترت هذا العدد، هذا العدد، 204 00:08:00,800 --> 00:08:03,920 وهذا العدد -ولنقل هذا العدد 205 00:08:03,920 --> 00:08:05,400 كعينة؟ 206 00:08:05,400 --> 00:08:08,370 حسنا بغض النظر عن عينتك، متوسط العينة الخاصة بك 207 00:08:08,370 --> 00:08:10,210 دائماً ما يكون في منتصف ذلك أليس كذلك؟ 208 00:08:10,210 --> 00:08:12,960 إذن في هذه الحالة، متوسط العينة الخاص بك قد يكون هنا. 209 00:08:12,960 --> 00:08:15,010 إذن كل هذه الأرقام، قد تقولون حسنا هذا العدد ليس 210 00:08:15,010 --> 00:08:17,810 بعيدا جداً عن هذا العدد، هذا العدد الذي ليس بعيداً جداً، ومن ثم 211 00:08:17,810 --> 00:08:19,100 هذا العدد الذي ليس بعيداً جداً. 212 00:08:19,100 --> 00:08:21,790 لذا تباين العينة الخاص بك، عندما تقوم به بهذه الطريقة، 213 00:08:21,790 --> 00:08:23,610 قد يبدو منخفظا قليل 214 00:08:23,610 --> 00:08:26,920 لأن كل هذه الأرقام، إلى حد ما//-أنها، 215 00:08:26,920 --> 00:08:28,920 تقريبا بحكم التعريف، سوف تكون قريبة جدا من 216 00:08:28,920 --> 00:08:30,350 متوسط بعضها البعض. 217 00:08:30,350 --> 00:08:34,600 ولكن في هذه الحالة، عينتك منحرفة قليلا 218 00:08:34,600 --> 00:08:37,980 والمتوسط الفعلي للسكان هنا في مكان ما . 219 00:08:37,980 --> 00:08:40,800 لذا الفرق الفعلي للعينة، إذا كنت حقا تعرف 220 00:08:40,800 --> 00:08:43,670 النتوسط-أنا أعرف أن كل هذا مربك قليلا. 221 00:08:43,670 --> 00:08:44,980 لو كنت فعلا تعرف المتوسط ، لكنت 222 00:08:44,980 --> 00:08:46,830 قلت واو . 223 00:08:46,830 --> 00:08:48,386 و كنت سوف تجد هذه المسافات، التي كان من الممكن 224 00:08:48,386 --> 00:08:51,320 ان تكون أكثربكثير. 225 00:08:51,320 --> 00:08:53,640 بيت القصيد في ما أقوله، عندما تأخذ 226 00:08:53,640 --> 00:08:58,280 عينة، هناك بعض الفرص في أن يكون متوسط العينة الخاصة بك 227 00:08:58,280 --> 00:09:00,380 قريبا جدا من متوسط السكان، حسنا؟ 228 00:09:00,380 --> 00:09:02,610 ربما متوسط عينتك هنا ومتوسط 229 00:09:02,610 --> 00:09:03,360 عدد السكان هنا 230 00:09:03,360 --> 00:09:05,770 وثم هذه الصيغة سوف تعمل على الأرجح بشكل جيد جداً، 231 00:09:05,770 --> 00:09:07,770 على الأقل نظراً لنقاط بيانات العينة الخاصة بك 232 00:09:07,770 --> 00:09:09,280 و إيجاد الفرق. 233 00:09:09,280 --> 00:09:14,240 ولكن هناك فرصة معقولة في أن يكون متوسط عينتك - 234 00:09:14,240 --> 00:09:16,730 عينتك دائماً ما ستكون ضمن نموذج البيانات الخاصة بك، صحيح؟ 235 00:09:16,730 --> 00:09:18,740 دائماً ما ستكون مركز نموذج بياناتك. 236 00:09:18,740 --> 00:09:21,470 ولكن من الممكن تماما أن يكون الوسط السكاني 237 00:09:21,470 --> 00:09:22,590 خارج نموذج البيانات الخاصة بك. 238 00:09:22,590 --> 00:09:24,750 قديحدث ذلك لانتقاءك تلك 239 00:09:24,750 --> 00:09:28,110 التي لا تحتوي على متوسط سكان فعلي. 240 00:09:28,110 --> 00:09:31,670 ومن ثم فلتباين العينة المحسوب بهذه الطريقة سوف 241 00:09:31,670 --> 00:09:34,990 يقلل حقا من فرق السكان 242 00:09:34,990 --> 00:09:36,240 الفعلي، أليس كذلك؟ 243 00:09:36,240 --> 00:09:38,230 لأنها ستكون دائماً أقرب إلى متوسطها الخاص 244 00:09:38,230 --> 00:09:39,960 منه إلى متوسط السكان. 245 00:09:39,960 --> 00:09:43,460 وإذا كنت تفهم، بصراحة، حتى 10 % 246 00:09:43,460 --> 00:09:45,770 من هذا، فأنت طالب إحصائيات متقدم جداً. 247 00:09:45,770 --> 00:09:49,120 ولكن أنا أقول كل هذا لمجرد إعطاءك، على ما آمل 248 00:09:49,120 --> 00:09:53,500 بعض الحدس لإدراك أن هذا سوف يقلل غالبا. 249 00:09:53,500 --> 00:09:57,240 هذه الصيغة كثيرا ما سوف تقلل 250 00:09:57,240 --> 00:09:59,110 تباين السكان الفعلي 251 00:09:59,110 --> 00:10:01,420 وهناك صيغة، وأثبت فعلا أنها أكثر 252 00:10:01,420 --> 00:10:04,740 صرامة مما سوف أقوم به،و الذي يعتبر 253 00:10:04,740 --> 00:10:08,000 أفضل، أو أنهم سوف يطلقون عليه تقدير غير منحاز 254 00:10:08,000 --> 00:10:09,030 لتباين السكان. 255 00:10:09,030 --> 00:10:11,390 أو تباين عينة غير متحيز 256 00:10:11,390 --> 00:10:14,160 وفي بعض الأحيان يشار إليه بواسطة s تربيع مرة أخرى. 257 00:10:14,160 --> 00:10:18,930 وفي بعض الأحيان بواسطة هذا s n ناقص 1 تربيع. 258 00:10:18,930 --> 00:10:20,720 وسوف أشرح لك لماذا. 259 00:10:20,720 --> 00:10:22,340 هو تقريبا الشئ نفسه 260 00:10:22,340 --> 00:10:24,730 تأخذ كل نقطة من نقاط البيانات، وتوجد بعدها عن 261 00:10:24,730 --> 00:10:28,170 متوسط العينة. 262 00:10:28,170 --> 00:10:28,900 وتربعها 263 00:10:28,900 --> 00:10:31,830 ثم تأخذ متوسط تلك التربيعات، باستثناء 264 00:10:31,830 --> 00:10:33,430 الاختلاف الطفيف . 265 00:10:33,430 --> 00:10:35,720 1 يساوي 1 على قدم المساواة n. 266 00:10:35,720 --> 00:10:39,370 بدلاً من القسمة على n، تقسم على 267 00:10:39,370 --> 00:10:41,920 عدد أصغر بقليل 268 00:10:41,920 --> 00:10:44,350 يمكنك القسمة على n ناقص 1. 269 00:10:44,350 --> 00:10:46,880 لذا عندما تقوم بتقسيم ن ناقص 1 بدلاً من قسمة 270 00:10:46,880 --> 00:10:49,590 n، ستحصل على عدد أكبر قليلاً هنا. 271 00:10:49,590 --> 00:10:51,060 واتضح أن هذا في الواقع 272 00:10:51,060 --> 00:10:52,260 تقدير أفضل كثيرا. 273 00:10:52,260 --> 00:10:54,810 وسأقوم بإعداد برنامج كمبيوتر يوما ما لأثبت على الأقل 274 00:10:54,810 --> 00:10:57,430 ذلك لنفسي عن طريق التجرية بأن هذا هو 275 00:10:57,430 --> 00:11:01,750 أفضل تقدير لللتباين السكاني. 276 00:11:01,750 --> 00:11:03,430 ويمكنك أن تقوم بحساب ذلك بنفس الطريقة. 277 00:11:03,430 --> 00:11:05,270 فقط اقسم على n ناقص 1. 278 00:11:05,270 --> 00:11:07,450 طريقة أخرى للتفكير في ذلك--وفي الواقع، لا 279 00:11:07,450 --> 00:11:08,340 الوقت ينفذ 280 00:11:08,340 --> 00:11:09,500 سأترككم هنا 281 00:11:09,500 --> 00:11:10,710 وثم في مقطع الفيديو التالي، سوف نقوم باثنين من 282 00:11:10,710 --> 00:11:12,590 العمليات الحسابية فقط لكي لا أغمركم 283 00:11:12,590 --> 00:11:13,270 بهذه الأفكار. 284 00:11:13,270 --> 00:11:14,810 لأننا نتجه قليلا للتجريد 285 00:11:14,810 --> 00:11:16,660 نراكم في مقطع الفيديو التالي. 286 00:11:16,660 --> 00:11:17,000 وداعا