>> Here's another way to look at it. Let's say you have a bag of jellybeans.
There's only one licorice, but there are four strawberries and four blueberries.
There's also only one cherry and two lime, or lemon, I don't know, you decide.
If we take a sample of, say, four Jelly Bellies, most likely, we're not going to
get the licorice one. Say we just get these in our sample. This sample doesn't
show the whole range of Jelly Belly flavors that we have, including cherry and
licorice. So our sample underestimates the variability in our Jelly Belly
population. Hopefully, this example lends a little more insight into why we
divide by n minus 1 when calculating the standard deviation of a sample. But
please let's discuss it in the forums. There, we could go into a lot more depth.
For the purposes of this class though, as long as you have a basic intuitive
understanding of the difference between sample standard deviation and population
standard deviation, then you'll be fine.
>> إليكم طريقة أخرى لتوضيح الأمر. فلنفترض أن لديكم كيس من حبوب حلوى الجيلي.
وتوجد واحدة فقط بنكهة العرقسوس، في حين أن هناك أربعة بنكهة الفراولة وأربعة بنكهة التوت البري.
وتوجد أيضًا واحدة بنكهة الكرز، واثنتان بنكهة الليمون أو الحامض، لا أعلم فأنتم أصحاب القرار.
إذا أخذنا مجموعة من حلوى الجيلي بيللي، فلنقل أربعة وعلى الأغلب لن نأخذ
نكهة العرقسوس. فسنأخذ هذه الحبات فقط ضمن المجموعة. هذه المجموعة لا تشمل
جميع نكهات حبوب الجيلي بيللي الموجودة لدينا، بما في ذلك نكهتي الكرز
والعرقسوس. إذن، المجموعة التي أخذناها تقلل من قيمة التنوع الموجود في مجموعتنا من
حبوب الجيلي بيللي. أتمنى أن يضفي هذا المثال رؤية شاملة أكثر حول سبب
قيامنا بالقسمة على n ناقص 1 عند حساب الانحراف المعياري للعينة. لكن
من فضلكم دعونا نناقش ذلك في المنتديات. فهناك يمكننا أن نتعمق أكثر.
ولكن لأغراض هذا الدرس، ما دام لديكم فهم بديهي
أساسي للفرق بين الانحراف المعياري للعينة والانحراف
المعياري للمجموعة، فلن تكون هناك مشكلة.
>> Vejamos outra maneira de considerar isso. Digamos que você tenha um saco de jujubas.
Existe apenas uma de alcaçuz, mas quatro de morango e mais quatro de mirtilo.
Tem também apenas uma de cereja e duas de lima, ou de limão, não sei, você decide.
Se fizéssemos uma amostra de, digamos, quatro jujubas, muito provavelmente não
pegaríamos a de alcaçuz. Suponhamos que pegássemos exatamente essas em nossa amostra. Essa amostra não
demonstraria toda a gama de sabores de jujuba que temos, incluindo cereja e
alcaçuz. Portanto, ela subestima a variabilidade de nossa população de
jujubas. Felizmente, este exemplo nos dá um pouco mais de percepção de por que
dividimos por n menos 1 ao calcular o desvio padrão de uma amostra. Mas
vamos discutir isso nos fóruns. Lá, podemos aprofundar mais esse assunto.
No entanto, para os fins desta aula, contanto que você tenha uma compreensão básica e
intuitiva da diferença entre o desvio padrão da amostra e o desvio
padrão da população, está bom.
接下来是另一种思考方式
假设你有一袋糖果 其中有一粒甘草味、四粒草莓味和四粒蓝莓味
还有一粒樱桃味和两粒酸橙或柠檬味 我不清楚 你自行决定
如果我们从中取样 比如取四粒糖果 那么我们拿到甘草味的可能性很低
假如我们抽取的样本只有这些口味
这个样本无法反映我们拥有的所有口味
包括樱桃味和甘草味 也就是说
抽取的样本低估了我们拥有的糖果总体的情况
希望这个例子能够帮助你了解我们为什么要在计算样本标准差时除以 n-1
请前往论坛 进行更深入的探讨
但是这门课的目的
是让你对样本标准差和总体标准差有基本的直观认识
理解这一点就行了