< Return to Video

ANOVA 1 - Calculating SST (Total Sum of Squares)

  • 0:00 - 0:02
    这一节及后面几节
  • 0:01 - 0:15
    本字幕由网易公开课提供,更多课程请到http//open.163.com
  • 0:02 - 0:07
    我们将对如下数据进行一些处理
  • 0:07 - 0:10
    但愿通过这些计算
  • 0:10 - 0:14
    你们能直观理解方差分析的概念
  • 0:14 - 0:20
    这一节 我将计算总平方和
  • 0:17 - 0:25
    网易公开课官方微博 http://t.163.com/163open
  • 0:20 - 0:25
    简记为SST 总平方和
  • 0:25 - 0:28
    你可以将其考虑为计算方差时的分子部分
  • 0:28 - 0:31
    也就是这些数据点离均值的距离的平方之和
  • 0:30 - 0:45
    oCourse字幕组翻译:只做公开课的字幕组 http://ocourse.org
  • 0:31 - 0:35
    也就是这些数据点离均值的距离的平方之和
  • 0:35 - 0:37
    不需要像计算样本方差那样除以自由度
  • 0:37 - 0:41
    不需要像计算样本方差那样除以自由度
  • 0:41 - 0:43
    怎么算呢 首先需要求出这些数值的均值
  • 0:43 - 0:47
    怎么算呢 首先需要求出这些数值的均值
  • 0:47 - 0:51
    我将其称为总平均值
  • 0:51 - 0:53
    它等于每个数据集的均值的均值
  • 0:53 - 0:56
    它等于每个数据集的均值的均值
  • 0:56 - 0:59
    算一下总平均值
  • 0:59 - 1:16
    这里有3+2+1+5+3+4+5+6+7
  • 1:16 - 1:18
    总共9个数据点
  • 1:18 - 1:25
    9个数据点 所有这里除以9 看看等于多少
  • 1:25 - 1:35
    3+2+1=6 然后5+3+4=12
  • 1:35 - 1:44
    5+6+7=18 然后6+12=18 再加18得36
  • 1:44 - 1:46
    除以9 等于4
  • 1:46 - 1:50
    下面证明这等于均值的均值
  • 1:50 - 1:53
    第一组 也就是绿色这组 均值为
  • 1:53 - 1:57
    第一组 也就是绿色这组 均值为
  • 1:57 - 2:00
    3+2+1 也就是6
  • 2:00 - 2:03
    除以数据点数目3 结果是2
  • 2:03 - 2:12
    再求第二组的均值 5+3+4也就是12
  • 2:12 - 2:16
    除以3 等于4
  • 2:16 - 2:22
    再求第三组的均值 5+6+7=18
  • 2:22 - 2:27
    除以3 得6 这些就是每组的均值
  • 2:27 - 2:31
    求总平均值的另一种方式就是 2+4+6
  • 2:31 - 2:35
    得到12 然后除以均值个数3 结果还是4
  • 2:35 - 2:38
    总均值可以看成所有数据点的均值 或每组均值的均值
  • 2:38 - 2:42
    总均值可以看成所有数据点的均值 或每组均值的均值
  • 2:42 - 2:43
    两种都行
  • 2:43 - 2:48
    下面我们来求总平方和
  • 2:48 - 2:54
    它等于 (3-4)2…
  • 2:54 - 2:57
    4也就是总均值
  • 2:57 - 3:05
    +(2-4)2+(1-4)2 第二组我用紫色
  • 3:05 - 3:16
    +(5-4)2+(3-4)2+(4-4)2
  • 3:16 - 3:19
    +(5-4)2+(3-4)2+(4-4)2
  • 3:19 - 3:21
    还剩3个
  • 3:21 - 3:32
    +(5-4)2+(6-4)2+(7-4)2
  • 3:32 - 3:38
    第一项(3-4)2=(-1)2=1
  • 3:38 - 3:42
    第一项(3-4)2=(-1)2=1
  • 3:42 - 3:51
    加(-2)2 也就是4 加(-3)2 也就是9
  • 3:51 - 3:55
    然后紫红色部分 5-4=1 平方还是1
  • 3:55 - 3:59
    (3-4)2=(-1)2=1
  • 3:59 - 4:03
    4-4=0 平方还是0
  • 4:03 - 4:05
    还是写一下 表示计算过
  • 4:05 - 4:07
    还有3个数据点
  • 4:07 - 4:15
    (5-4)2=1 (6-4)2=22=4
  • 4:15 - 4:19
    加上(7-4)2=32=9
  • 4:19 - 4:25
    算一下 1+4+9=5+9=14
  • 4:25 - 4:35
    算一下 1+4+9=5+9=14
  • 4:35 - 4:39
    这里还有一个1+4+9=14
  • 4:39 - 4:42
    这里也是14
  • 4:42 - 4:44
    然后中间是2
  • 4:44 - 4:55
    14+14+2=28+2=30 总平方和是30
  • 4:55 - 5:00
    如果要求方差 可以除以自由度
  • 5:00 - 5:06
    自由度我讲过很多次了
  • 5:06 - 5:10
    假设这里是m组
  • 5:10 - 5:14
    我不会去严格证明 但我会展示给你们
  • 5:14 - 5:19
    统计学中某些奇怪的公式来自何方
  • 5:19 - 5:23
    我不会去严格证明 我会给一些直观理解
  • 5:23 - 5:25
    这里总共是m组
  • 5:25 - 5:32
    每组n个成员
  • 5:32 - 5:37
    那么总成员个数也就是m?n=3×3=9
  • 5:37 - 5:39
    那么总成员个数也就是m?n=3×3=9
  • 5:39 - 5:41
    考虑下自由度
  • 5:41 - 5:47
    自由度是数据点个数减1
  • 5:47 - 5:52
    如果你知道总均值
  • 5:53 - 5:59
    那么就只有9-1 即8条新信息
  • 5:59 - 6:03
    因为最后一条信息可以通过总均值求出
  • 6:03 - 6:07
    知道任意8条信息 总可以利用总均值求出剩下的1条
  • 6:07 - 6:14
    知道任意8条信息 总可以利用总均值求出剩下的1条
  • 6:14 - 6:18
    也就是说 这里只有8个独立的成员
  • 6:18 - 6:22
    一般而言 自由度也就是m?n-1
  • 6:22 - 6:34
    一般而言 自由度也就是m?n-1
  • 6:34 - 6:42
    这里计算方差 也就是用30除以mn-1
  • 6:42 - 6:48
    这里也就是8个自由度 30/8
  • 6:48 - 6:53
    这就是9元素的所有这些数字的方差
  • 6:53 - 6:55
    这一节就到这里
  • 6:55 - 6:58
    下一节 我将讲到 这个总的波动程度
  • 6:58 - 7:06
    下一节 我将讲到 这个总的波动程度
  • 7:06 - 7:10
    有多少来自每个组内的波动程度
  • 7:10 - 7:14
    有多少来自组间的波动程度
  • 7:14 - 7:18
    也许你们已经看出这种方差分析来自哪里了
  • 7:18 - 7:22
    这里的方差来自9个样本值
  • 7:22 - 7:24
    如果这些组有所不同
  • 7:24 - 7:28
    部分波动可能来自不同组
  • 7:28 - 7:31
    部分波动可能来自各组内
  • 7:31 - 7:34
    下一节我将计算这些
  • 7:34 - 7:37
    它们加起来将得到总平方和
Title:
ANOVA 1 - Calculating SST (Total Sum of Squares)
Description:

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
07:39

Chinese (Simplified, China) subtitles

Incomplete

Revisions