< Return to Video

Intro to Linear Regression

  • 0:00 - 0:04
    ♪ [音乐] ♪
  • 0:21 - 0:22
    - [Thomas Stratmann] 大家好!
  • 0:22 - 0:24
    在接下来的一系列视频中
  • 0:24 - 0:27
    我们将向你介绍一个
    炫酷的新工具
  • 0:27 - 0:30
    来帮助你理解数据
  • 0:30 - 0:32
    那就是“线性回归”
  • 0:33 - 0:35
    假设你有这么一种理论
  • 0:35 - 0:37
    你发现外貌出众的人
  • 0:37 - 0:39
    好像总能得到特殊的优待
  • 0:40 - 0:41
    你在想
  • 0:41 - 0:44
    “还有什么地方
    也能看到这种现象呢?”
  • 0:44 - 0:46
    对教师来说
    这种现象也存在吗?
  • 0:46 - 0:48
    有没有可能
    外貌出众的老师
  • 0:48 - 0:50
    也会得到特别优待呢?
  • 0:50 - 0:54
    学生们会不会
    对这些老师更好
  • 0:54 - 0:57
    给他们打更高的学生评价分?
  • 0:58 - 1:00
    如果确实如此
    外貌对评价分的影响
  • 1:00 - 1:04
    是很大还是很小呢?
  • 1:04 - 1:08
    假设有位教师刚刚开始
    到一所大学上班
  • 1:08 - 1:09
    - [男人] 老兄,早啊
  • 1:09 - 1:12
    - 仅从他的外貌
    我们能对他的学生评价分
  • 1:12 - 1:13
    做出怎样的预测?
  • 1:14 - 1:17
    由于评价分能影响加薪
  • 1:18 - 1:22
    如果这个理论属实
    老师们可能会
  • 1:22 - 1:25
    采取一些令人惊讶的手段
    来提高他们的得分
  • 1:25 - 1:26
    - [Lloyd Christmas] 耶!
  • 1:26 - 1:27
    - 如果你想弄清楚
  • 1:27 - 1:31
    更出众的外貌是否真的会
    带来更高的评价分
  • 1:31 - 1:34
    你会怎样检验这个假说呢?
  • 1:35 - 1:37
    你可以收集数据
  • 1:37 - 1:40
    首先,让学生从1到10
  • 1:40 - 1:42
    给老师的外貌打分
  • 1:42 - 1:45
    由此你可以得出
    这位老师的颜值平均分
  • 1:45 - 1:49
    然后你可以从25名学生处
  • 1:49 - 1:50
    收集这位老师的教学评价分
  • 1:50 - 1:53
    我们通过散点图
  • 1:53 - 1:55
    来同时查看这两个变量
  • 1:55 - 1:57
    我们用横轴表示外貌
  • 1:58 - 2:01
    纵轴表示教学评价分
  • 2:01 - 2:05
    例如,这一点代表着 Peate 教授
  • 2:05 - 2:06
    - [Bib Fortuna] De wana wanga.
  • 2:06 - 2:09
    - 他得到了3分的外貌分
  • 2:09 - 2:12
    8.425的教学评价分
  • 2:12 - 2:15
    这边的是 Helmchen 教授
  • 2:15 - 2:17
    - [Ben Stiller, "Zoolander"]
    帅到不像话!
  • 2:17 - 2:19
    - 他的外貌得分非常高
  • 2:19 - 2:21
    但评价分没那么高
  • 2:21 - 2:22
    你能看出规律吗?
  • 2:22 - 2:26
    当我们沿x轴从左向右移动
  • 2:26 - 2:28
    从难看向好看移动
  • 2:28 - 2:31
    评价分呈现出上升趋势
  • 2:32 - 2:35
    对了,我们在这个系列视频中
    使用的数据
  • 2:35 - 2:39
    不是编造出来的
    而是来自于
  • 2:39 - 2:41
    在德克萨斯大学做过的
    真实研究
  • 2:41 - 2:46
    另外你可能不知道
    “pulchritude”只不过是
  • 2:46 - 2:48
    “颜值”的另一种
    比较高端、学术的说法
  • 2:48 - 2:51
    有些时候
  • 2:51 - 2:56
    用散点图很难判断出
    两个变量之间的确切关系
  • 2:56 - 2:59
    尤其是随着我们
    从左向右移动
  • 2:59 - 3:01
    数值的波动很大的时候
  • 3:02 - 3:05
    处理这种波动的一种方法是
  • 3:05 - 3:08
    画一条直线
    穿过这团数据
  • 3:08 - 3:11
    让这条直线
  • 3:11 - 3:13
    尽可能贴切地概括这些数据
  • 3:13 - 3:17
    专业的说法叫做“线性回归”
  • 3:18 - 3:21
    以后我们会讲到
    这条线是怎么画出来的
  • 3:21 - 3:24
    不过今天我们可以先假设
  • 3:24 - 3:26
    这条线已经尽量地贴合了数据
  • 3:27 - 3:30
    那么这条线能告诉我们什么呢?
  • 3:30 - 3:33
    首先,我们立刻就能看出
  • 3:33 - 3:35
    这条线是向上还是向下倾斜
  • 3:36 - 3:40
    在我们的数据组中
    这条线向上倾斜
  • 3:41 - 3:44
    这也就验证了
  • 3:44 - 3:46
    我们之前通过观察散点图
    得出的假说
  • 3:46 - 3:50
    向上倾斜就意味着
  • 3:50 - 3:53
    外貌和评价分正相关
  • 3:54 - 3:56
    换句话说
  • 3:56 - 3:59
    平均说来
    好看的老师得到的评价分更高
  • 4:00 - 4:04
    其他数据组
    可能显示出更强的正相关
  • 4:04 - 4:07
    也有可能显示出负相关
  • 4:08 - 4:11
    也有可能根本没有相关性
  • 4:11 - 4:14
    线也未必要是直线
  • 4:14 - 4:17
    必要时可以弯曲
    以便更好贴合数据
  • 4:18 - 4:21
    这条线也给我们提供了
    一种预测结果的方法
  • 4:22 - 4:26
    对一个给定的外貌得分
  • 4:26 - 4:28
    我们可以直接从线上读出
    评价分的预测值
  • 4:28 - 4:30
    再回头看一下新来的老师
  • 4:30 - 4:31
    - [Lloyd] 眼熟吗?
  • 4:31 - 4:34
    - 我们可以准确预测出
    他的评价分
  • 4:35 - 4:37
    你可能想说“等一下!”
  • 4:37 - 4:39
    “我们能相信这个预测吗?”
  • 4:39 - 4:42
    我们的外貌变量
  • 4:42 - 4:44
    究竟能多么准确地
    预测评价分呢?
  • 4:45 - 4:48
    线性回归给我们提供了
  • 4:48 - 4:50
    能用来回答这些问题的
    一些实用的方法
  • 4:50 - 4:52
    我们在以后的视频中
    再来探讨
  • 4:53 - 4:55
    在得出任何肯定的结论之前
  • 4:55 - 4:58
    我们还得当心几个陷阱
  • 4:59 - 5:00
    想象这样一种情况
  • 5:00 - 5:04
    我们所看到的关联背后
  • 5:04 - 5:07
    其实是被我们忽略掉的
    第三个变量在起作用
  • 5:07 - 5:10
    例如课程的难度
  • 5:10 - 5:12
    可能导致了
  • 5:12 - 5:16
    外貌得分与教学评价分
    之间的正相关
  • 5:16 - 5:19
    简单的导论课
    总能得到高评价分
  • 5:19 - 5:23
    级别更高、更难的课
    容易得到差评
  • 5:24 - 5:28
    而年轻的老师
    可能会被安排去上导论课
  • 5:28 - 5:32
    那么如果学生认为
    年轻的老师更有吸引力
  • 5:32 - 5:34
    外貌得分与教学评价分
  • 5:34 - 5:37
    就会呈现正相关
  • 5:38 - 5:40
  • 5:40 - 5:44
  • 5:44 - 5:46
  • 5:46 - 5:50
  • 5:50 - 5:54
  • 5:54 - 5:55
  • 5:55 - 5:58
  • 5:59 - 6:02
  • 6:02 - 6:06
  • 6:07 - 6:10
  • 6:10 - 6:15
  • 6:15 - 6:19
  • 6:19 - 6:22
  • 6:22 - 6:24
  • 6:24 - 6:26
  • 6:26 - 6:28
  • 6:28 - 6:31
  • 6:32 - 6:36
  • 6:36 - 6:39
  • 6:41 - 6:42
  • 6:42 - 6:45
  • 6:46 - 6:47
  • 6:47 - 6:49
  • 6:49 - 6:50
  • 6:51 - 6:54
  • 6:54 - 6:55
  • 6:56 - 6:58
  • 6:58 - 7:02
  • 7:02 - 7:04
Title:
Intro to Linear Regression
Description:

more » « less
Video Language:
English
Team:
Marginal Revolution University
Project:
Understanding Data
Duration:
07:05

Chinese, Simplified subtitles

Revisions Compare revisions