Return to Video

Intro to Linear Regression

  • 0:00 - 0:04
    ♪ [音乐] ♪
  • 0:12 - 0:15
    理解数据
  • 0:16 - 0:19
    线性回归简介
  • 0:21 - 0:22
    - [Thomas Stratmann] 大家好!
  • 0:22 - 0:24
    在接下来的一系列视频中
  • 0:24 - 0:28
    我们将向你介绍一个
    炫酷的新工具
  • 0:28 - 0:30
    来帮助你理解数据
  • 0:30 - 0:33
    那就是“线性回归”
  • 0:33 - 0:35
    假设你有这么一种理论
  • 0:35 - 0:37
    你发现外貌出众的人
  • 0:37 - 0:40
    好像总能得到特殊的优待
  • 0:40 - 0:41
    你在想
  • 0:41 - 0:44
    “还有什么地方
    也能看到这种现象呢?”
  • 0:44 - 0:46
    对教授来说
    这种现象也存在吗?
  • 0:46 - 0:48
    有没有可能
    外貌出众的老师
  • 0:48 - 0:50
    也会得到特别优待呢?
  • 0:50 - 0:54
    学生们会不会
    对这些老师更好
  • 0:54 - 0:57
    给他们打更高的
    学生评价分?
  • 0:58 - 0:59
    如果确实如此
  • 0:59 - 1:02
    外貌对评价分的影响
  • 1:02 - 1:04
    是很大还是很小呢?
  • 1:04 - 1:08
    假设有位教师刚刚开始
    到一所大学上班
  • 1:08 - 1:09
    - [背景男声] 同学们,早啊
  • 1:09 - 1:12
    - 仅从他的外貌
    我们能对他的学生评价分
  • 1:12 - 1:14
    做出怎样的预测?
  • 1:14 - 1:17
    由于评价分会影响到加薪
  • 1:17 - 1:19
    如果这个理论属实
  • 1:19 - 1:23
    老师们可能会
    采取一些令人惊讶的手段
  • 1:23 - 1:25
    来提高他们的得分
  • 1:25 - 1:26
    - [Lloyd Christmas] 耶!
  • 1:26 - 1:27
    - 如果你想弄清楚
  • 1:27 - 1:31
    更出众的外貌是否真的会
    带来更高的评价分
  • 1:31 - 1:34
    你会怎样
    检验这个假说呢?
  • 1:35 - 1:37
    你可以收集数据
  • 1:37 - 1:40
    首先,让学生从1到10
  • 1:40 - 1:42
    给老师的外貌打分
  • 1:42 - 1:45
    由此你可以得出
    这位老师的颜值平均分
  • 1:45 - 1:48
    然后你可以从
    25名学生那里
  • 1:48 - 1:50
    收集这位老师的
    教学评价分
  • 1:50 - 1:53
    我们通过散点图
  • 1:53 - 1:55
    来观察这两个变量
  • 1:55 - 1:57
    我们用横轴表示外貌
  • 1:58 - 2:01
    纵轴表示教学评价分
  • 2:01 - 2:05
    例如,这一点代表着
    Peate 教授
  • 2:05 - 2:06
    - [Bib Fortuna] 你好哇!
  • 2:06 - 2:09
    - 他得到了3分的外貌分
  • 2:09 - 2:12
    8.425的教学评价分
  • 2:12 - 2:15
    这边特别靠右的是
    Helmchen 教授
  • 2:15 - 2:17
    - [Ben Stiller, "Zoolander"]
    帅到不像话!
  • 2:17 - 2:19
    - 他的外貌得分非常高
  • 2:19 - 2:21
    但教学评价分却很低
  • 2:21 - 2:22
    你能看出规律吗?
  • 2:22 - 2:26
    当我们沿x轴从左向右移动
  • 2:26 - 2:28
    从难看向好看移动
  • 2:28 - 2:31
    评价分呈现出上升趋势
  • 2:32 - 2:36
    对了,我们在这个系列视频中
    使用的数据
  • 2:36 - 2:37
    不是编造出来的
  • 2:37 - 2:41
    而是来自于德克萨斯大学的
    真实调查
  • 2:41 - 2:44
    另外你可能不知道
    “pulchritude”只不过是
  • 2:44 - 2:48
    “颜值”的另一种
    比较高端、学术的说法
  • 2:48 - 2:50
    有些时候
  • 2:50 - 2:56
    用散点图很难判断出
    两个变量之间的确切关系
  • 2:56 - 2:59
    尤其是随着我们
    从左向右移动
  • 2:59 - 3:02
    数值的波动很大的时候
  • 3:02 - 3:05
    对付这种波动的
    一种方法是
  • 3:05 - 3:08
    画一条直线
    穿过这团数据
  • 3:08 - 3:10
    让这条直线
  • 3:10 - 3:13
    尽可能贴切地描述这些数据
  • 3:13 - 3:17
    专业的说法叫做“线性回归”
  • 3:18 - 3:21
    以后我们会讲到
    这条线是怎么画出来的
  • 3:21 - 3:23
    不过今天我们可以先假设
  • 3:23 - 3:27
    这条线已经尽可能
    贴近数据了
  • 3:27 - 3:30
    那么这条线能
    告诉我们什么呢?
  • 3:30 - 3:33
    首先,我们立刻就能看出
  • 3:33 - 3:35
    这条线是向上还是向下倾斜
  • 3:36 - 3:40
    在我们的数据组中
    这条线向上倾斜
  • 3:41 - 3:42
    这也就验证了
  • 3:42 - 3:46
    我们之前通过观察散点图
    得出的假说
  • 3:46 - 3:48
    向上倾斜意味着
  • 3:48 - 3:53
    外貌和评价分存在正相关
  • 3:54 - 3:55
    换句话说
  • 3:55 - 3:56
    平均说来
  • 3:56 - 4:00
    好看的老师
    得到的评价分更高
  • 4:00 - 4:04
    其他数据组
    可能显示出更强的正相关
  • 4:04 - 4:07
    也有可能显示出负相关
  • 4:08 - 4:11
    也有可能根本没有相关性
  • 4:11 - 4:14
    线也未必都是直线
  • 4:14 - 4:18
    必要时可以弯曲
    以便更好贴合数据
  • 4:18 - 4:22
    这条线也给我们提供了
    一种预测结果的方法
  • 4:22 - 4:24
    对一个给定的外貌得分
  • 4:24 - 4:28
    我们可以直接从线上读出
    评价分的预测值
  • 4:28 - 4:30
    再回头看一下新来的老师
  • 4:30 - 4:31
    - [Lloyd] 眼熟吗?
  • 4:31 - 4:34
    - 我们可以准确预测出
    他的评价分
  • 4:35 - 4:37
    你可能想说“等一下!”
  • 4:37 - 4:39
    “我们能相信这个预测吗?”
  • 4:39 - 4:41
    颜值这个变量
  • 4:41 - 4:44
    究竟能多么准确地
    预测评价分呢?
  • 4:45 - 4:47
    线性回归给我们提供了
  • 4:47 - 4:50
    能用来回答这些问题的
    一些实用的方法
  • 4:50 - 4:52
    我们在以后的视频中
    再来探讨
  • 4:53 - 4:55
    在得出任何
    肯定的结论之前
  • 4:55 - 4:58
    我们还得当心几个陷阱
  • 4:59 - 5:00
    想象这样一种情况
  • 5:00 - 5:03
    我们所看到的关联背后
  • 5:03 - 5:07
    其实是被我们忽略掉的
    第三个变量在起作用
  • 5:07 - 5:10
    例如课程的难度
  • 5:10 - 5:11
    可能导致了
  • 5:11 - 5:16
    外貌得分与教学评价分
    之间的正相关
  • 5:16 - 5:19
    教简单的导论课的老师
    总能得到高评价分
  • 5:19 - 5:23
    教级别更高、更难的课的老师
    就容易得到差评
  • 5:24 - 5:28
    而年轻的老师
    可能会被安排去上导论课
  • 5:28 - 5:33
    那么如果学生认为
    年轻的老师更有吸引力
  • 5:33 - 5:35
    外貌得分与教学评价分
  • 5:35 - 5:37
    就会呈现正相关
  • 5:38 - 5:42
    但实际上是课程难度
    这个被我们忽视了的变量
  • 5:42 - 5:44
    在影响着评价分
  • 5:44 - 5:46
    而不是外貌
  • 5:46 - 5:50
    在那种情况下
    一切的美化打扮都是徒劳的
  • 5:50 - 5:54
    相关性被错误地
    当成了因果关系
  • 5:54 - 5:55
    - [Lloyd] 等一下…
  • 5:55 - 5:58
    在后面的视频中
    我们会进一步探讨这个问题
  • 5:59 - 6:02
    另外,会不会有其他重要的变量
  • 6:02 - 6:06
    同时影响着
    外貌得分和评价分呢?
  • 6:07 - 6:10
    为了更清晰地分辨
    外貌对评价分的影响
  • 6:10 - 6:15
    像技术,种族,性别
    英语是不是母语
  • 6:15 - 6:19
    都可能是你需要考虑的因素
  • 6:19 - 6:21
    等我们讲到多元回归时
  • 6:21 - 6:23
    就能把其他
  • 6:23 - 6:27
    可能影响
    这种相关性的因素考虑进去
  • 6:27 - 6:28
    同时度量外貌
  • 6:28 - 6:31
    对教学评价的影响
  • 6:32 - 6:35
    下节课,我们要
    亲自分析一下这些数据
  • 6:35 - 6:39
    从而更好地理解
    这条线的含义
  • 6:41 - 6:42
    - [讲解员] 祝贺你!
  • 6:42 - 6:45
    你离成为数据'忍者"
    又近了一步!
  • 6:46 - 6:47
    不过,要想熟练掌握所学内容
  • 6:47 - 6:49
    你还需要做些习题
  • 6:49 - 6:50
    来磨练技艺
  • 6:51 - 6:54
    准备好迎接下一个挑战了吗?
    请点击“下一个视频”
  • 6:54 - 6:55
    还在观看?
  • 6:56 - 6:58
    请观看边际革命大学的
    其他热门视频
  • 6:58 - 7:02
    不仅理解数据
    而且理解你的世界
  • 7:02 - 7:06
    ♪ [音乐] ♪
Title:
Intro to Linear Regression
Description:

more » « less
Video Language:
English
Team:
Marginal Revolution University
Project:
Understanding Data
Duration:
07:05

Chinese, Simplified subtitles

Revisions Compare revisions