Return to Video

大腦如何處理語音呢?

  • 0:07 - 0:14
    一般 20 歲的人知道
    27,000 至 52,000 個不同的字。
  • 0:14 - 0:20
    60 歲前,該數目一般在
    35,000 至 56,000 之間。
  • 0:20 - 0:24
    如果將它們唸出來,
    大部份的字不用花到一秒鐘。
  • 0:24 - 0:29
    聽到每個字時,
    大腦都必須快速做決定:
  • 0:29 - 0:32
    上千個選項中的哪一個
    吻合你聽到的聲音?
  • 0:32 - 0:36
    大約 98% 的時間,
    大腦會選出正確的字。
  • 0:36 - 0:37
    但大腦如何做到呢?
  • 0:37 - 0:41
    語音理解不同於閱讀理解,
  • 0:41 - 0:44
    但類似於手語理解──
  • 0:44 - 0:48
    雖然人們對口語辨識的
    研究比手語多。
  • 0:49 - 0:51
    我們能夠理解語音的關鍵
  • 0:51 - 0:55
    在於大腦能夠並行處理,
  • 0:55 - 0:59
    意思是它可以同時做多種不同的事。
  • 0:59 - 1:01
    大多數理論假設
    我們所知道的每個字
  • 1:01 - 1:06
    分別由只負責一項工作的
    處理單元來代表:
  • 1:06 - 1:11
    該工作是評估傳入語音
    與該特定單字匹配的可能性。
  • 1:11 - 1:15
    對大腦來說,代表單字的處理單元
  • 1:15 - 1:21
    很可能是大腦皮層中
    一組神經元的激發活動。
  • 1:22 - 1:24
    當聽到一個字的開頭音節時,
  • 1:24 - 1:27
    可能會有幾千個處理單位活躍起來,
  • 1:27 - 1:29
    因為當只有字的開頭音節,
  • 1:29 - 1:32
    會有很多可能的匹配。
  • 1:32 - 1:34
    繼續講字的其他音節時,
  • 1:34 - 1:39
    更多的單元會發現
    缺乏某個重要的訊息,
  • 1:39 - 1:41
    隨之失去了活性。
  • 1:41 - 1:43
    可能在字的結尾前,
  • 1:43 - 1:48
    只有一個激活模式保持活躍,
    並對應於一個字,
  • 1:48 - 1:51
    這就是所謂的「識別點」。
  • 1:51 - 1:54
    在琢磨一個字的過程中,
  • 1:54 - 1:57
    活躍的單位會抑制其他單位的活動,
  • 1:57 - 1:59
    從而省下重要的毫秒。
  • 1:59 - 2:03
    大多數人每秒最多可理解 8 個音節。
  • 2:04 - 2:07
    可是目標不只是辨識那個字,
  • 2:07 - 2:10
    還要找出內在含義。
  • 2:10 - 2:14
    在字還未完全辨識出之前,
  • 2:14 - 2:17
    大腦會同時找出許多可能的字義。
  • 2:17 - 2:22
    我們從研究中瞭解到,
    即使一聽到字的片段──
  • 2:22 - 2:23
    譬如 「首」──
  • 2:23 - 2:27
    聽者也會開始找多個可能的字義,
  • 2:27 - 2:32
    比如「首領」或「首都」,
    在整個字唸完前就會這麼做。
  • 2:32 - 2:35
    這間接說明我們每聽到一個字時,
  • 2:35 - 2:38
    腦中會很快地迸出許多字義,
  • 2:38 - 2:43
    到達辨識點時,
    大腦已選中一個字義。
  • 2:43 - 2:46
    如果提供有上下文的句子,
  • 2:46 - 2:51
    而不是隨機的一串單字時,
    識別過程的速度會加快。
  • 2:51 - 2:57
    上下文也會導引我們瞭解
    具有多種解釋的字的正確意義。
  • 2:57 - 2:59
    例如「蝙蝠(球棒)」
    或「吊車(鶴)」,
  • 2:59 - 3:03
    或在同音字的情況下,
    例如 “no” 或是 “know”。
  • 3:03 - 3:07
    對多種語言的人而言,
    他們正在聽的語言是另一種提示,
  • 3:07 - 3:12
    能夠去除不符合這語言的可能單字。
  • 3:13 - 3:17
    那麼,如果要在此系統中
    加入全新的字呢?
  • 3:17 - 3:21
    即使是成年人,也可能每隔幾天
    就會遇到一個新的字。
  • 3:21 - 3:25
    但是,如果每個字都視為
    一種精細活動模式,
  • 3:25 - 3:27
    且分佈在許多神經元上,
  • 3:27 - 3:32
    我們如何避免新的字覆蓋舊的字呢?
  • 3:32 - 3:34
    我們認為,為避免這個問題,
  • 3:34 - 3:39
    新的字會先存在大腦海馬區中,
  • 3:39 - 3:43
    離大腦皮層中的
    主要單字存儲區很遠,
  • 3:43 - 3:46
    所以它們不與其他單字共用神經元。
  • 3:46 - 3:49
    經由多個夜晚的睡眠,
  • 3:49 - 3:54
    新字逐漸轉移過來,
    與舊字交織在一起。
  • 3:54 - 3:58
    研究人員認為,
    這種緩慢的新字獲得過程
  • 3:58 - 4:01
    有助於避免破壞現有單字。
  • 4:01 - 4:03
    所以在白天聊天時,
  • 4:03 - 4:07
    無意識的神經元活動
    會迸出許多字義來;
  • 4:07 - 4:09
    到了晚上,我們休息,
  • 4:09 - 4:14
    可是大腦忙著將新知識
    整合到單字網絡中。
  • 4:14 - 4:18
    這個過程確保我們醒來時,
  • 4:18 - 4:22
    已經為不斷變化的
    語言世界做好準備。
Title:
大腦如何處理語音呢?
Speaker:
加雷斯·加斯凱爾
Description:

一般 20 歲的人知道 27,000 至 52,000 個不同的字。將它們唸出來,大部份的字都不用花到一秒鐘。聽到每個字時,大腦都須快速做個決定:上千個選項中的哪一個吻合你所聽到的聲音?大約 98% 的時間,大腦會選出正確的字。大腦是如何做到的呢?加雷斯·加斯凱爾深入探索語言理解的複雜性。

課程編寫:加雷斯·加斯凱爾
影片導演:Shot 藝術工室

完整課程:https://ed.ted.com/lessons/how-do-our-brains-process-speech-gareth-gaskell

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:21

Chinese, Traditional subtitles

Revisions