在聖經巴別塔的故事中, 全人類起初有著共同的語言, 但有天他們突然被分散, 彼此變得無法溝通。 我們無法確知是否曾經有共同初始語言, 但追溯現有的上千種語言, 我們知道語言早期 其實數量小得許多。 那我們現在怎麼會有這麼多種語言? 人類遷徙早期 世界總人口要少的多。 有著同樣語言和文化的人們 常會分為更小的部落, 自此各自尋找新的獵物和肥沃的土地。 他們遷移、在新的地方定居, 彼此斷了聯繫, 逐漸有不同發展。 歷經幾百年不同的生活環境、 攝取不同的食物、 與不同的部落交流來往。 導致原本僅是發音、詞彙稍有不同的方言, 最終演變成完全不同的語言, 而差異會隨著人口增長和遷徙持續增大。 現代語言學家如追溯系譜, 試圖拼湊出演化過程, 他們由多種語言著手盡可能往回追溯, 找出最原始共同的語言,或稱為祖語。 相關聯的各種語言歸為同語系, 語系下分許多語言支系和次語系。 但前提是如何確定語言彼此有關聯? 相似發音的詞彙不能當作證據。 可能只是看似相關, 或是直接借用的外來語, 而非來自同源的不同字。 語法和句構是較為可靠的依據, 基本詞彙也是, 如代詞、數字或者親屬稱謂, 從其他語言借來的可能性較低。 有條理地一一比較這些特徵, 尋找發音轉變的特定模式, 以及語言之間的相對應, 語言學家可以確定語言關係、 追溯語言演化中的特定時期、 甚至重建史前時代的語言。 從語言學甚至可以發現 其他重要歷史軌跡, 例如判定地理起源 與該地祖先的生活方式, 可依據哪些字詞是自有的, 哪些是外來語,從中找出端倪。 語言學家重建語系時, 面臨兩大難題。 一是沒有明確的方法判斷 追溯到什麼程度才能歸為同一語言, 也就是說語言和方言的判定很模糊。 中文雖定義為一種語言, 但是各種方言差異大到 不一定能彼此溝通。 而西班牙語和葡萄牙語 大致上能相互通用。 老實說人是在活用語言, 無法死板地劃清語言間的界線。 到不如說是不同語言間有過渡期, 沒有一清二楚的區別跟分類。 實際上語言和方言的判定 是基於變動的政治和國族考量, 而非基於語言本身的特徵。 這也說明為何「世上有多少種語言?」 答案可落在三千至八千不等, 僅取決於由誰主導統計。 另一大問題是我們越往回 追溯語系的根源, 當時語言資料越難掌握。 現在幾大語系的劃分, 是根據已知合理推斷下 將有關聯的各種語言歸為一類。 這也意味著我們假定不同語系 彼此間毫無關聯, 但這假設並非不變的事實。 很多猜測提出 更具包容力的大規模分類, 也就是總語系的概念, 其中有些受到支持, 也有些還在討論中, 特別是針對使用人數較少的語言 歸類例子, 畢竟這些語言尚未研究透徹。 人們可能永遠無法說明 語言是如何創造出來的, 也無法斷定是否真有所謂祖語的存在, 而祖語在人類各自遷徙後有不同演變。 但或許下次有機會仔細聽聽外語, 或許跟我們自己的語言也沒那麼大的差異。