[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,0:00:00.00,0:00:05.08,Default,,0000,0000,0000,,網際網路:\N搜尋是如何進行的呢? Dialogue: 0,0:00:06.08,0:00:11.90,Default,,0000,0000,0000,,嗨,我是約翰(John)。我帶領著Google的搜尋和機器學習團隊。 Dialogue: 0,0:00:11.90,0:00:15.96,Default,,0000,0000,0000,,我認為這是令人驚奇與振奮的一件事: Dialogue: 0,0:00:15.96,0:00:19.71,Default,,0000,0000,0000,,全世界的人們會使用搜索引擎來詢問瑣碎小事與重要問題 Dialogue: 0,0:00:19.71,0:00:24.52,Default,,0000,0000,0000,,所以盡我們所能地提供人們最好的答案,成為了重責大任。 Dialogue: 0,0:00:26.20,0:00:30.94,Default,,0000,0000,0000,,嗨,我是Akshaya,我任職於Bing搜索小組。 Dialogue: 0,0:00:30.94,0:00:34.20,Default,,0000,0000,0000,,有很多時候,我們進行人工智慧 Dialogue: 0,0:00:34.20,0:00:38.28,Default,,0000,0000,0000,,與機器學習的研究,但我們必須深刻了解使用者會如何運用 Dialogue: 0,0:00:38.28,0:00:42.82,Default,,0000,0000,0000,,因為最終,我們希望能對社會產生好的影響。 Dialogue: 0,0:00:43.52,0:00:48.50,Default,,0000,0000,0000,,問一個簡單的問題:旅行到火星要花多久時間呢? Dialogue: 0,0:00:48.50,0:00:54.92,Default,,0000,0000,0000,,這些結果是從哪裡來的?為什麼這個結果排在另一個結果的前面呢? Dialogue: 0,0:00:54.92,0:01:00.18,Default,,0000,0000,0000,,好。我們一起深入了解:搜尋引擎如何將你的問題轉化成這樣的結果。 Dialogue: 0,0:01:00.18,0:01:03.75,Default,,0000,0000,0000,,你需要知道的第一件事:當你進行搜尋時, Dialogue: 0,0:01:03.75,0:01:08.24,Default,,0000,0000,0000,,搜尋引擎不是即時到網際網路上去找尋你要的資訊。 Dialogue: 0,0:01:08.24,0:01:11.04,Default,,0000,0000,0000,,那是因為網際網路上有超過數十億的網站 Dialogue: 0,0:01:11.04,0:01:15.45,Default,,0000,0000,0000,,而且每一分鐘還有數以百計的網站被創造出來。 Dialogue: 0,0:01:15.45,0:01:19.78,Default,,0000,0000,0000,,如果搜尋引擎,必須到每一個網站來找你要的資訊,這件事情就會永遠無法完成。 Dialogue: 0,0:01:19.78,0:01:23.49,Default,,0000,0000,0000,,為了讓你的搜尋更加快速,搜尋引擎一直不斷地掃描網站 Dialogue: 0,0:01:23.49,0:01:28.40,Default,,0000,0000,0000,,提前記錄下來,以後可能對你的搜尋有幫助的資訊。 Dialogue: 0,0:01:28.40,0:01:32.22,Default,,0000,0000,0000,,這樣一來,當你搜尋有關「旅行到火星」時 Dialogue: 0,0:01:32.22,0:01:35.28,Default,,0000,0000,0000,,搜尋引擎已經擁有了即時能夠給你答案所需要的資訊。 Dialogue: 0,0:01:36.34,0:01:37.88,Default,,0000,0000,0000,,它是這樣運作的: Dialogue: 0,0:01:37.88,0:01:42.34,Default,,0000,0000,0000,,網際網路是眾多網頁所連結而成的網。網頁間以超連結彼此相連。 Dialogue: 0,0:01:42.34,0:01:46.50,Default,,0000,0000,0000,,搜尋引擎一直不斷地執行一個名為「蜘蛛」的程式 Dialogue: 0,0:01:46.50,0:01:49.66,Default,,0000,0000,0000,,這個程式在這些網頁中爬行,蒐集這些網頁的資訊。 Dialogue: 0,0:01:49.66,0:01:57.12,Default,,0000,0000,0000,,每次找到一個超連結,它就會順著這個連結,拜訪在網際網路中能夠找到的每一個頁面。 Dialogue: 0,0:01:57.12,0:02:00.60,Default,,0000,0000,0000,,蜘蛛對於每一個它拜訪的頁面,都會記錄所有搜尋所需的資訊。 Dialogue: 0,0:02:00.60,0:02:06.68,Default,,0000,0000,0000,,這些紀錄會加到一個名為「搜尋索引」的特殊資料庫。 Dialogue: 0,0:02:07.30,0:02:10.90,Default,,0000,0000,0000,,現在,讓我們回到先前的搜尋,看看我們能不能弄清楚 Dialogue: 0,0:02:10.90,0:02:13.52,Default,,0000,0000,0000,,搜尋引擎是如何產生出這些結果。 Dialogue: 0,0:02:13.52,0:02:18.92,Default,,0000,0000,0000,,當你問「旅行到火星需要多長時間」時,搜索引擎會用這句話裡的每一個字, Dialogue: 0,0:02:18.92,0:02:23.84,Default,,0000,0000,0000,,到搜尋索引中檢查,來馬上得到網路上所有包含這些字的網頁清單 Dialogue: 0,0:02:23.84,0:02:28.28,Default,,0000,0000,0000,,但是,只是查看這些搜尋字會得到數以百萬的網頁 Dialogue: 0,0:02:28.28,0:02:33.36,Default,,0000,0000,0000,,所以搜尋引擎必須能夠判定對你最適當的 頁面,來優先顯示。 Dialogue: 0,0:02:33.36,0:02:37.88,Default,,0000,0000,0000,,這就是最微妙的地方,因為搜尋引擎可能需要猜測你在找什麼。 Dialogue: 0,0:02:37.88,0:02:44.28,Default,,0000,0000,0000,,每個搜索引擎會使用自己的演算法,根據它認為你所需要的結果,來排序這些網頁。 Dialogue: 0,0:02:44.84,0:02:50.48,Default,,0000,0000,0000,,搜索引擎的排序演算法可能會檢查:你搜尋的字詞是否出現在網頁的標題上 Dialogue: 0,0:02:50.48,0:02:55.79,Default,,0000,0000,0000,,它可能會檢查這些字詞是否彼此相鄰出現 Dialogue: 0,0:02:55.79,0:03:01.80,Default,,0000,0000,0000,,以及其他的計算方式,來幫助它能更準確的判斷哪些是你想看的網頁、哪些不是。 Dialogue: 0,0:03:02.66,0:03:05.44,Default,,0000,0000,0000,,對於搜尋選出最相關的結果,Google發明了最著名的演算法: Dialogue: 0,0:03:05.44,0:03:11.36,Default,,0000,0000,0000,,它是將「有多少網頁連結到特定頁面」納入計算 Dialogue: 0,0:03:11.36,0:03:14.26,Default,,0000,0000,0000,,這裡的想法是:如果有很多網站認為這一個頁面很有意思 Dialogue: 0,0:03:14.26,0:03:17.82,Default,,0000,0000,0000,,那麼它很有可能就是你正在找尋的那個網頁。 Dialogue: 0,0:03:17.82,0:03:23.00,Default,,0000,0000,0000,,這個演算法稱為:「佩奇排名 (Page Rank)」。不是因為它排名網頁,而是因為 Dialogue: 0,0:03:23.00,0:03:27.22,Default,,0000,0000,0000,,它是以發明者,拉里佩奇(Larry Page)來命名的。佩奇是Google的創始人之一。 Dialogue: 0,0:03:27.62,0:03:32.02,Default,,0000,0000,0000,,由於,當你查看網頁時,網站往往能因此獲得收入,垃圾郵件發送者便不斷地 Dialogue: 0,0:03:32.02,0:03:37.92,Default,,0000,0000,0000,,嘗試找到欺騙搜尋演算法的方式,來讓他們的網頁能夠在搜尋結果中,有更高的排名 Dialogue: 0,0:03:37.92,0:03:40.84,Default,,0000,0000,0000,,搜索引擎定期地更新演算法 Dialogue: 0,0:03:40.84,0:03:44.48,Default,,0000,0000,0000,,來防止偽造或不受信任的網站來獲得高排名。 Dialogue: 0,0:03:44.48,0:03:50.12,Default,,0000,0000,0000,,到最後,還是需要由你來留意這些不受信任的網頁 Dialogue: 0,0:03:50.12,0:03:53.34,Default,,0000,0000,0000,,你可以查看網址,並確認它有個可靠的來源。 Dialogue: 0,0:03:53.34,0:04:00.56,Default,,0000,0000,0000,,搜索程式不斷地演進,改善演算法來回傳比競爭對手更好、更快的結果。 Dialogue: 0,0:04:00.88,0:04:06.56,Default,,0000,0000,0000,,現今的搜尋引擎,甚至運用你沒有明確提供的資訊,來幫助你縮小搜尋的範圍。 Dialogue: 0,0:04:06.56,0:04:11.38,Default,,0000,0000,0000,,例如,你搜尋可以遛狗的公園,許多搜索引擎 Dialogue: 0,0:04:11.38,0:04:15.98,Default,,0000,0000,0000,,會出所有在你附近的可以遛狗的公園,即便你沒有輸入你的位置。 Dialogue: 0,0:04:17.26,0:04:24.32,Default,,0000,0000,0000,,現代的搜索引擎,能理解的不僅是網頁上的文字,還有實際上的意義 Dialogue: 0,0:04:24.32,0:04:27.04,Default,,0000,0000,0000,,為你找出最符合你正在找尋的東西。 Dialogue: 0,0:04:27.04,0:04:33.18,Default,,0000,0000,0000,,例如,如果你搜索「速球投手(fast pitcher)」,它會知道你正在尋找的是運動員, Dialogue: 0,0:04:33.18,0:04:37.20,Default,,0000,0000,0000,,如果你搜尋的是「大水壺(large pitcher)」,它會找尋到是與廚房用途的選擇。 Dialogue: 0,0:04:38.88,0:04:43.38,Default,,0000,0000,0000,,為了更好地理解這些字詞,我們運用了機器學習,這是人工智慧的一種。 Dialogue: 0,0:04:43.38,0:04:47.34,Default,,0000,0000,0000,,它能夠讓搜索演算法不只是找尋網頁中的個別字母或字詞 Dialogue: 0,0:04:47.34,0:04:51.80,Default,,0000,0000,0000,,還能了解這些字詞背後的含義。 Dialogue: 0,0:04:53.54,0:04:59.04,Default,,0000,0000,0000,,網際網路不斷成倍地增長,但如果設計搜尋引擎的團隊 Dialogue: 0,0:04:59.04,0:05:04.98,Default,,0000,0000,0000,,能幫助我們做正確的判斷,你所需要的資訊離我們的距離,就只有幾次按鍵之遙。