Thông qua lịch sử, ta hiểu được cách ăn mặc của người Hy Lạp cổ, đời sống sinh hoạt của họ, cách họ đấu tranh... nhưng còn cách nghĩ của họ thì sao? Trong suy nghĩ thuần túy của chúng ta, những ý niệm sâu sắc nhất của con người khả năng tưởng tượng, nhận thức, ước mơ, từ xưa tới nay đều giống nhau. Một khả năng khác nữa là có lẽ những biến đổi xã hội định hình nền văn hóa đã thay đổi bản chất tư duy của con người. Có thể ý kiến của chúng ta mỗi người mỗi khác. Thật ra nó là vấn đề tranh cãi thuộc về triết học đã có từ lâu. Nhưng liệu khoa học có trả lời được câu hỏi này không? Ở đây, tôi muốn nói nếu chúng ta có thể tái hiện kiến trúc của một thành phố Hy Lạp cổ đại chỉ bằng vài viên gạch, thì những ghi chép về văn hóa cũng có bản chất như tài liệu khảo cổ, như hóa thạch về tư duy con người. Và thật ra, khi tiến hành phân tích tâm lý và ngôn ngữ trong vài cuốn sách cổ xưa nhất, vào thập niên 70, Julian Jaynes đã đề xuất một giả thuyết rất táo bạo và cấp tiến: khi nhìn những người sống cách đây chỉ 3000 năm, chúng ta thời nay sẽ gọi họ là bệnh nhân tâm thần phân liệt. Tuyên bố này được ông dựa trên sự thật: thế hệ người đầu tiên được tả lại trong những cuốn sách này đều cư xử một cách nhất quán, dù điều kiện văn hóa và địa lý khác nhau, cứ như họ đang lắng nghe và làm theo lời nói của ai đó mà họ tin là Chúa, hay các vị thần... mà ngày nay chúng ta gọi là ảo giác. Và phải bẵng đi một thời gian, họ mới hiểu ra chính bản thân họ là người tạo ra, cũng như sở hữu những giọng nói phát ra từ bên trong này. Và nhờ phát hiện này, họ có được sự chiêm nghiệm: là khả năng nghĩ về chính ý nghĩ của mình. Giả thuyết của Jaynes chính là, trạng thái có ý thức, theo cách hiểu đơn giản nhất của ta ngày nay, tại thời điểm chúng ta thấy mình làm chủ sự tồn tại của mình, là một tiến trình văn hóa còn khá mới. Học thuyết này khá tuyệt vời, nhưng lại có một vấn đề lớn nó được xây dựng chỉ trên vài thí nghiệm nhất định. Vậy câu hỏi đặt ra là: giả thuyết cho rằng sự suy nghiệm hình thành mới được 3000 trong lịch sử nhân loại này có thể được kiểm chứng một cách đa dạng và khách quan hay không. Và để giải quyết được câu hỏi này là cả một vấn đề. Không chỉ đơn giản theo kiểu vào một ngày đẹp trời Plato đã viết, "Chào, tôi là Plato đây, từ nay trở đi, tôi hoàn toàn sở hữu được ý thức nội quan." (Cười) Và chính điều này cho ta thấy bản chất của vấn đề là gì. Chúng ta cần thấy được bề nổi của một khái niệm chưa từng nói tới. Bản thân từ "chiêm nghiệm" không xuất hiện một lần nào trong những quyển sách chúng tôi muốn phân tích. Nên cách giải quyết chúng tôi nghĩ ra chính là tạo ra không gian từ. Đây là một không gian rất lớn chứa đựng mọi từ ngữ mà khoảng cách giữa hai từ khác nhau bất kỳ trong đó cũng thể hiện được mức độ giống nhau giữa chúng. Lấy ví dụ thế này, bạn sẽ thấy khoảng cách giữa "chó" và "mèo" là rất gần, nhưng cặp từ "bưởi" và "logarit" lại vô cùng xa nhau. Và điều này chắc chắn đúng với mọi cặp từ trong không gian đó. Và chúng ta có nhiều cách xây dựng không gian từ khác nhau. Cách trên cần tìm người có chuyên môn, cũng hơi giống với dò từ điển. Còn cách khác nữa, là tin vào một quan niệm đơn giản, nếu hai từ có liên quan nhau, chúng sẽ thường xuất hiện trong cùng một câu, cùng một đoạn văn, cùng một loại tài liệu, và chúng thường đứng chung một cách có chủ ý thay vì tình cờ. Và giả thuyết cơ bản này, phương pháp đơn giản này, khi sử dụng vài thủ thuật điện toán để "trị" một sự thật hóc búa: không gian của từ ngữ vô cùng phức tạp và đa chiều, cho kết quả khá hiệu quả. Và để cho bạn thấy sự hiệu quả của phương pháp này, đây là kết quả khi chúng tôi áp dụng nó để phân tích vài từ quen thuộc. Điều đầu tiên ta thấy chính là các từ tự động sắp xếp trên quan hệ ngữ nghĩa. Ở đây có họ từ trái cây, cơ quan trong cơ thể, bộ phận của máy vi tính, thuật ngữ khoa học, v.v... Thuật toán cũng nhận ra chúng tôi xếp từ theo thứ tự khái niệm. Ví dụ, nhóm từ thuật ngữ khoa học chia làm hai loại nhỏ là thuật ngữ thiên văn và thuật ngữ vật lý. Và có những thứ phân loại rất kĩ lưỡng. Ví dụ, từ "thiên văn học", hơi kì lạ khi nó nằm ở đó, nhưng đó mới là vị trí chính xác của nó: vừa thuộc nhóm từ khoa học, chỉ bản chất của nó, và bản thân nó lại vừa chứa đựng những thuật ngữ thiên văn khác. Và chúng ta có thể phân tích sâu hơn nữa. Thật ra, nếu nhìn vào đống từ này một lúc lâu, và vẽ ra đường đi ngẫu nhiên cho chúng, bạn sẽ cảm thấy như mình đang làm thơ vậy. Và cảm giác này một phần là do đi vào không gian từ này cũng như đi vào trường tư duy. Và điều cuối cùng thuật toán này cũng giúp trực giác của chúng ta biết được những từ và nhóm từ nào nên được chiêm nghiệm trước tiên. Ví dụ, những từ như "bản ngã", "tội lỗi", "lí do", "cảm xúc", quan hệ rất gần với "suy niệm", trong khi những từ khác chẳng hạn "đỏ", "bóng đá", "nến", "chuối", chúng cách xa nhau vô cùng. Một khi chúng ta đã dựng được không gian thì câu hỏi về lịch sử của quá trình suy niệm, hay lịch sử của bất cứ khái niệm nào những vấn đề trước đây có phần trừu tượng, mơ hồ giờ đây sẽ trở nên sáng tỏ, và khoa học định lượng sẽ có cơ hội đóng góp hơn. Chúng tôi chỉ việc lấy những gì được ghi lại trong sách, phân tích chúng bằng thuật toán, đem toàn bộ những từ này xếp theo quỹ đạo và chiếu chúng vào không gian, sau đó chúng tôi tự hỏi liệu có phải mất rất lâu để quỹ đạo này trở nên giống với khái niệm "suy niệm" của chúng ta hay không. Và nếu trả lời được, ta sẽ phân tích được lịch sử của suy niệm theo lối sống của Hy Lạp cổ đại, vì hiện giờ đó là tài liệu đáng tin nhất mà chúng tôi có. Vậy là chúng tôi lấy hết sách ra, xếp theo thứ tự thời gian và lấy những từ được dùng trong mỗi quyển chiếu vào không gian, rồi chúng tôi hỏi: mỗi từ trong đó ở gần dòng suy niệm tới đâu, và tính trung bình ra. Rồi chúng tôi tự hỏi có phải, càng về sau này thì những cuốn sách này có quan hệ càng gần với sự suy niệm hay không. Và đây đúng thật là cách sống của người Hy Lạp cổ. Nên bạn thấy đó, những quyển sách cổ nhất viết theo phong cách Homer rất ít tương đồng với những quyển mà chúng ta hiểu được. Nhưng chỉ bốn trăm năm TCN, sự tương đồng tăng lên rất nhanh và có khi lên tới năm lần đối với những quyển có niên đại gần với thời điểm mà khái niệm "suy niệm" ra đời. Và một trong những chuyện hay nhất chính là giờ đây, ta có thể hỏi liệu những điều này có còn đúng với những nền văn hóa khác. Và chúng tôi kiểm tra tương tự với văn hóa Judeo-Christian, và được kết quả gần giống vậy. Một lần nữa, cuốn Cựu Ước có rất ít sự tương đồng và sau đó sự tương đồng lại tăng nhanh trong cuốn Tân Ước. Và gần nhất trong sự suy niệm của chúng ta là cuốn "Sách Tự Thú của Thánh Augustine", khoảng 400 năm sau khi Chúa ra đời. Và điều này rất quan trọng vì thánh Augustine được công nhận bởi các học giả, nhà ngữ văn học, các sử gia, là một trong những người đặt nền móng cho "suy niệm". Thật ra, có người còn cho rằng ông là cha đẻ của tâm lý học hiện đại. Cho nên, thuật toán của chúng tôi, có đặc tính đa dạng, khách quan, và tất nhiên, cực kỳ nhạy: chỉ mất chưa tới một giây để đưa ra những kết luận quan trọng nhất cho tiến trình nghiên cứu lâu đời này. Và một phần nào đó, vẻ đẹp của khoa học giờ đây có thể được diễn giải và khái quát thông qua nhiều lĩnh vực khác nhau. Và tương tự, chúng tôi tự hỏi con người biết ý thức từ bao giờ, có lẽ đó là câu hỏi khó nhất chúng ta có thể hỏi mình và không biết chừng nó sẽ đoán được phần nào tương lai của ta. Nói đúng hơn, liệu những gì ta nói hôm nay có thể là ngụ ý cho những gì ta sẽ nghĩ đến mấy ngày sau, mấy tháng sau, thậm chí vài năm sau này. Cũng như việc nhiều người trong chúng ta đeo máy cảm biến để đếm nhịp tim, nhịp thở, gen, với hy vọng sẽ phòng được bệnh tật, chúng ta cũng có thể tự hỏi, liệu việc phân tích và theo dõi lời nói, những gì ta viết trên mạng xã hội như twitter, email, có thể đoán trước những vấn đề sẽ xảy ra trong tư duy chúng ta. Và cùng với Guillermo Cecchi, người anh em chung nhóm dự án, chúng tôi đã tìm hiểu việc này. Chúng tôi đã phân tích đoạn ghi âm đoạn nói chuyện của 34 người những người có nguy cơ mắc chứng tâm thần phân liệt cao. Thế này, vào ngày thứ nhất, chúng tôi phân tích đoạn nói chuyện, sau đó chúng tôi xem thử đoạn nói chuyện đó có thể đoán được gì trong vòng ba năm tới, về khả năng người đó bị bệnh tâm thần. Nhưng dù đã hy vọng rất nhiều, chúng tôi vẫn thất bại liên tục. Vì ngữ nghĩa học không cung cấp đủ thông tin để thấy trước trật tự của tư duy trong tương lai. Nhưng như thế cũng được rồi, vì chúng tôi đã phân biệt được nhóm phân liệt và nhóm xuất chúng, đại loại như cách chúng tôi đã phân tích những văn bản cổ, nhưng không phải để đoán khả năng bệnh tâm thần nhé. Nhưng rồi chúng tôi phát hiện có lẽ điều quan trọng nhất không phải là họ nói cái gì, mà là cách họ diễn đạt. Cụ thể hơn, vấn đề không phải là từ vựng được sử dụng thuộc nhóm nào, mà chính là khoảng cách và tốc độ "nhảy" nghĩa giữa hai nhóm từ khác nhau. Và thế là chúng tôi nghĩ ra một giải pháp gọi là "tính mạch lạc về nghĩa", nó đánh giá độ nhất quán của bài nói về mặt chủ đề chung, và loại nghĩa của từng nhóm từ. Và kết quả là, trong 34 người này, thuật toán đánh giá độ mạch lạc về ngữ nghĩa có thể dự đoán chính xác tới 100% ai sẽ mắc bệnh tâm thần, và ai không. Và đây chính là thứ không bao giờ đạt được hay thậm chí là gần được khi sử dụng mọi thiết bị có trong phòng khám hiện giờ. Tôi cũng nhớ rất rõ ràng, trong lúc tôi thực hiện dự án này, lúc tôi ngồi trước máy tính, tôi thấy rất nhiều dòng trạng thái của Polo trên Twitter. Cậu ấy là học trò đầu tiên của tôi hồi còn dạy ở Buenos Aires, khi đó cậu ấy đang sống ở New York. Và tôi thấy gì đó trong mấy dòng Tweet của cậu ấy. Tôi không nói chính xác ra được, vì không có gì tường minh hết, nhưng tôi có linh cảm rõ rệt, một dự cảm mạnh mẽ nói rằng có gì không ổn rồi. Và khi tôi gọi ngay cho Polo, thì sự thật là, cậu ấy bị ốm. Và chính sự thật giản đơn này: thông qua việc cảm nhận ngôn từ, tôi có thể "đánh hơi" được cảm giác của cậu ấy. Dù rất đơn giản, nhưng cách này lại giúp ích rất nhiều. Điều tôi nói với bạn hôm nay chính là chúng ta càng ngày càng hiểu được làm thế nào để chuyển dự cảm, cái mà ai cũng có, cái mà chúng ta hay bàn tới, thành một dạng thuật toán. Một khi làm điều này, ta có thể thấy trước tinh thần của mình ở một trạng thái rất khác, dựa trên những phân tích khách quan, đa dạng và tự động về những điều mà chúng ta viết, những lời mà chúng ta nói. Cám ơn. (Vỗ tay)