Thông qua lịch sử, ta hiểu được cách
ăn mặc của người Hy Lạp cổ,

đời sống sinh hoạt của họ,

cách họ đấu tranh...

nhưng còn cách nghĩ của họ thì sao?

Trong suy nghĩ thuần túy của chúng ta,
những ý niệm sâu sắc nhất của con người

khả năng tưởng tượng,

nhận thức,

ước mơ,

từ xưa tới nay đều giống nhau.

Một khả năng khác nữa là

có lẽ những biến đổi xã hội
định hình nền văn hóa

đã thay đổi bản chất tư duy của con người.

Có thể ý kiến của chúng ta
mỗi người mỗi khác.

Thật ra nó là vấn đề tranh cãi
thuộc về triết học đã có từ lâu.

Nhưng liệu khoa học có 
trả lời được câu hỏi này không?

Ở đây, tôi muốn nói

nếu chúng ta có thể tái hiện kiến trúc
của một thành phố Hy Lạp cổ đại

chỉ bằng vài viên gạch,

thì những ghi chép về văn hóa cũng
có bản chất như tài liệu khảo cổ,

như hóa thạch về tư duy con người.

Và thật ra,

khi tiến hành phân tích tâm lý

và ngôn ngữ trong vài 
cuốn sách cổ xưa nhất,

vào thập niên 70, Julian Jaynes đã đề xuất
một giả thuyết rất táo bạo và cấp tiến:

khi nhìn những người
sống cách đây chỉ 3000 năm,

chúng ta thời nay sẽ gọi họ là 
bệnh nhân tâm thần phân liệt.

Tuyên bố này được ông
dựa trên sự thật:

thế hệ người đầu tiên
được tả lại trong những cuốn sách này

đều cư xử một cách nhất quán,

dù điều kiện văn hóa và
địa lý khác nhau,

cứ như họ đang lắng nghe và làm theo

lời nói của ai đó
mà họ tin là Chúa,

hay các vị thần...

mà ngày nay chúng ta gọi là ảo giác.

Và phải bẵng đi một thời gian,

họ mới hiểu ra chính bản thân họ
là người tạo ra,

cũng như sở hữu những giọng nói
phát ra từ bên trong này.

Và nhờ phát hiện này,
họ có được sự chiêm nghiệm:

là khả năng nghĩ về chính ý nghĩ của mình.

Giả thuyết của Jaynes chính là,
trạng thái có ý thức,

theo cách hiểu đơn giản nhất 
của ta ngày nay,

tại thời điểm chúng ta thấy mình
làm chủ sự tồn tại của mình,

là một tiến trình văn hóa còn khá mới.

Học thuyết này khá tuyệt vời,

nhưng lại có một vấn đề lớn

nó được xây dựng chỉ trên
vài thí nghiệm nhất định.

Vậy câu hỏi đặt ra là: giả thuyết cho rằng

sự suy nghiệm hình thành mới
được 3000 trong lịch sử nhân loại này

có thể được kiểm chứng một cách
đa dạng và khách quan hay không.

Và để giải quyết được câu hỏi này
là cả một vấn đề.

Không chỉ đơn giản theo kiểu
vào một ngày đẹp trời Plato đã viết,

"Chào, tôi là Plato đây,

từ nay trở đi, tôi hoàn toàn
sở hữu được ý thức nội quan."

(Cười)

Và chính điều này cho ta thấy 
bản chất của vấn đề là gì.

Chúng ta cần thấy được bề nổi
của một khái niệm chưa từng nói tới.

Bản thân từ "chiêm nghiệm" 
không xuất hiện một lần nào

trong những quyển sách 
chúng tôi muốn phân tích.

Nên cách giải quyết chúng tôi nghĩ ra
chính là tạo ra không gian từ.

Đây là một không gian rất lớn
chứa đựng mọi từ ngữ

mà khoảng cách giữa 
hai từ khác nhau bất kỳ trong đó

cũng thể hiện được 
mức độ giống nhau giữa chúng.

Lấy ví dụ thế này,

bạn sẽ thấy khoảng cách giữa
"chó" và "mèo" là rất gần,

nhưng cặp từ "bưởi" và "logarit"
lại vô cùng xa nhau.

Và điều này chắc chắn đúng với
mọi cặp từ trong không gian đó.

Và chúng ta có nhiều cách xây dựng
không gian từ khác nhau.

Cách trên cần tìm người có chuyên môn,

cũng hơi giống với dò từ điển.

Còn cách khác nữa,

là tin vào một quan niệm đơn giản,
nếu hai từ có liên quan nhau,

chúng sẽ thường xuất hiện 
trong cùng một câu,

cùng một đoạn văn,

cùng một loại tài liệu,

và chúng thường đứng chung
một cách có chủ ý thay vì tình cờ.

Và giả thuyết cơ bản này,

phương pháp đơn giản này,

khi sử dụng vài thủ thuật điện toán

để "trị" một sự thật hóc búa:

không gian của từ ngữ
vô cùng phức tạp và đa chiều,

cho kết quả khá hiệu quả.

Và để cho bạn thấy 
sự hiệu quả của phương pháp này,

đây là kết quả khi chúng tôi
áp dụng nó để phân tích vài từ quen thuộc.

Điều đầu tiên ta thấy

chính là các từ tự động
sắp xếp trên quan hệ ngữ nghĩa.

Ở đây có họ từ trái cây,
cơ quan trong cơ thể,

bộ phận của máy vi tính,
thuật ngữ khoa học, v.v...

Thuật toán cũng nhận ra
chúng tôi xếp từ theo thứ tự khái niệm.

Ví dụ,

nhóm từ thuật ngữ khoa học
chia làm hai loại nhỏ

là thuật ngữ thiên văn
và thuật ngữ vật lý.

Và có những thứ phân loại rất kĩ lưỡng.

Ví dụ, từ "thiên văn học",

hơi kì lạ khi nó nằm ở đó,

nhưng đó mới là vị trí chính xác của nó:

vừa thuộc nhóm từ khoa học,

chỉ bản chất của nó,

và bản thân nó lại vừa chứa đựng

những thuật ngữ thiên văn khác.

Và chúng ta có thể phân tích sâu hơn nữa.

Thật ra, nếu nhìn 
vào đống từ này một lúc lâu,

và vẽ ra đường đi
ngẫu nhiên cho chúng,

bạn sẽ cảm thấy như mình
đang làm thơ vậy.

Và cảm giác này
một phần là do

đi vào không gian từ này
cũng như đi vào trường tư duy.

Và điều cuối cùng

thuật toán này cũng giúp
trực giác của chúng ta biết được

những từ và nhóm từ nào nên 
được chiêm nghiệm trước tiên.

Ví dụ,

những từ như "bản ngã", "tội lỗi",
"lí do", "cảm xúc",

quan hệ rất gần với "suy niệm",

trong khi những từ khác

chẳng hạn "đỏ", "bóng đá",
"nến", "chuối",

chúng cách xa nhau vô cùng.

Một khi chúng ta đã
dựng được không gian

thì câu hỏi về
lịch sử của quá trình suy niệm,

hay lịch sử của bất cứ khái niệm nào

những vấn đề trước đây
có phần trừu tượng, mơ hồ

giờ đây sẽ trở nên sáng tỏ,

và khoa học định lượng sẽ
có cơ hội đóng góp hơn.

Chúng tôi chỉ việc lấy những gì
được ghi lại trong sách,

phân tích chúng bằng thuật toán,

đem toàn bộ những từ này xếp theo quỹ đạo

và chiếu chúng vào không gian,

sau đó chúng tôi tự hỏi liệu có phải 
mất rất lâu để quỹ đạo này

trở nên giống với khái niệm
"suy niệm" của chúng ta hay không.

Và nếu trả lời được,

ta sẽ phân tích được lịch sử của suy niệm

theo lối sống của Hy Lạp cổ đại,

vì hiện giờ đó là tài liệu đáng tin 
nhất mà chúng tôi có.

Vậy là chúng tôi lấy hết sách ra,

xếp theo thứ tự thời gian

và lấy những từ được dùng trong mỗi quyển

chiếu vào không gian,

rồi chúng tôi hỏi: mỗi từ trong đó
ở gần dòng suy niệm tới đâu,

và tính trung bình ra.

Rồi chúng tôi tự hỏi có phải,
càng về sau này

thì những cuốn sách này có
quan hệ càng gần

với sự suy niệm hay không.

Và đây đúng thật là cách
sống của người Hy Lạp cổ.

Nên bạn thấy đó, những quyển sách 
cổ nhất viết theo phong cách Homer

rất ít tương đồng với
những quyển mà chúng ta hiểu được.

Nhưng chỉ bốn trăm năm TCN,

sự tương đồng tăng lên rất nhanh
và có khi lên tới năm lần

đối với những quyển có niên đại
gần với thời điểm

mà khái niệm "suy niệm" ra đời.

Và một trong những chuyện hay nhất

chính là giờ đây, ta có thể hỏi

liệu những điều này có còn
đúng với những nền văn hóa khác.

Và chúng tôi kiểm tra tương tự
với văn hóa Judeo-Christian,

và được kết quả gần giống vậy.

Một lần nữa, cuốn Cựu Ước 
có rất ít sự tương đồng

và sau đó sự tương đồng lại tăng nhanh

trong cuốn Tân Ước.

Và gần nhất trong sự
suy niệm của chúng ta

là cuốn "Sách Tự Thú của Thánh Augustine",

khoảng 400 năm sau khi Chúa ra đời.

Và điều này rất quan trọng

vì thánh Augustine được 
công nhận bởi các học giả,

nhà ngữ văn học, các sử gia,

là một trong những người
đặt nền móng cho "suy niệm".

Thật ra, có người còn cho rằng
ông là cha đẻ của tâm lý học hiện đại.

Cho nên, thuật toán của chúng tôi,

có đặc tính đa dạng,

khách quan,

và tất nhiên, cực kỳ nhạy:

chỉ mất chưa tới một giây

để đưa ra những kết luận quan trọng nhất

cho tiến trình nghiên cứu lâu đời này.

Và một phần nào đó,
vẻ đẹp của khoa học

giờ đây có thể được diễn giải

và khái quát thông qua
nhiều lĩnh vực khác nhau.

Và tương tự, chúng tôi tự hỏi
con người biết ý thức từ bao giờ,

có lẽ đó là câu hỏi khó nhất 
chúng ta có thể hỏi mình

và không biết chừng nó sẽ 
đoán được phần nào tương lai của ta.

Nói đúng hơn,

liệu những gì ta nói hôm nay

có thể là ngụ ý cho những gì ta 
sẽ nghĩ đến mấy ngày sau,

mấy tháng sau,

thậm chí vài năm sau này.

Cũng như việc nhiều người trong
chúng ta đeo máy cảm biến

để đếm nhịp tim,

nhịp thở,

gen,

với hy vọng sẽ phòng
được bệnh tật,

chúng ta cũng có thể tự hỏi,
liệu việc phân tích và theo dõi lời nói,

những gì ta viết trên 
mạng xã hội như twitter, email,

có thể đoán trước những vấn đề
sẽ xảy ra trong tư duy chúng ta.

Và cùng với Guillermo Cecchi,

người anh em chung nhóm dự án,

chúng tôi đã tìm hiểu việc này.

Chúng tôi đã phân tích đoạn ghi âm
đoạn nói chuyện của 34 người

những người có nguy cơ mắc
chứng tâm thần phân liệt cao.

Thế này, vào ngày thứ nhất, chúng tôi
phân tích đoạn nói chuyện,

sau đó chúng tôi xem thử
đoạn nói chuyện đó có thể đoán được gì

trong vòng ba năm tới,

về khả năng người đó bị bệnh tâm thần.

Nhưng dù đã hy vọng rất nhiều,

chúng tôi vẫn thất bại liên tục.

Vì ngữ nghĩa học không cung cấp
đủ thông tin

để thấy trước trật tự của tư duy
trong tương lai.

Nhưng như thế cũng được rồi,

vì chúng tôi đã phân biệt được
nhóm phân liệt và nhóm xuất chúng,

đại loại như cách chúng tôi
đã phân tích những văn bản cổ,

nhưng không phải để đoán
khả năng bệnh tâm thần nhé.

Nhưng rồi chúng tôi phát hiện

có lẽ điều quan trọng nhất 
không phải là họ nói cái gì,

mà là cách họ diễn đạt.

Cụ thể hơn,

vấn đề không phải là từ vựng
được sử dụng thuộc nhóm nào,

mà chính là khoảng cách
và tốc độ "nhảy" nghĩa

giữa hai nhóm từ khác nhau.

Và thế là chúng tôi nghĩ ra

một giải pháp gọi là 
"tính mạch lạc về nghĩa",

nó đánh giá độ nhất quán 
của bài nói về mặt chủ đề chung,

và loại nghĩa của từng nhóm từ.

Và kết quả là, trong 34 người này,

thuật toán đánh giá độ mạch lạc
về ngữ nghĩa có thể dự đoán

chính xác tới 100%

ai sẽ mắc bệnh tâm thần, và ai không.

Và đây chính là thứ 
không bao giờ đạt được

hay thậm chí là gần được

khi sử dụng mọi thiết bị
có trong phòng khám hiện giờ.

Tôi cũng nhớ rất rõ ràng,
trong lúc tôi thực hiện dự án này,

lúc tôi ngồi trước máy tính,

tôi thấy rất nhiều dòng trạng thái
của Polo trên Twitter.

Cậu ấy là học trò đầu tiên của tôi
hồi còn dạy ở Buenos Aires,

khi đó cậu ấy đang sống ở New York.

Và tôi thấy gì đó trong 
mấy dòng Tweet của cậu ấy.

Tôi không nói chính xác ra được,
vì không có gì tường minh hết,

nhưng tôi có linh cảm rõ rệt,

một dự cảm mạnh mẽ 
nói rằng có gì không ổn rồi.

Và khi tôi gọi ngay cho Polo,

thì sự thật là, cậu ấy bị ốm.

Và chính sự thật giản đơn này:

thông qua việc cảm nhận ngôn từ,

tôi có thể "đánh hơi" được
cảm giác của cậu ấy.

Dù rất đơn giản, nhưng cách này lại 
giúp ích rất nhiều.

Điều tôi nói với bạn hôm nay

chính là chúng ta càng ngày
càng hiểu được

làm thế nào để chuyển dự cảm,
cái mà ai cũng có,

cái mà chúng ta hay bàn tới,

thành một dạng thuật toán.

Một khi làm điều này,

ta có thể thấy trước tinh thần
của mình ở một trạng thái rất khác,

dựa trên những phân tích khách quan,
đa dạng và tự động

về những điều mà chúng ta viết,

những lời mà chúng ta nói.

Cám ơn.

(Vỗ tay)