Thông qua lịch sử, ta hiểu được cách
ăn mặc của người Hy Lạp cổ,
đời sống sinh hoạt của họ,
cách họ đấu tranh...
nhưng còn cách nghĩ của họ thì sao?
Trong suy nghĩ thuần túy của chúng ta,
những ý niệm sâu sắc nhất của con người
khả năng tưởng tượng,
nhận thức,
ước mơ,
từ xưa tới nay đều giống nhau.
Một khả năng khác nữa là
có lẽ những biến đổi xã hội
định hình nền văn hóa
đã thay đổi bản chất tư duy của con người.
Có thể ý kiến của chúng ta
mỗi người mỗi khác.
Thật ra nó là vấn đề tranh cãi
thuộc về triết học đã có từ lâu.
Nhưng liệu khoa học có
trả lời được câu hỏi này không?
Ở đây, tôi muốn nói
nếu chúng ta có thể tái hiện kiến trúc
của một thành phố Hy Lạp cổ đại
chỉ bằng vài viên gạch,
thì những ghi chép về văn hóa cũng
có bản chất như tài liệu khảo cổ,
như hóa thạch về tư duy con người.
Và thật ra,
khi tiến hành phân tích tâm lý
và ngôn ngữ trong vài
cuốn sách cổ xưa nhất,
vào thập niên 70, Julian Jaynes đã đề xuất
một giả thuyết rất táo bạo và cấp tiến:
khi nhìn những người
sống cách đây chỉ 3000 năm,
chúng ta thời nay sẽ gọi họ là
bệnh nhân tâm thần phân liệt.
Tuyên bố này được ông
dựa trên sự thật:
thế hệ người đầu tiên
được tả lại trong những cuốn sách này
đều cư xử một cách nhất quán,
dù điều kiện văn hóa và
địa lý khác nhau,
cứ như họ đang lắng nghe và làm theo
lời nói của ai đó
mà họ tin là Chúa,
hay các vị thần...
mà ngày nay chúng ta gọi là ảo giác.
Và phải bẵng đi một thời gian,
họ mới hiểu ra chính bản thân họ
là người tạo ra,
cũng như sở hữu những giọng nói
phát ra từ bên trong này.
Và nhờ phát hiện này,
họ có được sự chiêm nghiệm:
là khả năng nghĩ về chính ý nghĩ của mình.
Giả thuyết của Jaynes chính là,
trạng thái có ý thức,
theo cách hiểu đơn giản nhất
của ta ngày nay,
tại thời điểm chúng ta thấy mình
làm chủ sự tồn tại của mình,
là một tiến trình văn hóa còn khá mới.
Học thuyết này khá tuyệt vời,
nhưng lại có một vấn đề lớn
nó được xây dựng chỉ trên
vài thí nghiệm nhất định.
Vậy câu hỏi đặt ra là: giả thuyết cho rằng
sự suy nghiệm hình thành mới
được 3000 trong lịch sử nhân loại này
có thể được kiểm chứng một cách
đa dạng và khách quan hay không.
Và để giải quyết được câu hỏi này
là cả một vấn đề.
Không chỉ đơn giản theo kiểu
vào một ngày đẹp trời Plato đã viết,
"Chào, tôi là Plato đây,
từ nay trở đi, tôi hoàn toàn
sở hữu được ý thức nội quan."
(Cười)
Và chính điều này cho ta thấy
bản chất của vấn đề là gì.
Chúng ta cần thấy được bề nổi
của một khái niệm chưa từng nói tới.
Bản thân từ "chiêm nghiệm"
không xuất hiện một lần nào
trong những quyển sách
chúng tôi muốn phân tích.
Nên cách giải quyết chúng tôi nghĩ ra
chính là tạo ra không gian từ.
Đây là một không gian rất lớn
chứa đựng mọi từ ngữ
mà khoảng cách giữa
hai từ khác nhau bất kỳ trong đó
cũng thể hiện được
mức độ giống nhau giữa chúng.
Lấy ví dụ thế này,
bạn sẽ thấy khoảng cách giữa
"chó" và "mèo" là rất gần,
nhưng cặp từ "bưởi" và "logarit"
lại vô cùng xa nhau.
Và điều này chắc chắn đúng với
mọi cặp từ trong không gian đó.
Và chúng ta có nhiều cách xây dựng
không gian từ khác nhau.
Cách trên cần tìm người có chuyên môn,
cũng hơi giống với dò từ điển.
Còn cách khác nữa,
là tin vào một quan niệm đơn giản,
nếu hai từ có liên quan nhau,
chúng sẽ thường xuất hiện
trong cùng một câu,
cùng một đoạn văn,
cùng một loại tài liệu,
và chúng thường đứng chung
một cách có chủ ý thay vì tình cờ.
Và giả thuyết cơ bản này,
phương pháp đơn giản này,
khi sử dụng vài thủ thuật điện toán
để "trị" một sự thật hóc búa:
không gian của từ ngữ
vô cùng phức tạp và đa chiều,
cho kết quả khá hiệu quả.
Và để cho bạn thấy
sự hiệu quả của phương pháp này,
đây là kết quả khi chúng tôi
áp dụng nó để phân tích vài từ quen thuộc.
Điều đầu tiên ta thấy
chính là các từ tự động
sắp xếp trên quan hệ ngữ nghĩa.
Ở đây có họ từ trái cây,
cơ quan trong cơ thể,
bộ phận của máy vi tính,
thuật ngữ khoa học, v.v...
Thuật toán cũng nhận ra
chúng tôi xếp từ theo thứ tự khái niệm.
Ví dụ,
nhóm từ thuật ngữ khoa học
chia làm hai loại nhỏ
là thuật ngữ thiên văn
và thuật ngữ vật lý.
Và có những thứ phân loại rất kĩ lưỡng.
Ví dụ, từ "thiên văn học",
hơi kì lạ khi nó nằm ở đó,
nhưng đó mới là vị trí chính xác của nó:
vừa thuộc nhóm từ khoa học,
chỉ bản chất của nó,
và bản thân nó lại vừa chứa đựng
những thuật ngữ thiên văn khác.
Và chúng ta có thể phân tích sâu hơn nữa.
Thật ra, nếu nhìn
vào đống từ này một lúc lâu,
và vẽ ra đường đi
ngẫu nhiên cho chúng,
bạn sẽ cảm thấy như mình
đang làm thơ vậy.
Và cảm giác này
một phần là do
đi vào không gian từ này
cũng như đi vào trường tư duy.
Và điều cuối cùng
thuật toán này cũng giúp
trực giác của chúng ta biết được
những từ và nhóm từ nào nên
được chiêm nghiệm trước tiên.
Ví dụ,
những từ như "bản ngã", "tội lỗi",
"lí do", "cảm xúc",
quan hệ rất gần với "suy niệm",
trong khi những từ khác
chẳng hạn "đỏ", "bóng đá",
"nến", "chuối",
chúng cách xa nhau vô cùng.
Một khi chúng ta đã
dựng được không gian
thì câu hỏi về
lịch sử của quá trình suy niệm,
hay lịch sử của bất cứ khái niệm nào
những vấn đề trước đây
có phần trừu tượng, mơ hồ
giờ đây sẽ trở nên sáng tỏ,
và khoa học định lượng sẽ
có cơ hội đóng góp hơn.
Chúng tôi chỉ việc lấy những gì
được ghi lại trong sách,
phân tích chúng bằng thuật toán,
đem toàn bộ những từ này xếp theo quỹ đạo
và chiếu chúng vào không gian,
sau đó chúng tôi tự hỏi liệu có phải
mất rất lâu để quỹ đạo này
trở nên giống với khái niệm
"suy niệm" của chúng ta hay không.
Và nếu trả lời được,
ta sẽ phân tích được lịch sử của suy niệm
theo lối sống của Hy Lạp cổ đại,
vì hiện giờ đó là tài liệu đáng tin
nhất mà chúng tôi có.
Vậy là chúng tôi lấy hết sách ra,
xếp theo thứ tự thời gian
và lấy những từ được dùng trong mỗi quyển
chiếu vào không gian,
rồi chúng tôi hỏi: mỗi từ trong đó
ở gần dòng suy niệm tới đâu,
và tính trung bình ra.
Rồi chúng tôi tự hỏi có phải,
càng về sau này
thì những cuốn sách này có
quan hệ càng gần
với sự suy niệm hay không.
Và đây đúng thật là cách
sống của người Hy Lạp cổ.
Nên bạn thấy đó, những quyển sách
cổ nhất viết theo phong cách Homer
rất ít tương đồng với
những quyển mà chúng ta hiểu được.
Nhưng chỉ bốn trăm năm TCN,
sự tương đồng tăng lên rất nhanh
và có khi lên tới năm lần
đối với những quyển có niên đại
gần với thời điểm
mà khái niệm "suy niệm" ra đời.
Và một trong những chuyện hay nhất
chính là giờ đây, ta có thể hỏi
liệu những điều này có còn
đúng với những nền văn hóa khác.
Và chúng tôi kiểm tra tương tự
với văn hóa Judeo-Christian,
và được kết quả gần giống vậy.
Một lần nữa, cuốn Cựu Ước
có rất ít sự tương đồng
và sau đó sự tương đồng lại tăng nhanh
trong cuốn Tân Ước.
Và gần nhất trong sự
suy niệm của chúng ta
là cuốn "Sách Tự Thú của Thánh Augustine",
khoảng 400 năm sau khi Chúa ra đời.
Và điều này rất quan trọng
vì thánh Augustine được
công nhận bởi các học giả,
nhà ngữ văn học, các sử gia,
là một trong những người
đặt nền móng cho "suy niệm".
Thật ra, có người còn cho rằng
ông là cha đẻ của tâm lý học hiện đại.
Cho nên, thuật toán của chúng tôi,
có đặc tính đa dạng,
khách quan,
và tất nhiên, cực kỳ nhạy:
chỉ mất chưa tới một giây
để đưa ra những kết luận quan trọng nhất
cho tiến trình nghiên cứu lâu đời này.
Và một phần nào đó,
vẻ đẹp của khoa học
giờ đây có thể được diễn giải
và khái quát thông qua
nhiều lĩnh vực khác nhau.
Và tương tự, chúng tôi tự hỏi
con người biết ý thức từ bao giờ,
có lẽ đó là câu hỏi khó nhất
chúng ta có thể hỏi mình
và không biết chừng nó sẽ
đoán được phần nào tương lai của ta.
Nói đúng hơn,
liệu những gì ta nói hôm nay
có thể là ngụ ý cho những gì ta
sẽ nghĩ đến mấy ngày sau,
mấy tháng sau,
thậm chí vài năm sau này.
Cũng như việc nhiều người trong
chúng ta đeo máy cảm biến
để đếm nhịp tim,
nhịp thở,
gen,
với hy vọng sẽ phòng
được bệnh tật,
chúng ta cũng có thể tự hỏi,
liệu việc phân tích và theo dõi lời nói,
những gì ta viết trên
mạng xã hội như twitter, email,
có thể đoán trước những vấn đề
sẽ xảy ra trong tư duy chúng ta.
Và cùng với Guillermo Cecchi,
người anh em chung nhóm dự án,
chúng tôi đã tìm hiểu việc này.
Chúng tôi đã phân tích đoạn ghi âm
đoạn nói chuyện của 34 người
những người có nguy cơ mắc
chứng tâm thần phân liệt cao.
Thế này, vào ngày thứ nhất, chúng tôi
phân tích đoạn nói chuyện,
sau đó chúng tôi xem thử
đoạn nói chuyện đó có thể đoán được gì
trong vòng ba năm tới,
về khả năng người đó bị bệnh tâm thần.
Nhưng dù đã hy vọng rất nhiều,
chúng tôi vẫn thất bại liên tục.
Vì ngữ nghĩa học không cung cấp
đủ thông tin
để thấy trước trật tự của tư duy
trong tương lai.
Nhưng như thế cũng được rồi,
vì chúng tôi đã phân biệt được
nhóm phân liệt và nhóm xuất chúng,
đại loại như cách chúng tôi
đã phân tích những văn bản cổ,
nhưng không phải để đoán
khả năng bệnh tâm thần nhé.
Nhưng rồi chúng tôi phát hiện
có lẽ điều quan trọng nhất
không phải là họ nói cái gì,
mà là cách họ diễn đạt.
Cụ thể hơn,
vấn đề không phải là từ vựng
được sử dụng thuộc nhóm nào,
mà chính là khoảng cách
và tốc độ "nhảy" nghĩa
giữa hai nhóm từ khác nhau.
Và thế là chúng tôi nghĩ ra
một giải pháp gọi là
"tính mạch lạc về nghĩa",
nó đánh giá độ nhất quán
của bài nói về mặt chủ đề chung,
và loại nghĩa của từng nhóm từ.
Và kết quả là, trong 34 người này,
thuật toán đánh giá độ mạch lạc
về ngữ nghĩa có thể dự đoán
chính xác tới 100%
ai sẽ mắc bệnh tâm thần, và ai không.
Và đây chính là thứ
không bao giờ đạt được
hay thậm chí là gần được
khi sử dụng mọi thiết bị
có trong phòng khám hiện giờ.
Tôi cũng nhớ rất rõ ràng,
trong lúc tôi thực hiện dự án này,
lúc tôi ngồi trước máy tính,
tôi thấy rất nhiều dòng trạng thái
của Polo trên Twitter.
Cậu ấy là học trò đầu tiên của tôi
hồi còn dạy ở Buenos Aires,
khi đó cậu ấy đang sống ở New York.
Và tôi thấy gì đó trong
mấy dòng Tweet của cậu ấy.
Tôi không nói chính xác ra được,
vì không có gì tường minh hết,
nhưng tôi có linh cảm rõ rệt,
một dự cảm mạnh mẽ
nói rằng có gì không ổn rồi.
Và khi tôi gọi ngay cho Polo,
thì sự thật là, cậu ấy bị ốm.
Và chính sự thật giản đơn này:
thông qua việc cảm nhận ngôn từ,
tôi có thể "đánh hơi" được
cảm giác của cậu ấy.
Dù rất đơn giản, nhưng cách này lại
giúp ích rất nhiều.
Điều tôi nói với bạn hôm nay
chính là chúng ta càng ngày
càng hiểu được
làm thế nào để chuyển dự cảm,
cái mà ai cũng có,
cái mà chúng ta hay bàn tới,
thành một dạng thuật toán.
Một khi làm điều này,
ta có thể thấy trước tinh thần
của mình ở một trạng thái rất khác,
dựa trên những phân tích khách quan,
đa dạng và tự động
về những điều mà chúng ta viết,
những lời mà chúng ta nói.
Cám ơn.
(Vỗ tay)