< Return to Video

Çka kemi mësuar prej 5 milionë librave

  • 0:00 - 0:02
    Erez Lieberman Aiden: Të gjithë e dinë
  • 0:02 - 0:05
    se një fotografi vlen sa një mijë fjalë.
  • 0:07 - 0:09
    Por ne në Harvard
  • 0:09 - 0:12
    po e vemë në pikëpyetje vërtetësinë e kësaj shprehje.
  • 0:12 - 0:14
    (Të qeshura)
  • 0:14 - 0:18
    Kështuqë ne e kemi mbledh nji ekip profesionistësh,
  • 0:18 - 0:20
    nga Harvard, MIT,
  • 0:20 - 0:23
    Fjalori i Trashëgimisë Amerikane (The American Heritage Dictionary), Enciklopedia Britanika
  • 0:23 - 0:25
    dhe sponsorët tanë të nderuar
  • 0:25 - 0:28
    Google
  • 0:28 - 0:30
    Ne kemi menduar thellë për këtë çështje
  • 0:30 - 0:32
    për katër vite të tëra.
  • 0:32 - 0:37
    Dhe kemi arritur në konkludime befasuese.
  • 0:37 - 0:40
    Zonja dhe Zotërinj, një fotografi nuk vlen sa një mijë fjalë.
  • 0:40 - 0:42
    Në fakt, ne kemi hasur në disa fotografi
  • 0:42 - 0:47
    të cilat vlejnë sa 500 miliardë fjalë.
  • 0:47 - 0:49
    Jean-Baptiste Michel: Pra si kemi arritur deri te ky konkludim?
  • 0:49 - 0:51
    Erezi dhe une po mendonim për mënyrat
  • 0:51 - 0:53
    si ta gjejmë nji fotografi e cila përfshin kulturën e njerëzimit
  • 0:53 - 0:56
    dhe historinë e njerëzimit: duke ndryshuar nëpër kohë.
  • 0:56 - 0:58
    Gjatë viteve janë shkruar shumë libra.
  • 0:58 - 1:00
    Ne po mendonim, mënyra më e mirë për të mësuar prej tyre
  • 1:00 - 1:02
    është ti lexosh të gjithë këta miliona libra.
  • 1:02 - 1:05
    Tani natyrisht nëse do të mund të masnin me ndonjë shkallë se sa mbresëlënëse do të ishte kjo gjë,
  • 1:05 - 1:08
    sigurisht do ta rendisnim tej, tej lartë.
  • 1:08 - 1:10
    Tani problemin qëndron se aty gjindet nji bosht X,
  • 1:10 - 1:12
    i cili ështe boshti praktik.
  • 1:12 - 1:14
    Kjo është shumë, shumë e ultë.
  • 1:14 - 1:17
    (Duartrokitje)
  • 1:17 - 1:20
    Tani njerëzit tentojnë të përdorin nji qasje alternative,
  • 1:20 - 1:22
    e cila përfshin grumbullimin e disa burimeve dhe leximin e tyre me kujdes.
  • 1:22 - 1:24
    Kjo gjë është tejet praktike por jo edhe aq mbresëlënëse.
  • 1:24 - 1:27
    Se çka duam të bëjmë është
  • 1:27 - 1:30
    t'arrijmë te pjesa mbresëlënëse e poashtu praktike e kësaj hapësire.
  • 1:30 - 1:33
    Fillimisht kompania e quajtur Google
  • 1:33 - 1:35
    kishte filluar një projekt të digjitalizimit (të të dhënave) disa vite më herët
  • 1:35 - 1:37
    që veç do ta mundësonte këtë qasje.
  • 1:37 - 1:39
    Ata kanë digjitalizuar miliona libra.
  • 1:39 - 1:42
    Kjo do të thotë, duke shfrytëzuar metodat komputative mundemi
  • 1:42 - 1:44
    ti lexojmë të gjithë librat me një shtypje butoni.
  • 1:44 - 1:47
    Kjo gjë është tejet praktike dhe më se mbresëlënëse.
  • 1:48 - 1:50
    ELA: Më lejoni t'ju rrëfej pak se si kanë ardhur librat.
  • 1:50 - 1:53
    Qysh se nuk mbahet mend kanë ekzistuar autorët.
  • 1:53 - 1:56
    Këta autorë janë përpjekur të shkruajnë libra.
  • 1:56 - 1:58
    Mundimi i tyre është lehtësuar në mënyrë të konsiderueshme
  • 1:58 - 2:00
    me zhvillimin e makinave shtypëse disa shekuj më herët.
  • 2:00 - 2:03
    Që nga at'herë autorë kanë fituar
  • 2:03 - 2:05
    në 129 milionë raste të ndryshme
  • 2:05 - 2:07
    libra të botuar.
  • 2:07 - 2:09
    Tani nëse këto libra nuk janë të humbur nëpër kohëra,
  • 2:09 - 2:11
    ato duhet të jenë diku në ndonjë bibliotekë,
  • 2:11 - 2:14
    dhe shumë nga këto libra janë huazuar nga bibliotekat
  • 2:14 - 2:16
    dhe janë digjitalizuar nga Google,
  • 2:16 - 2:18
    e cila i ka skenuar 15 milionë libra deri sot.
  • 2:18 - 2:21
    Tani, kur Google digjitalizon një libër, ata e vendosin në një format shumë të mirë.
  • 2:21 - 2:23
    Tani kemi të dhëna (data) dhe poashtu metatëdhëna (metadata).
  • 2:23 - 2:26
    Ne kemi informacione për gjër si: ku është botuar libri,
  • 2:26 - 2:28
    kush ka qenë autori dhe kur është botuar.
  • 2:28 - 2:31
    Se çka bëjmë ne është që i kontrollojmë gjithë të dhënat
  • 2:31 - 2:35
    dhe i përjashtojmë gjithëçka që nuk është e dhënë e kualitetit më të lartë.
  • 2:35 - 2:37
    Neve na mbetet
  • 2:37 - 2:40
    një koleksion i pesë milionë librave,
  • 2:40 - 2:43
    500 miliardë fjalëve,
  • 2:43 - 2:45
    një varg karakteresh një mijë herë më i gjatë
  • 2:45 - 2:48
    se gjenomi i njeriut --
  • 2:48 - 2:50
    një tekst i cili po të shkruhej
  • 2:50 - 2:52
    do të zgjatej sa prej këtu gjer në Hënë e prapë mbrapa deri këtu
  • 2:52 - 2:54
    edhe atë 10 herë--
  • 2:54 - 2:58
    një copë e thyer e gjenomit tonë kulturor.
  • 2:58 - 3:00
    Natyrisht çka kemi bërë ne
  • 3:00 - 3:03
    kur jemi ballafaquar me atë hiperbollë të tmerrshme...
  • 3:03 - 3:05
    (Të qeshura)
  • 3:05 - 3:08
    ishte ajo që çdo hulumtues i respektueshëm
  • 3:08 - 3:11
    do të bënte.
  • 3:11 - 3:13
    Ne morrëm një faqe nga XKCD
  • 3:13 - 3:15
    dhe kemi thënë: "Mbajuni.
  • 3:15 - 3:17
    Ne do të provojmë shkencën."
  • 3:17 - 3:19
    ( Të qeshura)
  • 3:19 - 3:21
    JM: Natyrisht, ne po mendonim,
  • 3:21 - 3:23
    do ti vendosnim të dhënat
  • 3:23 - 3:25
    ashtu që njerëzit ti përdorin për shkencë ato.
  • 3:25 - 3:27
    Tani po mendonim, cilat të dhëna mund ti nxjerrim?
  • 3:27 - 3:29
    Natyrisht, ju do të dëshironi ti merrni librat
  • 3:29 - 3:31
    dhe ti publikoni tekstin e plotë të pesë milionë librave.
  • 3:31 - 3:33
    Tani Google, dhe Jon Orwant në veçanti
  • 3:33 - 3:35
    na kanë treguar një ekuacion të cilin duhet ta mësojmë.
  • 3:35 - 3:38
    Kështuqë nëse keni pesë milionë autorë
  • 3:38 - 3:41
    dhe pesë milionë paditës formojnë një paditje masive.
  • 3:41 - 3:43
    Edhe pse kjo do të ishte me të vërtetë e mrekullueshme,
  • 3:43 - 3:46
    megjithatë do të ishte tejet jo praktike.
  • 3:46 - 3:48
    (Të qeshura)
  • 3:48 - 3:50
    Kështu qe ne përsëri u zbrapsëm,
  • 3:50 - 3:53
    dhe u drejtuam me një qasje më praktike e cila ishte më pak mbresëlënëse.
  • 3:53 - 3:55
    Dhe thamë, në vend se ta publikojmë tekstin e plotë,
  • 3:55 - 3:57
    ne do te publikojmë statistikat rreth librave.
  • 3:57 - 3:59
    Për shembull " A gleam of happiness" ("Një dritë e zbehtë e lumturisë").
  • 3:59 - 4:01
    Përmban katër fjalë, ne mund ta thërrasim një katër-gram.
  • 4:01 - 4:03
    Tani do t'ju rrëfejmë se sa herë një katër-gram i veçantë
  • 4:03 - 4:05
    është shfaqur nëpër libra në vitet 1801. 1802, 1803,
  • 4:05 - 4:07
    e gjer në vitin 2008.
  • 4:07 - 4:09
    Kjo na sjell neve një seri
  • 4:09 - 4:11
    e cila na tregon frekuencën e përdorimit gjatë kohës të një fjalie të veçantë.
  • 4:11 - 4:14
    E kemi bërë këtë gjë për të gjitha fjalët dhe frazat të cilat shfaqen në ato libra,
  • 4:14 - 4:17
    dhe kjo na sjell një tabelë të madhe me dy miliardë linja
  • 4:17 - 4:19
    të cilat na rrëfejnë se si kultura ka ndryshuar.
  • 4:19 - 4:21
    ELA: Kështu që këto dy miliardë linja,
  • 4:21 - 4:23
    ne i kemi quajtur dy miliardë n-grame.
  • 4:23 - 4:25
    E çka na rrëfejnë ato neve?
  • 4:25 - 4:27
    N-gramet individuale masin trendet kulturore.
  • 4:27 - 4:29
    Ta marr një shembull për t'ju ilustruar.
  • 4:29 - 4:31
    Le të supozojmë se unë jam duke u zhvilluar,
  • 4:31 - 4:33
    dhe të nesërmen do të dëshiroja t'ju rrëfej sa kam arritur.
  • 4:33 - 4:36
    Kështuqë mund të them , "Dje përparova" (Shënim: Mirret shembull trajta e foljeve të rregullta dhe parregullta në gjuhën angleze).
  • 4:36 - 4:39
    Ose mund të thosha, "Dje kam përparuar".
  • 4:39 - 4:42
    Cilën formë do të duhej ta përdorja?
  • 4:42 - 4:44
    Si ta di?
  • 4:44 - 4:46
    Diku para gjashtë muajsh,
  • 4:46 - 4:48
    arti i kësaj fushe
  • 4:48 - 4:50
    do të ishte, si shembull,
  • 4:50 - 4:52
    të takoni një psikolog me flokë të mrekullueshëm,
  • 4:52 - 4:54
    e ti thoni;
  • 4:54 - 4:57
    "Steve, ti je një ekspert në foljet e parregullta.
  • 4:57 - 4:59
    Çka më duhet të bëj?"
  • 4:59 - 5:01
    Ai do t'ju përgjigjej, "Shumica e njerëzve përdorin shprehjen: kam përparuar,
  • 5:01 - 5:04
    por ka të tillë që përdorin: përparova."
  • 5:04 - 5:06
    Edhe ju e dini, pak a shumë,
  • 5:06 - 5:09
    se po t'ju duhej të ktheheni prapa në kohë për 200 vite
  • 5:09 - 5:12
    dhe ta pyetni deklaruesin e rradhës poashtu me flokë të mrekullueshëm,
  • 5:12 - 5:15
    (Të qeshura)
  • 5:15 - 5:17
    "Tom, si duhet ta them?"
  • 5:17 - 5:19
    Ai do t'ju përgjigjej, " Tani, në kohën time shumica e njerëzve janë zhvilluar,
  • 5:19 - 5:22
    por disa zhvilluan."
  • 5:22 - 5:24
    Tani do t'ju paraqes disa të dhëna të papërpunuara,
  • 5:24 - 5:28
    Dy rreshta prej kësaj tabele prej dy miliardë të dhënash.
  • 5:28 - 5:30
    Se çka po shohim është frekuenca vit për vit
  • 5:30 - 5:33
    e "jam zhvilluar" dhe "u zhvillova" gjatë kohës.
  • 5:34 - 5:36
    Kjo tani është vetëm dy
  • 5:36 - 5:39
    prej dy miliardë rreshtash.
  • 5:39 - 5:41
    Pra i gjithë kompleti i të dhënave
  • 5:41 - 5:44
    është një miliardë herë më i mrekullueshëm se kjo faqe prezentimi.
  • 5:44 - 5:46
    (Të qeshura)
  • 5:46 - 5:50
    (Duartrokitje)
  • 5:50 - 5:52
    JM: Tashti ka shumë fotografi që vlejnë sa 500 miliardë fjalë,
  • 5:52 - 5:54
    Si shembull, kjo.
  • 5:54 - 5:56
    Nëse e marrim gripin,
  • 5:56 - 5:58
    do të shihni pika kulminante gjatë kohës kur ju keni qenë në dijeni
  • 5:58 - 6:01
    se epidemitë e mëdha të gripit kanë qenë vdekjeprurëse përgjatë globit.
  • 6:01 - 6:04
    ELA: Nëse nuk jeni ende të bindur,
  • 6:04 - 6:06
    nivelet e ujërave po rritet,
  • 6:06 - 6:09
    po ashtu edhe niveli i CO2 dhe temperatura globale.
  • 6:09 - 6:12
    JM: Ndoshta do të duhej ta shiqoni pikërisht këtë n-gram,
  • 6:12 - 6:15
    e kjo vetëm për ti tregu Niçes se Zoti nuk ka vdek.
  • 6:15 - 6:18
    edhe pse edhe ju ndoshta pajtoheni se ai ka nevoje për ndonjë publicist më të mirë.
  • 6:18 - 6:20
    (Të qeshura)
  • 6:20 - 6:23
    Ju mund ti qaseni edhe disa koncepteve mjaft abstrajte me këtë metodë.
  • 6:23 - 6:25
    Për shembull, më lejoni t'ju rrëfej historinë e
  • 6:25 - 6:27
    vitit 1950.
  • 6:27 - 6:29
    Për shumicën e historisë
  • 6:29 - 6:31
    askujt s'ju ka bërë vonë për vitin 1950.
  • 6:31 - 6:33
    Në vitin 1700, 1800, 1900,
  • 6:33 - 6:36
    askush nuk është brengosur.
  • 6:37 - 6:39
    Gjatë viteve 30ta dhe 40ta,
  • 6:39 - 6:41
    askush nuk është brengosur.
  • 6:41 - 6:43
    Papritmas, në mesin e viteve 40ta,
  • 6:43 - 6:45
    filloi të bëhet zhurmë.
  • 6:45 - 6:47
    Njerëzit e kuptuan se viti 1950 do të vinte,
  • 6:47 - 6:49
    dhe do të mund të ishte madhështorë.
  • 6:49 - 6:52
    (Të qeshura)
  • 6:52 - 6:55
    Por asgjë nuk i tërhoqi vëmendjen njerëzve në vitin 1950
  • 6:55 - 6:58
    vetëm se veç viti 1950 në vete.
  • 6:58 - 7:01
    (Të qeshura)
  • 7:01 - 7:03
    Njerëzit shetisnin rreth e rrotul të obsesionuar.
  • 7:03 - 7:05
    Ata nuk mund të ndalonin së foluri
  • 7:05 - 7:08
    për gjërat që kishin bërë në vitin1950,
  • 7:08 - 7:11
    gjërat që kishin planifikuar se do ti bënin në vitin 1950,
  • 7:11 - 7:16
    gjithë ato ëndrra që kishin dëshiruar ti plotësonin në vitin 1950.
  • 7:16 - 7:18
    Në fakt, viti 1950 ishte aq i mahnitshëm
  • 7:18 - 7:20
    sa për vitet që do të vinin,
  • 7:20 - 7:23
    njerëzit do të flisnin për të gjitha gjërat e mrekullueshme që kanë ndodhur,
  • 7:23 - 7:25
    në '51tën, '52tën, '53tën.
  • 7:25 - 7:27
    Më në fund në vitin 1954,
  • 7:27 - 7:29
    dikush u kthjell dhe kuptoi
  • 7:29 - 7:33
    se disi 1950ta është zbehur.
  • 7:33 - 7:35
    (Të qeshura)
  • 7:35 - 7:37
    Dhe kështu, baloni pëlciti.
  • 7:37 - 7:39
    (Të qeshura)
  • 7:39 - 7:41
    Dhe tregimi i 1950tës
  • 7:41 - 7:43
    është tregimi i çdo viti të cilin e kemi regjistruar ne,
  • 7:43 - 7:46
    me pak ndryshime, sepse tani i kemi këto diagrame të mira.
  • 7:46 - 7:49
    Dhe sepse i kemi këto diagrame të mira, ne mundemi ti masim gjërat.
  • 7:49 - 7:51
    Ne mund të themi: "Sa shpejt mundet një balon të pëcals?"
  • 7:51 - 7:54
    Dhe siç po duket ne mundemi ta masim atë
  • 7:54 - 7:57
    Ekuacionet janë derivuar, grafiqet janë ndërtuar,
  • 7:57 - 7:59
    dhe rezultati i fundit
  • 7:59 - 8:02
    është se ne kemi konkluduar se baloni pëlcet shpejt e më shpejt
  • 8:02 - 8:04
    me çdo vit që kalon.
  • 8:04 - 8:09
    Ne po humbim interesimin për të kaluarën në mënyrë tejet të shpejtë.
  • 8:09 - 8:11
    JM: Tani një këshillë sa i përket karrierës.
  • 8:11 - 8:13
    Për ata që kërkojnë famën,
  • 8:13 - 8:15
    mund të mësojmë prej 25 figurave më të famshme të politikës,
  • 8:15 - 8:17
    autorëve, aktorëve e kështu me radhë.
  • 8:17 - 8:20
    Kështuqë pra, nëse doni të bëheni të famshëm qysh herët, duhet të bëheni aktor,
  • 8:20 - 8:22
    sepse atëherë fama fillon t'ju rritet kah mosha 20 vjeçare,
  • 8:22 - 8:24
    ju jeni ende të rinj, çka është e mrekullueshmë.
  • 8:24 - 8:26
    Nëse dëshironi të prisni pak, duhet të bëheni autor,
  • 8:26 - 8:28
    sepse atëherë mund të ngriteni në majat më të larta,
  • 8:28 - 8:30
    si shembull Mark Twain, më se i famshëm.
  • 8:30 - 8:32
    Por nëse doni të arrini majat e majave,
  • 8:32 - 8:34
    duhet të i vononi kënaqësitë
  • 8:34 - 8:36
    dhe natyrisht të bëheni një politikan.
  • 8:36 - 8:38
    Në këtë rast do të bëheni të famshëm kah mosha 50 vjeçare,
  • 8:38 - 8:40
    do të bëheni shumë, shumë të famshëm pastaj.
  • 8:40 - 8:43
    Poashtu edhe shkenctarët duken se bëhen të famshëm kur veçse janë më të moshuar.
  • 8:43 - 8:45
    Si shembull, biologët dhe fizikantët
  • 8:45 - 8:47
    duken se gati bëhen të famshëm sa vetë aktorët.
  • 8:47 - 8:50
    Një gabim nuk duhet ta bëni, e të bëheni matematicient.
  • 8:50 - 8:52
    (Të qeshura)
  • 8:52 - 8:54
    Nëse veç bëheni,
  • 8:54 - 8:57
    ju do të mendoni, "Për mrekulli, do ti realizoj punimet më të mira të miat në moshën 20 vjeçare."
  • 8:57 - 8:59
    Edhe a e dini, se askujt si bëhet vonë për këtë fakt.
  • 8:59 - 9:02
    (Të qeshura)
  • 9:02 - 9:04
    ELA: Ne mund të gjejmë shënime më të qarta
  • 9:04 - 9:06
    midis n-grameve.
  • 9:06 - 9:08
    Si shembull, ja trajektorja e Marc Chagall,
  • 9:08 - 9:10
    një artist i lindur në vitin 1887.
  • 9:10 - 9:13
    Dhe kjo duket si një trajektore normale e një personi të famshëm.
  • 9:13 - 9:17
    Ai bëhet gjithëmonë më i famshëm,
  • 9:17 - 9:19
    përveç se nëse shiqoni në gjuhën gjermane.
  • 9:19 - 9:21
    Nëse shiqoni në gjuhën gjermane, do të nuhasni diçka tërësisht bizare,
  • 9:21 - 9:23
    diçka që gati kurrë nuk do të shihni,
  • 9:23 - 9:25
    gjë që është se ai bëhet më se i famshëm
  • 9:25 - 9:27
    e pastaj papritmas merr teposhtëzën,
  • 9:27 - 9:30
    duke përjetuar një pikë të ultë midis viteve 1933 dhe 1945,
  • 9:30 - 9:33
    para se të tërhiqet pastaj.
  • 9:33 - 9:35
    Se çka po vërejmë natyrisht,
  • 9:35 - 9:38
    është fakti që Marc Chagall ishte një artist hebre
  • 9:38 - 9:40
    në një Gjermani Naziste.
  • 9:40 - 9:42
    Tani, këto sinjale
  • 9:42 - 9:44
    janë shumë të fortë
  • 9:44 - 9:47
    sa që neve nuk na nevojitet te jemi në dijeni se dikush ishte i çenzuruar.
  • 9:47 - 9:49
    Ne në fakt mund ta kuptojmë vetvetiu
  • 9:49 - 9:51
    duke shfrytëzuar procesimin e sinjaleve themelore.
  • 9:51 - 9:53
    Ja si është metoda më e thjeshtë për ta bërë.
  • 9:53 - 9:55
    Pritjet racionale
  • 9:55 - 9:57
    që fama e dikujt gjatë një periudhe kohore
  • 9:57 - 9:59
    do të duhet të jetë përafërsisht mesatarja e famës së tyre para
  • 9:59 - 10:01
    dhe pasi që veç ishin të famshëm.
  • 10:01 - 10:03
    Kjo është çka ne presim.
  • 10:03 - 10:06
    Dhe ne e krahasojmë me famën të cilën e vëzhgojmë.
  • 10:06 - 10:08
    Dhe veç i ndajmë njërën me tjetrën
  • 10:08 - 10:10
    për të prodhuar diçka që ne e quajmë indeksi i shuarjes.
  • 10:10 - 10:13
    Nëse ky indeks i shuarjes është tejet, tejet, tejet i vogël,
  • 10:13 - 10:15
    atëherë ju veçse jeni të shtypur.
  • 10:15 - 10:18
    Nëse ky indeks është i madh, ndoshta jeni duke përfituar nga propaganda.
  • 10:19 - 10:21
    JM: Tani ju mund të shihni
  • 10:21 - 10:24
    shpërndarjen e indekseve te shuarjeve nëpër popullatën e gjerë.
  • 10:24 - 10:26
    Pra si shembull këtu--
  • 10:26 - 10:28
    ky indeks i shuarjes është për 5,000 njerëz
  • 10:28 - 10:30
    të përzgjedhur nëpër libra anglez ku nuk ka pasur shtypje të njohur--
  • 10:30 - 10:32
    do të dukej diçka si kjo, pra e përqëndruar ngushtë në një.
  • 10:32 - 10:34
    Se çka prisni në parim është se çka vëzhgoni.
  • 10:34 - 10:36
    Kjo shpërndarje e parë në Gjermani--
  • 10:36 - 10:38
    shumë e ndryshme, është zhvendosur në të majtë.
  • 10:38 - 10:41
    Njerëzit kanë folur rreth saj dy herë më pak se është dashur.
  • 10:41 - 10:43
    Por çka është më me rëndësi, shpërndarja është më e gjerë.
  • 10:43 - 10:46
    Janë gjendur shumë njerëz të cilët kanë përfunduar në skajin e anës së majtë të shpërndarjes
  • 10:46 - 10:49
    të cilët kanë folur 10 herë më pak se është dashur.
  • 10:49 - 10:51
    Por në anën tjetër shumë njerëz në skajin e anës së djathtë
  • 10:51 - 10:53
    siç duket kanë përfituar nga propaganda.
  • 10:53 - 10:56
    Kjo fotografi është vula dalluese e çenzurës në librin e shënuar.
  • 10:56 - 10:58
    Pra kulturomikë
  • 10:58 - 11:00
    e quajmë ne këtë metodë.
  • 11:00 - 11:02
    Diçka e ngjashme me gjenomikën.
  • 11:02 - 11:04
    Përveç se gjenomika e vë nën thjerrëz biologjinë
  • 11:04 - 11:07
    nëpërmjet dritares së ndërtueme në sekuenca në bazë të gjenomit njerëzor.
  • 11:07 - 11:09
    Kulturomika është e ngjashme.
  • 11:09 - 11:12
    Paraqet aplikimin e analizës së të dhënave masive të mbledhura paraprakisht
  • 11:12 - 11:14
    për të studiuar kulturën njerëzore.
  • 11:14 - 11:16
    Tani këtu në vend se të shiqojmë nëpërmjet thjerrëzës së një gjenomi,
  • 11:16 - 11:19
    shiqojmë nëpërmjet thjerrëzës së pjesëve të digjitalizuara të regjistrave historik.
  • 11:19 - 11:21
    Mashështia e kulturomikës
  • 11:21 - 11:23
    është se çdokush mund ta bëj.
  • 11:23 - 11:25
    Pse çdokush mundet?
  • 11:25 - 11:27
    Gjithëkush do të ketë mundësi, sepse tre djem,
  • 11:27 - 11:30
    Jon Orwant, Matt Gray dhe Will Brockman në Google,
  • 11:30 - 11:32
    kur e kanë e parë prototipin e Ngram Viewer,
  • 11:32 - 11:34
    thanë, "Kjo duket shumë zbavitëse.
  • 11:34 - 11:37
    Do të duhet të jetë e disponueshme për njerëzit."
  • 11:37 - 11:39
    Për rrafsh dy javë--dy javë para se të publikohej artikulli ynë--
  • 11:39 - 11:42
    ata kodifikuan një version të Ngram Viewer për publikun e gjerë.
  • 11:42 - 11:45
    Dhe ju mund të shtypni ndonjë fjalë apo frazë e cila ju intereson
  • 11:45 - 11:47
    dhe ta shiqoni n-gram e tij menjiherë--
  • 11:47 - 11:49
    poashtu të shfletoni shembuj prej librave të ndryshëm
  • 11:49 - 11:51
    në të cilat n-grami juaj shfaqet.
  • 11:51 - 11:53
    JM: Tani ky apllikacion është shfrytëzuar një milionë herë në ditë e parë të tij,
  • 11:53 - 11:55
    dhe kjo ështe më e mirë prej të gjitha kërkimeve.
  • 11:55 - 11:58
    Kështuqë njerëzit duan të jenë më e mira e vetvetes, le të vënë hapin më të mirë përpara.
  • 11:58 - 12:01
    Por siç do të shihet njerëzit në shekullin e XVIII-të nuk janë brengosur shumë për atë gjë.
  • 12:01 - 12:04
    Njerëzit nuk kanë dashur të jenë në të mirën (fjala në angl. best) e tyre por në të mifën e tyre ( beft, një shkronjë e shkruar gabimisht, fraza mbetet pa kuptim).
  • 12:04 - 12:07
    Se çka ka ndodhur, natyrisht, ky është një gabim.
  • 12:07 - 12:09
    Nuk ishte ajo që u përpjek për mediokritet,
  • 12:09 - 12:12
    por shkronja S shkruhej pak më ndryshe, diçka si shkronja F.
  • 12:12 - 12:15
    Tani natyrisht, Google nuk mund ta haste në atë kohë,
  • 12:15 - 12:18
    kështu që ne e raportuam në artikullin që po shkruanim.
  • 12:18 - 12:20
    Por ajo doli të ishte vetëm një rikujtues
  • 12:20 - 12:22
    se edhe pse kjo është shumë zbavitëse,
  • 12:22 - 12:24
    kur i intepretoni këto grafiqe, duhet të keni shumë kujdes,
  • 12:24 - 12:27
    dhe ti përvetësoni standardet themelore shkencore.
  • 12:27 - 12:30
    ELA: Njerëzit e kanë shfrytëzuar këtë aplikacion për qëllime të ndryshme zbavitëse.
  • 12:30 - 12:37
    (Të qeshura)
  • 12:37 - 12:39
    Në fakt, ne nuk do të flasim më,
  • 12:39 - 12:42
    do t'ju paraqesim të gjitha faqet e prezentimit dhe do të jemi të qetë.
  • 12:42 - 12:45
    Ky person ishte i interesuar në historinë e frustrimit.
  • 12:45 - 12:48
    Ekzistojne lloje të ndryshme të frustrimit.
  • 12:48 - 12:51
    Nëse zeni në thua, në pasthirrmën tuaj "ah" gjendet vetëm një A.
  • 12:51 - 12:53
    Nëse planeti Tokë do të shkatërrohej tërësisht nga jashtëtokësorët Vogonë
  • 12:53 - 12:55
    për të liruar hapësirë për një bajpas ndëryjor,
  • 12:55 - 12:57
    në "Aaaaaaaah" do të gjindeshin tetë A-ja.
  • 12:57 - 12:59
    Ky person studio të gjitha pasthirrmat "ah",
  • 12:59 - 13:01
    prej me një deri tetë A-ja.
  • 13:01 - 13:03
    Dhe siç u pa
  • 13:03 - 13:05
    "ah"-et më pak të shpeshta
  • 13:05 - 13:08
    janë natyrisht ato të cilat korrespondojnë me gjërat më frustruese--
  • 13:08 - 13:11
    përveç çuditërisht në vitet e fillimit të 1980tës.
  • 13:11 - 13:13
    Ne mendojmë se kjo ka të bëj diçka me Reagan.
  • 13:13 - 13:15
    (Të qeshura)
  • 13:15 - 13:18
    JM: Këto të dhëna mund të shfrytëzohen në mënyra të ndryshme,
  • 13:18 - 13:21
    por çka duam të themi është se shënimet historike po digjitalizohen.
  • 13:21 - 13:23
    Google ka fillu digjitalizimin e 15 milionë librave.
  • 13:23 - 13:25
    Kjo është vetëm 12 përqind e të gjithë librave të botuar deri sot.
  • 13:25 - 13:28
    Paraqet një copë të konsiderueshme të kulturës njerëzore.
  • 13:28 - 13:31
    Kuptohet ka shumë më shumë gjëra në kulture si: dorëshkrimet, shtypi ditor,
  • 13:31 - 13:33
    gjërat që nuk përmbajnë tekst, si arti dhe pikturat.
  • 13:33 - 13:35
    E gjithë këto ndodhen në kompjuterët tanë,
  • 13:35 - 13:37
    në kompjuterët nëpër botë.
  • 13:37 - 13:40
    E kur gjithë këto ndodhin, do të transformojnë mënyrën se si ne
  • 13:40 - 13:42
    e kuptojmë te kaluarën, të tashmen tonë si dhe kulturën njerëzore.
  • 13:42 - 13:44
    Ju falemnderit shumë.
  • 13:44 - 13:47
    (Duartrokitje)
Title:
Çka kemi mësuar prej 5 milionë librave
Speaker:
Jean-Baptiste Michel + Erez Lieberman Aiden
Description:

A keni pasur rastin ta provoni Ngram Viewer prej Google labs? Është një mjet pas të cilit mund vareni e që ju lejon kërkimin e termeve-fjalëve si dhe ideve nga një bazë të dhënash prej 5 milionë librash nëpër shekuj. Erez Lieberman Aiden dhe Jean-Baptiste Michel na e rrëfejnë se si funksionin ky mjet si dhe befasitë të cilat ne mundemi ti mësojmë prej 500 milionë fjalëve.

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
13:48
Albana Deralla added a translation

Albanian subtitles

Revisions