YouTube

Got a YouTube account?

New: enable viewer-created translations and captions on your YouTube channel!

Hebrew subtitles

כיצד אנו יכולים להגן על האמת בעידן המידע הכוזב

חדשות כזב יכולות להניע בחירות, לדרדר כלכלות ולזרוע מחלוקת בחיי היומיום. מדען הנתונים סינאן אראל מבהיר כיצד ומדוע הן מתפשטות כל כך מהר - תוך שהוא מציין את אחד המחקרים הגדולים ביותר בנושא מידע כוזב - ומזהה חמש אסטרטגיות שיעזרו לנו להתיר את הסבך האינטרנטי בין אמת לשקר.

Get Embed Code
26 Languages

Showing Revision 83 created 01/27/2020 by Allon Sasson.

  1. ב 23 באפריל 2013,
  2. סוכנות הידיעות AP העלתה ציוץ בטוויטר.
  3. נאמר בו: "חדשות מרעישות:
  4. שני פיצוצים ארעו בבית הלבן
  5. וברק אובמה נפצע."
  6. הידיעה הזו צויצה מחדש כ-4000 פעם
    במשך פחות מחמש דקות,
  7. והפכה לאחר מכן לוויראלית.
  8. הציוץ הזה לא הכיל חדשות אמיתיות
    שפירסמה סוכנות הידיעות AP.

  9. למעשה אלה היו חדשות כזב, או "פייק ניוז",
  10. שהופצו על ידי האקרים סורים
  11. שהסתננו לחשבון הטוויטר של AP.
  12. מטרתם היתה לשבש סדרים בחברה,
    אבל הם שיבשו הרבה יותר.
  13. כי אלגוריתמים אוטומטיים של מסחר
  14. הגיבו מיד לתחושה שעורר הציוץ הזה,
  15. והחל מסחר שמבוסס על האפשרות
  16. שנשיא ארה"ב נפגע או נהרג
  17. בפיצוץ זה.
  18. וברגע שהם התחילו לצייץ,
  19. הם מיד גרמו לקריסת שוק המניות,
  20. כשנמחקו 140 מיליארד דולר
    של שווי הון ביום אחד.
  21. רוברט מולר, יועץ תובע מיוחד בארה"ב,

  22. הגיש כתבי אישום נגד 3 חברות רוסיות
  23. ו- 13 בני אדם רוסיים
  24. על קשירת קשר להונות את ארה"ב
  25. על ידי התערבות בבחירות 2016 לנשיאות.
  26. וכתב אישום זה מספר
  27. שסוכנות המחקר של האינטרנט
  28. היא זרוע הצללים של הקרמלין במדיה החברתית.
  29. במהלך הבחירות לנשיאות לבדו,
  30. מאמצי סוכנות האינטרנט
  31. הגיעו ל 126 מיליון בני אדם בפייסבוק, בארה"ב,
  32. שהעלו 3 מיליון ציוצים אישיים
  33. ושווי של 43 שעות תוכן ביוטיוב.
  34. שכולם היו כוזבים --
  35. מידע כוזב שנועד לזרוע מחלוקת
    בבחירות לנשיאות בארה"ב.
  36. מחקר שנערך לאחרונה על ידי
    אוניברסיטת אוקספורד

  37. הראה שבבחירות האחרונות בשוודיה,
  38. שליש מכל המידע שהתפשט ברשתות החברתיות
  39. אודות הבחירות
  40. היה כוזב או שגוי.
  41. בנוסף, סוגים אלה של קמפיינים שגויים
    ברשתות החברתיות

  42. עלולים להפיץ את מה שנקרא
    "תעמולה לרצח עם,"
  43. כמו למשל, נגד הרוהינגה בבורמה,
  44. ולעורר רצח בידי האספסוף בהודו.
  45. חקרנו את חדשות הכזב

  46. והתחלנו לחקור זאת לפני
    שזה הפך למונח פופולרי.
  47. ולאחרונה פירסמנו את מחקר האורך
    הגדול ביותר שנערך אי פעם
  48. על התפשטות חדשות הכזב ברשת
  49. על השער של ה"סייאנס" במרץ השנה.
  50. חקרנו את כל סיפורי החדשות
    שאומתו כאמיתיים וכוזבים
  51. שהתפשטו אי פעם בטוויטר,
  52. מראשיתו ב 2006 ועד 2017.
  53. וכשחקרנו את המידע הזה,
  54. חקרנו סיפורי חדשות מאומתים
  55. שאומתו על ידי 6 ארגונים עצמאיים,
    שבודקים את העובדות.
  56. כך ידענו אילו סיפורים היו נכונים
  57. ואילו סיפורים היו כוזבים.
  58. אנו יכולים למדוד את ההתפשטות שלהם,
  59. את מהירות ההתפשטות שלהם,
  60. את עומקה ורוחבה של ההתפשטות,
  61. כמה אנשים הסתבכו במפל מידע זה וכו'.
  62. ומה שעשינו עם מסמך זה
  63. היה להשוות את התפשטות חדשות האמת
    להתפשטות חדשות הכזב.
  64. והנה מה שמצאנו.
  65. גילינו שחדשות כזב נפוצו רחוק יותר, מהר יותר, עמוק יותר

  66. ובאופן הרבה יותר רחב מהאמת
  67. בכל קטגוריית מידע שחקרנו,
  68. לפעמים בסדר גודל.
  69. ולמעשה חדשות כזב פוליטיות
    היו הכי וויראליות .
  70. הן הופצו רחוק יותר, מהר יותר,
    עמוק ורחב יותר
  71. מכל סוג אחר של חדשות כזב.
  72. כשראינו את זה,
  73. היינו בו בזמן מודאגים, אבל גם סקרנים.
  74. מדוע?
  75. מדוע חדשות כזב מגיעות
    הרבה יותר רחוק, מהר, עמוק
  76. ובאופן רחב יותר מאשר האמת?
  77. ההשערה הראשונה שהעלינו היתה,

  78. "ובכן, אולי למפיצי חדשות כזב
    יש יותר עוקבים או נעקבים,
  79. או שהם מצייצים יותר הרבה,
  80. או שהם לרוב משתמשי טוויטר 'מאומתים'
    עם אמינות רבה יותר,
  81. או שאולי הם נמצאים בטוויטר יותר זמן."
  82. אז בדקנו כל אחד מאלה בזה אחר זה.
  83. ומה שמצאנו היה בדיוק ההיפך.
  84. למפרסמי חדשות כזב היו פחות עוקבים,
  85. הם עקבו אחר פחות אנשים, היו פחות פעילים,
  86. "מאומתים" לעתים פחות קרובות
  87. והיו בטוויטר תקופת זמן קצרה יותר
  88. ועדיין,
  89. חדשות כזב צוייצו מחדש בסבירות של 70%
    יותר מהאמת,
  90. כשמתחשבין בכל אלה ובגורמים רבים אחרים.
  91. אז הצטרכנו לבוא עם הסברים אחרים.

  92. והגינו משהו שקראנו לו "השערת חידוש."
  93. אם אתם קוראים את הספרות,
  94. ידוע היטב שתשומת לב אנושית נמשכת לחידושים.
  95. דברים שהם חדשים בסביבה.
  96. ואם אתם קוראים ספרות בנושאי סוציולוגיה,
  97. אתם יודעים שאנו אוהבים לשתף מידע חדשני.
  98. זה גורם לנו להיראות כמו מי שיש לו
    גישה למידע פנימי.
  99. ואנו זוכים במעמד על ידי הפצת מידע מסוג זה.
  100. אז מדדנו את החידוש של ציוץ שנכנס,
    אמיתי או כוזב.

  101. בהשוואה לאוסף שהאדם הזה ראה
  102. בטוויטר ב 60 הימים שקדמו לציוץ.
  103. אבל זה לא הספיק, כי חשבנו לעצמנו,
  104. "אולי ידיעות כוזבות חדשניות יותר
    במובן של מידע תיאורטי,
  105. אבל אולי אנשים לא תופסים זאת
    כיותר חדשניות."
  106. אז כדי להבין כיצד אנשים תופסים חדשות כזב,

  107. הסתכלנו על המידע והרגש
  108. שנכלל בתשובות לציוצים של אמת וכזב.
  109. ומה שמצאנו
  110. היה שלרוחב מקבץ של מדדי רגשות שונים --
  111. הפתעה, סלידה, פחד, עצב,
  112. ציפייה, שמחה ואמון --
  113. חדשות כזב הציגו יותר הפתעה וסלידה
    באופן משמעותי,
  114. בתשובות לציוצי כזב.
  115. וחדשות אמת הציגו ציפייה יותר משמעותית,
  116. שמחה ואמון
  117. בתשובות לציוצי אמת.
  118. ההפתעה מאמתת את השערת החידוש שלנו.
  119. זה חדש ומפתיע, ולכן סביר יותר שנשתף אותו.
  120. באותו זמן הוצגה עדות בקונגרס

  121. בפני שני בתי הקונגרס בארה"ב,
  122. שבוחנת את חלקם של הבוטים בהתפשטות
    של מידע מוטעה.
  123. אז הסתכלנו גם על זה --
  124. השתמשנו בכמה אלגוריתמים
    מזהי-בוט מתוחכמים
  125. כדי למצוא את הבוטים בנתונים שלנו
    ולשלוף אותם החוצה.
  126. שלפנו אותם החוצה, והחזרנו אותם פנימה
  127. והשווינו את מה שקרה למדידות שלנו.
  128. ומה שמצאנו היה שאכן,
  129. בוטים האיצו את התפשטות חדשות הכזב ברשת,
  130. אבל הם האיצו גם את הפצת החדשות האמיתיות
  131. בשיעור זהה בקירוב,
  132. מה שאומר שבוטים אינם אחראים
  133. לפיזור הדיפרנציאלי של אמת וכזב ברשת.
  134. איננו יכולים להתנער מאחריות זו,
  135. משום שאנחנו, בני האדם, אחראים להתפשטות זו.
  136. כל מה שסיפרתי לכם עד כה,

  137. לרוע המזל של כולנו,
  138. אלה החדשות הטובות.
  139. וזה משום שהדבר עומד להחמיר הרבה יותר.

  140. ושתי טכנולוגיות ספציפיות עומדות
    להחמיר את זה.
  141. אנחנו עומדים לראות עלייה של גל אדיר
    של מדיה סינתטית.
  142. וידאו כוזב, שמע כוזב, שמשכנעים מאוד
    את העין האנושית.
  143. וזה יונע על ידי שתי טכנולוגיות.
  144. הראשונה מהן מוכרת
    כ"רשתות גנרטיביות יריבות."

  145. זהו מודל למידת מכונה עם שתי רשתות:
  146. מאבחן,
  147. שתפקידו להבחין אם משהו הינו אמיתי או כוזב,
  148. וגנרטור,
  149. שתפקידו להפיק מדיה סינתטית.
  150. כך שהגנרטור הסינתטי מפיק וידאו
    או אודיו סינתטיים,
  151. והמאבחן מנסה לומר,
    "האם זה אמיתי או כוזב?"
  152. ולמעשה זה תפקידו של הגנרטור
  153. למקסם את הדמיון שישטה במאבחן
  154. לחשוב שהווידאו והאודיו הסינתטיים שהוא יוצר
  155. הם למעשה אמיתיים.
  156. דמיינו מכונה בהייפרלופ,
  157. מנסה להשתפר יותר ויותר בלשטות בנו.
  158. זאת בשילוב עם הטכנולוגיה השנייה,

  159. שהיא בעצם הדמוקרטיזציה של
    בינה מלאכותית לעם,
  160. היכולת של כל אחד,
  161. ללא שום רקע בבינה מלאכותית
  162. או למידת מכונה,
  163. להשתמש בסוגים אלה של אלגוריתמים
    כדי לייצר מדיה סינתטית
  164. הופך את יצירת סרטוני הוידאו, בסופו של דבר,
    הרבה יותר קלה .
  165. הבית הלבן פירסם סרטון וידאו מזויף

  166. על אינטראקציה בין עיתונאי למתמחה
    שניסה לקחת את המיקרופון שלו.
  167. הם הסירו פריימים מהסרטון הזה.
  168. כדי לגרום לפעולותיו להיראות יותר תוקפניות.
  169. וכאשר צלמי וידאו מקצועיים פעלולנים,
    וכפילים וכפילות
  170. התראיינו על סוג זה של טכניקה,
  171. הם אמרו, "כן, אנחנו משתמשים בזה
    בסרטים כל הזמן
  172. כדי להפוך את האגרופים והבעיטות שלנו
    להיראות יותר סוערים ויותר אגרסיביים."
  173. לאחר מכן הם פירסמו את הוידאו
  174. ובמידת מה השתמשו בו כהצדקה
  175. לשלול מהעיתונאי ג'ים אקוסטה את תעודת
    הכניסה לעיתונאים
  176. לבית הלבן.
  177. ו- CNN נאלצו לתבוע כדי שתעודת העיתונאי
    הזו תונפק מחדש.
  178. אני יכול לחשוב על כחמש דרכים שונות
    שנוכל בעזרתן

  179. לנסות ולטפל בכמה מהבעיות הקשות ביותר.
  180. בכל אחת מהן יש הבטחה,
  181. אבל לכל אחת מהן יש אתגרים משלה.
  182. הראשונה היא תיוג,
  183. חישבו על זה כך:
  184. כשאתם הולכים לקנות מוצרי מזון במכולת,
  185. הם מתויגים בהרחבה.
  186. ניתן לדעת כמה קלוריות יש בהם,
  187. כמה שומן הם מכילים --
  188. אבל כשאנו צורכים מידע עדיין
    אין לנו תוויות כלשהן.
  189. מה כלול במידע הזה?
  190. האם המקור אמין?
  191. מהיכן המידע הזה נאסף?
  192. אין לנו שום דבר מסוג זה
  193. כשאנו צורכים מידע.
  194. זוהי דרך שיש בה פוטנציאל,
    אבל גם אתגרים משלה.
  195. למשל, מי המחליט בחברה,
    מה נכון ומה כוזב?
  196. האם הממשלות?
  197. האם זה פייסבוק?
  198. האם זה מַאֲגָד עצמאי של בודקי עובדות?
  199. ומי בודק את בודקי העובדות?
  200. דרך פוטנציאלית נוספת היא תמריצים.

  201. אנו יודעים שבמהלך הבחירות לנשיאות ארה"ב
  202. הגיע ממקדוניה גל של מידע כוזב
  203. שלא היה לו כל מניע פוליטי
  204. אבל לעומת זה היה לו מניע כלכלי.
  205. והמניע הכלכלי הזה היה קיים,
  206. כי חדשות כזב מתפשטות
    הרבה יותר רחוק, ומהר
  207. ועמוק יותר מהאמת,
  208. וכשהם מושכים תשומת לב ניתן להרוויח
    מהפרסום
  209. של סוג כזה של מידע.
  210. אבל אם נוכל לדכא את התפשטות המידע הזה,
  211. אולי הדבר יצמצם את התמריץ הכלכלי
  212. לייצר אותו בכלל, מלכתחילה.
  213. כדרך שלישית, אפשר לחשוב על רגולציה,

  214. וכמובן שעלינו לחשוב על אפשרות זו.
  215. בארצות הברית, נכון לעכשיו,
  216. אנו חוקרים מה עלול לקרות
    אם פייסבוק ואחרים, יהיו תחת רגולציה.
  217. בעוד שלוקחים בחשבון דברים כמו
    הסדרת השיחה הפוליטי,
  218. תיוג העובדה שזה שיח פוליטי,
  219. מוודאים ששחקנים זרים לא יכולים
    לממן שיח פוליטי,
  220. יש לזה גם סכנות משלו.
  221. למשל, מלזיה זה עתה חוקקה
    עונש מאסר של 6 שנים
  222. לכל מי שנמצא מפיץ מידע כוזב.
  223. ובמשטרים אוטוריטריים,
  224. שימוש במדיניות מסוג זה יכול לשמש
    לדיכוי דעות של מיעוטים
  225. ולהמשיך להרחיב את הדיכוי.
  226. האופציה הרביעית האפשרית היא שקיפות.

  227. אנו רוצים לדעת כיצד פועלים
    האלגוריתמים של פייסבוק.
  228. איך הנתונים משתלבים עם האלגוריתמים
  229. כדי לייצר את התוצאות שאנחנו רואים?
  230. אנו רוצים שהם יחשפו מידע פנימי
  231. ויראו לנו בדיוק את הפעולות הפנימיות
    לפיהן פייסבוק עובדת,
  232. ואם נרצה לדעת מהי השפעתה של
    המדיה החברתית,
  233. נזדקק שלמדענים, חוקרים ואחרים
  234. תהיה גישה לסוג זה של מידע.
  235. אבל באותו זמן,
  236. אנחנו מבקשים מפייסבוק לנעול את הכל,
  237. כדי לשמור על אבטחת כל הנתונים.
  238. וכך פייסבוק ופלטפורמות מדיה חברתית אחרות

  239. עומדות בפני מה שאני מכנה פרדוקס שקיפות.
  240. אנחנו מבקשים מהם בה בעת,
  241. להיות פתוחים ושקופים ובו בזמן מאובטחים.
  242. יהיה קשה לנווט במיומנות בדרך עקלקלה
  243. אבל הם יצטרכו לעשות זאת אם ירצו
  244. להגשים את יעדי הטכנולוגיה החברתית
  245. תוך הימנעות מהסיכונים.
  246. הדבר האחרון שיכולנו לחשוב עליו הוא
    אלגוריתמים ולמידת מכונה.

  247. טכנולוגיה שתבין את התפשטות חדשות הכזב
  248. ותשרש אותן. ותנסה לדכא את זרימתן.
  249. צריך להיות מעודכנים בכל מה שנוגע
    לטכנולוגיה זו,
  250. כי לעולם לא נוכל לברוח מכך
  251. שבבסיס כל פיתרון או גישה טכנולוגית
  252. מונחת שאלה אתית או פילוסופית בסיסית
  253. כיצד אנו מגדירים אמיתי וכוזב.
  254. למי אנו נותנים את הכוח להגדיר אמת או שקר.
  255. ואילו דעות הן לגיטימיות,
  256. איזה סוג של דיבור צריך להיות מותר, וכו'.
  257. טכנולוגיה אינה הפיתרון לכך.
  258. אתיקה ופילוסופיה הן הפתרון לזה.
  259. כמעט בכל תיאוריה של קבלת החלטות אנושית

  260. שיתוף פעולה אנושי ותיאום אנושי
  261. יש תחושה מסוימת של אמת בבסיסה.
  262. אבל עם עלייתן של חדשות הכזב,
  263. עליית הסרטונים המזויפים,
  264. עלייתו של האודיו המזויף,
  265. אנחנו מתנודדים על סף סופה של המציאות,
  266. שבה איננו יכולים להבדיל בין אמיתי למזויף
  267. וזה עלול להיות מסוכן מאין כמוהו.
  268. עלינו להיות ערניים בהגנה על האמת

  269. כנגד מידע מזויף.
  270. עם הטכנולוגיות שלנו, עם המדיניות שלנו
  271. ואולי, הכי חשוב,
  272. עם האחריות האישית שלנו,
  273. וההחלטות, ההתנהגות והמעשים.
  274. תודה רבה לכם.

  275. (מחיאות כפיים)