1 00:00:00,738 --> 00:00:02,735 Se você lembra da primeira década da Internet, 2 00:00:02,735 --> 00:00:04,990 era um lugar bem estático. 3 00:00:04,990 --> 00:00:07,235 Dava para entrar na Internet, olhar as páginas, 4 00:00:07,235 --> 00:00:09,748 e elas eram criadas ou por organizações 5 00:00:09,748 --> 00:00:11,269 que tinham equipes para isso 6 00:00:11,269 --> 00:00:13,498 ou por "experts" em tecnologia 7 00:00:13,498 --> 00:00:15,235 para a época. 8 00:00:15,235 --> 00:00:16,810 E com a ascenção da mídia social 9 00:00:16,810 --> 00:00:19,209 e redes sociais no início dos anos 2000, 10 00:00:19,209 --> 00:00:21,358 a Internet mudou completamente 11 00:00:21,358 --> 00:00:24,966 para um lugar onde, agora, a grande maioria do conteúdo 12 00:00:24,966 --> 00:00:28,278 com que interagimos é criado por usuários comuns, 13 00:00:28,278 --> 00:00:30,975 seja em vídeos no YouTube ou "posts" em "blogs" 14 00:00:30,975 --> 00:00:33,890 ou críticas de produtos ou "posts" em mídia social. 15 00:00:33,890 --> 00:00:36,637 E também se tornou um lugar muito mais interativo, 16 00:00:36,637 --> 00:00:39,274 onde pessoas interagem umas com as outras, 17 00:00:39,274 --> 00:00:40,970 estão comentando, compartilhando, 18 00:00:40,970 --> 00:00:42,294 não estão só lendo. 19 00:00:42,294 --> 00:00:44,450 E o Facebook não é o único lugar para isso, 20 00:00:44,450 --> 00:00:45,548 mas é o maior, 21 00:00:45,548 --> 00:00:47,332 e serve para ilustrar os números. 22 00:00:47,332 --> 00:00:50,809 O Facebook tem 1,2 bilhões de usuários por mês. 23 00:00:50,809 --> 00:00:52,739 Metade da população da Internet 24 00:00:52,739 --> 00:00:54,392 usa o Facebook. 25 00:00:54,392 --> 00:00:56,454 Eles são um "site" que, junto com outros, 26 00:00:56,454 --> 00:00:59,543 permitiu que as pessoas criassem personalidades virtuais 27 00:00:59,543 --> 00:01:01,325 com pouca habilidade técnica, 28 00:01:01,325 --> 00:01:03,801 e as pessoas reagiram colocando muitos 29 00:01:03,801 --> 00:01:05,784 dados pessoais "online". 30 00:01:05,784 --> 00:01:07,957 E o resultado é que temos dados 31 00:01:07,957 --> 00:01:10,313 de comportamento, de preferências e demográficos 32 00:01:10,313 --> 00:01:12,414 para centenas de milhares de pessoas, 33 00:01:12,414 --> 00:01:14,440 o que nunca aconteceu antes na história. 34 00:01:14,440 --> 00:01:16,610 E como cientista da computação, isto quer dizer 35 00:01:16,610 --> 00:01:18,664 que fui capaz de criar modelos 36 00:01:18,664 --> 00:01:22,196 que podem prever todo tipo de característica oculta de vocês 37 00:01:22,196 --> 00:01:23,810 e vocês nem sabem que estão compartilhando 38 00:01:23,810 --> 00:01:25,472 informações sobre isso. 39 00:01:25,472 --> 00:01:27,854 Como cientistas, usamos isso para ajudar 40 00:01:27,854 --> 00:01:29,968 as pessoas a interagirem "online", 41 00:01:29,968 --> 00:01:32,467 mas há aplicações menos altruístas, 42 00:01:32,467 --> 00:01:34,848 e há um problema em que os usuários não entendem 43 00:01:34,848 --> 00:01:37,318 realmente essas técnicas e como elas funcionam, 44 00:01:37,318 --> 00:01:40,276 e mesmo se entendessem, não têm muito controle sobre elas. 45 00:01:40,276 --> 00:01:42,136 O que quero lhes falar hoje 46 00:01:42,136 --> 00:01:44,638 são algumas dessas coisas que podemos fazer, 47 00:01:44,638 --> 00:01:47,401 e nos dar algumas ideias de como podemos avançar 48 00:01:47,401 --> 00:01:50,170 para devolver um pouco de controle aos usuários. 49 00:01:50,170 --> 00:01:51,756 Essa é a Target, a empresa. 50 00:01:51,756 --> 00:01:53,080 Eu não coloquei o logo 51 00:01:53,080 --> 00:01:54,960 na barriga desta pobre mulher grávida. 52 00:01:54,960 --> 00:01:57,400 Vocês talvez tenham visto essa piada publicada 53 00:01:57,400 --> 00:01:59,151 na revista Forbes, em que a Target 54 00:01:59,151 --> 00:02:01,512 enviou um panfleto para essa garota de 15 anos 55 00:02:01,512 --> 00:02:03,222 com propagandas e cupons 56 00:02:03,222 --> 00:02:05,776 para mamadeiras, fraldas e berços, 57 00:02:05,776 --> 00:02:07,740 duas semanas antes de ela contar aos seus pais 58 00:02:07,740 --> 00:02:09,594 que estava grávida. 59 00:02:09,594 --> 00:02:11,768 Pois é, o pai ficou muito bravo. 60 00:02:11,768 --> 00:02:13,744 Ele disse: "Como a Target descobriu 61 00:02:13,744 --> 00:02:15,568 que essa essa garota estava grávida 62 00:02:15,568 --> 00:02:17,528 antes de ela contar aos seus pais?" 63 00:02:17,528 --> 00:02:20,149 Acontece que eles têm um histórico de compras 64 00:02:20,149 --> 00:02:22,450 para centenas de milhares de clientes 65 00:02:22,450 --> 00:02:25,180 e eles calculam o que chamam de índice de gravidez, 66 00:02:25,180 --> 00:02:27,512 que não é só se uma mulher está grávida ou não, 67 00:02:27,512 --> 00:02:29,362 mas também quando o bebê deve nascer. 68 00:02:29,362 --> 00:02:30,546 E eles o calculam 69 00:02:30,546 --> 00:02:32,314 não com base nas coisas óbvias, 70 00:02:32,314 --> 00:02:34,826 como a compra de um berço e roupas de bebê, 71 00:02:34,826 --> 00:02:37,769 mas coisas como: "Ela comprou mais vitaminas 72 00:02:37,769 --> 00:02:39,486 do que normalmente compra", 73 00:02:39,486 --> 00:02:40,950 ou "Ela comprou uma bolsa 74 00:02:40,950 --> 00:02:42,661 que é grande o suficiente para guardar fraldas". 75 00:02:42,661 --> 00:02:44,571 E por si sós, essas compras não parecem 76 00:02:44,571 --> 00:02:47,040 revelar muita coisa, 77 00:02:47,040 --> 00:02:48,838 mas é um padrão de comportamento 78 00:02:48,838 --> 00:02:52,135 que, quando visto no contexto de milhares de outras pessoas, 79 00:02:52,135 --> 00:02:54,892 começa a revelar algumas ideias. 80 00:02:54,892 --> 00:02:56,685 É esse o tipo de coisa que fazemos 81 00:02:56,685 --> 00:02:59,252 quando prevemos coisas sobre vocês na mídia social. 82 00:02:59,252 --> 00:03:02,048 Buscamos por pequenos padrões de comportamento 83 00:03:02,048 --> 00:03:04,730 que, quando detectados entre milhões de pessoas, 84 00:03:04,730 --> 00:03:07,436 nos permitem descobrir todo tipo de coisa. 85 00:03:07,436 --> 00:03:09,183 Em meu laboratório e com colegas, 86 00:03:09,183 --> 00:03:10,960 desenvolvemos mecanismos através dos quais podemos 87 00:03:10,960 --> 00:03:12,520 prever coisas com muita precisão, 88 00:03:12,520 --> 00:03:14,245 como sua preferência política, 89 00:03:14,245 --> 00:03:17,997 seu índice de personalidade, gênero, orientação sexual, 90 00:03:17,997 --> 00:03:20,870 religião, idade, inteligência, 91 00:03:20,870 --> 00:03:22,264 junto com coisas como 92 00:03:22,264 --> 00:03:24,311 o quanto você confia nas pessoas que conhece 93 00:03:24,311 --> 00:03:26,005 e a força desses relacionamentos. 94 00:03:26,005 --> 00:03:27,790 Podemos fazer isso muito bem. 95 00:03:27,790 --> 00:03:29,987 E novamente, não vem do que pensaríamos 96 00:03:29,987 --> 00:03:32,089 que é informação óbvia. 97 00:03:32,089 --> 00:03:34,370 Meu exemplo preferido vem de um estudo 98 00:03:34,370 --> 00:03:37,390 publicado este ano nos Precedentes das Academias Nacionais. 99 00:03:37,405 --> 00:03:38,980 Se olharem no Google, vão achar. 100 00:03:38,980 --> 00:03:40,562 São quatro paginas, fácil de ler. 101 00:03:40,562 --> 00:03:43,425 E eles só observaram o que as pessoas curtiam no Facebook, 102 00:03:43,425 --> 00:03:45,485 só as coisas que vocês curtem no Facebook, 103 00:03:45,485 --> 00:03:47,623 e as usaram para prever características, 104 00:03:47,623 --> 00:03:49,268 junto com algumas outras. 105 00:03:49,268 --> 00:03:52,229 E no artigo, eles listaram as cinco "curtidas" 106 00:03:52,229 --> 00:03:55,016 que mais indicavam alta inteligência. 107 00:03:55,016 --> 00:03:57,340 E entre eles estava uma página 108 00:03:57,340 --> 00:03:59,245 de fritas enroladas. (Risos) 109 00:03:59,245 --> 00:04:01,338 Fritas enroladas são deliciosas, 110 00:04:01,338 --> 00:04:03,868 Mas gostar delas não significa necessariamente 111 00:04:03,868 --> 00:04:05,948 que você é mais esperto que a média. 112 00:04:05,948 --> 00:04:09,155 Então, como é que um dos indicadores mais fortes 113 00:04:09,155 --> 00:04:10,725 de inteligência 114 00:04:10,725 --> 00:04:12,172 é curtir essa página, 115 00:04:12,172 --> 00:04:14,424 quando o conteúdo é totalmente irrelevante 116 00:04:14,424 --> 00:04:16,951 à característica que está sendo prevista? 117 00:04:16,951 --> 00:04:18,535 E acontece que temos que observar 118 00:04:18,535 --> 00:04:20,153 um monte de teorias implícitas 119 00:04:20,153 --> 00:04:22,722 para ver por que conseguimos fazer isso. 120 00:04:22,722 --> 00:04:25,795 Uma delas é uma teoria sociológica chamada homofilia, 121 00:04:25,795 --> 00:04:28,727 que basicamente diz que as pessoas ficam amigas de pessoas como elas. 122 00:04:28,727 --> 00:04:31,151 Se você é esperto, seus amigos devem ser espertos, 123 00:04:31,151 --> 00:04:33,371 Se você é jovem, seus amigos devem ser jovens, 124 00:04:33,371 --> 00:04:34,998 e isso foi bem estabelecido 125 00:04:34,998 --> 00:04:36,743 por centenas de anos. 126 00:04:36,743 --> 00:04:37,975 Também sabemos muito 127 00:04:37,975 --> 00:04:40,525 sobre como a informação se propaga pelas redes. 128 00:04:40,525 --> 00:04:42,339 Pelo jeito, coisas como vídeos virais 129 00:04:42,339 --> 00:04:44,685 ou "curtidas" no Facebook ou outras informações 130 00:04:44,685 --> 00:04:46,573 se espalham exatamente do mesmo jeito 131 00:04:46,573 --> 00:04:49,027 que doenças se espalham por redes sociais. 132 00:04:49,027 --> 00:04:50,818 Estudamos isso por muito tempo. 133 00:04:50,818 --> 00:04:52,394 Temos bons modelos disso. 134 00:04:52,394 --> 00:04:54,551 E podemos juntar essas coisas 135 00:04:54,551 --> 00:04:57,639 e começar a ver por que essas coisas acontecem. 136 00:04:57,639 --> 00:04:59,453 Se fosse para criar uma hipótese, 137 00:04:59,453 --> 00:05:02,650 seria que um cara esperto criou essa página, 138 00:05:02,650 --> 00:05:04,619 ou talvez um dos primeiros que curtiu a página 139 00:05:04,619 --> 00:05:06,355 teria se saído bem naquele teste. 140 00:05:06,355 --> 00:05:08,643 E ele curtiu, e seus amigos viram, 141 00:05:08,643 --> 00:05:11,765 e por homofilia, provavelmente ele tinha amigos espertos, 142 00:05:11,765 --> 00:05:14,551 e assim se espalhou para eles, e alguns deles curtiram, 143 00:05:14,551 --> 00:05:16,760 e eles tinham amigos espertos, e assim se espalhou para eles, 144 00:05:16,760 --> 00:05:19,060 e assim se propagou pela rede 145 00:05:19,060 --> 00:05:21,359 para uma série de pessoas espertas, 146 00:05:21,359 --> 00:05:23,155 de modo que, ao final, 147 00:05:23,155 --> 00:05:25,959 o ato de curtir a página das fritas enroladas 148 00:05:25,959 --> 00:05:27,574 indica alta inteligência, 149 00:05:27,574 --> 00:05:29,377 não por causa do conteúdo, 150 00:05:29,377 --> 00:05:31,899 mas porque o ato de curtir em si 151 00:05:31,899 --> 00:05:33,799 reflete as características em comum 152 00:05:33,799 --> 00:05:36,267 de outras pessoas que também curtiram. 153 00:05:36,267 --> 00:05:39,164 Coisa bastante complicada, certo? 154 00:05:39,164 --> 00:05:41,363 É difícil sentar e explicar 155 00:05:41,363 --> 00:05:44,211 para um usuário comum, e mesmo se o fizer, 156 00:05:44,211 --> 00:05:46,399 o que o usuário comum pode fazer a respeito? 157 00:05:46,399 --> 00:05:48,447 Como saber que você curtiu uma coisa 158 00:05:48,447 --> 00:05:49,939 que indica um traço seu 159 00:05:49,939 --> 00:05:53,484 que é totalmente irrelevante ao conteúdo do que você curtiu? 160 00:05:53,484 --> 00:05:56,030 Há muito poder que os usuários não têm 161 00:05:56,030 --> 00:05:58,260 para controlar como esses dados são usados. 162 00:05:58,260 --> 00:06:01,372 E eu vejo isso como um verdadeiro problema avançando. 163 00:06:01,372 --> 00:06:04,359 Acho que há dois caminhos que podemos observar, 164 00:06:04,359 --> 00:06:06,260 se quisermos dar ao usuário o controle 165 00:06:06,260 --> 00:06:08,000 sobre a utilização desses dados, 166 00:06:08,000 --> 00:06:09,940 porque nem sempre serão usados 167 00:06:09,940 --> 00:06:11,321 para seu benefício. 168 00:06:11,321 --> 00:06:12,743 Um exemplo que eu sempre uso: 169 00:06:12,743 --> 00:06:14,389 se eu me cansar de ser professora, 170 00:06:14,389 --> 00:06:16,042 eu vou abrir uma empresa 171 00:06:16,042 --> 00:06:17,496 que prevê as características 172 00:06:17,496 --> 00:06:19,208 e coisas como trabalho em equipe 173 00:06:19,208 --> 00:06:21,769 e se você é usuário de drogas, se é um alcoólatra. 174 00:06:21,769 --> 00:06:23,209 Sabemos como prever isso tudo. 175 00:06:23,209 --> 00:06:24,970 E vou vender relatórios 176 00:06:24,970 --> 00:06:27,070 para empresas de RH e grandes empresas 177 00:06:27,070 --> 00:06:28,933 que queiram te contratar. 178 00:06:28,933 --> 00:06:30,520 Podemos fazer isso agora. 179 00:06:30,520 --> 00:06:32,308 Eu poderia abrir essa empresa amanhã, 180 00:06:32,308 --> 00:06:34,360 e você não teria qualquer controle 181 00:06:34,360 --> 00:06:36,498 de como eu uso seus dados desse jeito. 182 00:06:36,498 --> 00:06:38,790 Para mim, isso parece um problema. 183 00:06:38,790 --> 00:06:40,700 Então, um dos caminhos que podemos seguir 184 00:06:40,700 --> 00:06:42,732 é o caminho da política e da lei. 185 00:06:42,732 --> 00:06:45,778 E em alguns aspectos, acho que assim seria mais eficiente, 186 00:06:45,778 --> 00:06:48,534 mas o problema é que teríamos mesmo que fazer. 187 00:06:48,534 --> 00:06:51,314 Observar nosso processo político em ação 188 00:06:51,314 --> 00:06:53,693 me faz pensar que é altamente improvável 189 00:06:53,693 --> 00:06:57,280 que vamos juntar um monte de representantes, mostrá-lhes isso, 190 00:06:57,280 --> 00:06:59,382 e fazer que decretem mudanças extensas 191 00:06:59,382 --> 00:07:01,539 à lei da propriedade intelectual nos EUA 192 00:07:01,539 --> 00:07:03,760 para que os usuários controlem seus dados. 193 00:07:03,760 --> 00:07:05,294 Ou seguir a rota da política, 194 00:07:05,294 --> 00:07:06,783 em que empresas de mídia social dizem: 195 00:07:06,783 --> 00:07:08,365 "Sabe? Você é dono de seus dados. 196 00:07:08,365 --> 00:07:10,754 Você tem total controle sobre como eles são usados." 197 00:07:10,754 --> 00:07:12,522 O problema são os modelos de receita 198 00:07:12,522 --> 00:07:14,246 para a maioria das empresas de mídia social 199 00:07:14,246 --> 00:07:18,277 que se baseiam no compartilhamento ou exploração dos dados dos usuários. 200 00:07:18,277 --> 00:07:20,110 Dizem do Facebook que os usuários 201 00:07:20,110 --> 00:07:22,638 não são os clientes, eles são o produto. 202 00:07:22,638 --> 00:07:25,352 Então, como fazemos com que uma empresa 203 00:07:25,352 --> 00:07:27,910 ceda o controle de seu principal bem 204 00:07:27,910 --> 00:07:29,159 aos usuários? 205 00:07:29,159 --> 00:07:31,080 É possível, mas não acho que seja algo 206 00:07:31,080 --> 00:07:33,180 que veremos acontecer rapidamente. 207 00:07:33,180 --> 00:07:34,680 E eu acho que o outro caminho 208 00:07:34,680 --> 00:07:36,968 que podemos seguir e que será mais eficiente 209 00:07:36,968 --> 00:07:38,476 é um mais científico. 210 00:07:38,476 --> 00:07:40,986 É usar a ciência que nos permitiu desenvolver 211 00:07:40,986 --> 00:07:42,736 todos esses mecanismos para calcular 212 00:07:42,736 --> 00:07:44,788 esses dados pessoais a princípio. 213 00:07:44,788 --> 00:07:46,894 E é, de fato, uma pesquisa muito similar 214 00:07:46,894 --> 00:07:48,332 que teríamos que fazer, 215 00:07:48,332 --> 00:07:50,718 se quisermos desenvolver mecanismos 216 00:07:50,718 --> 00:07:52,139 que possam dizer ao usuário: 217 00:07:52,139 --> 00:07:54,478 "Aqui está o risco do que você acabou de fazer." 218 00:07:54,478 --> 00:07:56,448 Ao curtir aquela página do Facebook, 219 00:07:56,448 --> 00:07:58,983 ou ao compartilhar essa informação pessoal, 220 00:07:58,983 --> 00:08:00,485 você melhorou minha capacidade 221 00:08:00,485 --> 00:08:02,571 de prever se você usa drogas ou não, 222 00:08:02,571 --> 00:08:05,433 ou se você se dá bem no ambiente de trabalho ou não. 223 00:08:05,433 --> 00:08:07,281 E isso, acredito, pode influenciar 224 00:08:07,281 --> 00:08:08,791 a decisão de compartilhar algo, 225 00:08:08,791 --> 00:08:11,690 manter privado ou manter inteiramente "offline". 226 00:08:11,690 --> 00:08:13,593 Também podemos observar coisas como 227 00:08:13,593 --> 00:08:16,481 permitir que as pessoas encriptem os dados que elas enviam, 228 00:08:16,481 --> 00:08:18,176 para que sejam invisíveis e inúteis 229 00:08:18,176 --> 00:08:19,607 a "sites" como o Facebook 230 00:08:19,607 --> 00:08:22,236 ou serviços de terceiros que os acessem, 231 00:08:22,236 --> 00:08:25,483 mas a usuários selecionados, que a pessoa que postou 232 00:08:25,483 --> 00:08:28,153 quer que os vejam, tenham acesso. 233 00:08:28,153 --> 00:08:30,319 Tudo isso é uma pesquisa superlegal 234 00:08:30,319 --> 00:08:31,939 de uma perspectiva intelectual. 235 00:08:31,939 --> 00:08:33,988 Os cientistas estarão dispostos a fazê-la. 236 00:08:33,988 --> 00:08:37,118 Isso nos dá uma vantagem sobre o lado da lei. 237 00:08:37,118 --> 00:08:39,133 Um dos problemas que as pessoas levantam 238 00:08:39,133 --> 00:08:40,728 quando falo disso é que elas dizem: 239 00:08:40,728 --> 00:08:43,534 "Sabe, se todos começarem a manter esses dados privados, 240 00:08:43,534 --> 00:08:45,487 todos os métodos que você desenvolveu 241 00:08:45,487 --> 00:08:48,140 para prever seus traços vão falhar. 242 00:08:48,140 --> 00:08:51,660 E eu digo "com certeza", e para mim isso é sucesso, 243 00:08:51,660 --> 00:08:53,446 porque como cientista, 244 00:08:53,446 --> 00:08:57,134 meu objetivo não é inferir informações sobre os usuários, 245 00:08:57,134 --> 00:08:59,901 é melhorar o jeito como as pessoas interagem "online". 246 00:08:59,901 --> 00:09:03,119 E, às vezes, isso envolve inferir coisas sobre elas, 247 00:09:03,119 --> 00:09:06,141 mas se os usuários não quiserem que eu use esses dados, 248 00:09:06,141 --> 00:09:08,179 acho que eles deveriam ter esse direito. 249 00:09:08,179 --> 00:09:10,830 Quero que os usuários estejam cientes e de acordo, 250 00:09:10,830 --> 00:09:12,942 usuários das ferramentas que desenvolvemos. 251 00:09:12,942 --> 00:09:15,894 Então, acredito que encorajar esse tipo de ciência 252 00:09:15,894 --> 00:09:17,240 e apoiar pesquisadores 253 00:09:17,240 --> 00:09:20,263 que querem ceder um pouco desse controle aos usuários 254 00:09:20,263 --> 00:09:22,574 e tirá-lo das empresas de mídia social 255 00:09:22,574 --> 00:09:26,201 significa que avançar, enquanto essas ferramentas evoluem e avançam, 256 00:09:26,201 --> 00:09:27,885 significa que vamos ter uma base 257 00:09:27,885 --> 00:09:29,829 de usuários instruídos e capacitados, 258 00:09:29,829 --> 00:09:31,469 e acho que todos concordamos 259 00:09:31,469 --> 00:09:33,493 que esse é o jeito ideal de avançar. 260 00:09:33,493 --> 00:09:34,927 Obrigada. 261 00:09:34,927 --> 00:09:37,397 (Aplausos)