WEBVTT 00:00:00.738 --> 00:00:02.735 Se recordam a primeira década da Internet, 00:00:02.735 --> 00:00:04.990 era um lugar estático. 00:00:04.990 --> 00:00:07.235 Podíamos entrar online, podíamos ver páginas, 00:00:07.235 --> 00:00:11.248 criadas por organizações com equipas para o efeito, 00:00:11.269 --> 00:00:15.228 ou por pessoas de grande saber tecnológico para a altura. 00:00:15.235 --> 00:00:19.180 Com o crescimento dos "media" sociais e das redes sociais, no início do milénio, 00:00:19.209 --> 00:00:21.358 a Internet mudou completamente, 00:00:21.358 --> 00:00:24.966 tornou-se um lugar onde, em grande maioria, os conteúdos 00:00:24.966 --> 00:00:28.278 que usamos são disponibilizados por utilizadores comuns, 00:00:28.278 --> 00:00:30.975 sejam vídeos no Youtube, publicações em blogues, 00:00:30.975 --> 00:00:34.290 avaliações de produtos ou publicações nos "media" sociais. 00:00:34.290 --> 00:00:36.637 Tornou-se também um lugar muito mais interativo, 00:00:36.637 --> 00:00:39.274 onde as pessoas podem interagir umas com as outras, 00:00:39.274 --> 00:00:42.374 podem comentar, partilhar, não estão só a ler. NOTE Paragraph 00:00:42.374 --> 00:00:45.400 O Facebook não é o único lugar onde podemos fazer isso, 00:00:45.400 --> 00:00:47.318 mas é o maior e serve para ilustrar os números. 00:00:47.332 --> 00:00:50.809 O Facebook tem 1200 milhões de utilizadores por mês. 00:00:50.809 --> 00:00:54.379 Metade da população da Terra com Internet, usa o Facebook. 00:00:54.392 --> 00:00:56.324 É um site, tal como outros, 00:00:56.324 --> 00:00:59.543 que permite que as pessoas criem uma personagem virtual, 00:00:59.543 --> 00:01:01.325 sem ter conhecimentos técnicos 00:01:01.325 --> 00:01:03.801 e as pessoas reagiram publicando enormes quantidades 00:01:03.801 --> 00:01:05.784 de dados pessoais online. 00:01:05.784 --> 00:01:08.327 O resultado é que temos dados comportamentais, 00:01:08.327 --> 00:01:10.313 preferências e dados demográficos, 00:01:10.313 --> 00:01:12.414 de centenas de milhões de pessoas, 00:01:12.414 --> 00:01:14.440 uma situação sem precedentes na história. 00:01:14.440 --> 00:01:17.000 Enquanto informática, o que isto significa 00:01:17.000 --> 00:01:21.004 é que posso construir modelos para prever muitos tipos de atributos ocultos 00:01:21.004 --> 00:01:25.480 sobre todos vocês, sem sequer imaginarem que estão a partilhar essa informação. 00:01:25.480 --> 00:01:27.854 Enquanto cientistas, usamos isso para facilitar 00:01:27.854 --> 00:01:29.968 a forma como as pessoas interagem online, 00:01:29.968 --> 00:01:32.467 mas existem outras aplicações menos altruístas, 00:01:32.467 --> 00:01:34.848 e o problema é que os utilizadores 00:01:34.848 --> 00:01:37.318 não percebem estas técnicas nem como elas funcionam 00:01:37.318 --> 00:01:40.446 e, mesmo que entendessem, não têm grande controlo sobre elas. 00:01:40.446 --> 00:01:44.626 Portanto, quero falar-vos hoje das coisas que conseguimos fazer, 00:01:44.638 --> 00:01:47.401 e depois dar-vos algumas ideias sobre o que podemos fazer 00:01:47.401 --> 00:01:50.170 para devolver algum controlo aos utilizadores. NOTE Paragraph 00:01:50.170 --> 00:01:51.756 Esta é a companhia Target. 00:01:51.756 --> 00:01:55.240 — não fui eu que coloquei o logótipo na barriga da pobre mulher grávida — 00:01:55.250 --> 00:01:58.950 Talvez tenham visto a história que foi publicada na revista Forbes: 00:01:58.961 --> 00:02:01.512 a Target enviou um folheto a uma rapariga de 15 anos 00:02:01.512 --> 00:02:05.782 com publicidade e cupões para biberões, fraldas e berços, 00:02:05.782 --> 00:02:09.310 duas semanas antes de ela dizer aos pais que estava grávida. 00:02:09.324 --> 00:02:12.018 Pois, o pai ficou mesmo chateado e disse: 00:02:12.018 --> 00:02:15.784 "Como é que a Target descobriu que uma miúda do secundário estava grávida 00:02:15.784 --> 00:02:17.528 "antes de ela contar aos pais?" 00:02:17.528 --> 00:02:20.149 Acontece que eles têm o historial de compras 00:02:20.149 --> 00:02:22.450 de centenas de milhares de clientes 00:02:22.450 --> 00:02:25.180 e calculam o que chamam uma probabilidade de gravidez, 00:02:25.180 --> 00:02:29.232 que não só sabe se a mulher está grávida, como também a data provável de gestação. 00:02:29.242 --> 00:02:32.306 E calculam isso, não por observarem coisas óbvias, 00:02:32.314 --> 00:02:34.826 como ela comprar um berço ou roupas de bebé, 00:02:34.826 --> 00:02:39.449 mas coisas como ter comprado mais vitaminas do que é habitual, 00:02:39.449 --> 00:02:42.650 ou uma mala de mão grande o suficiente para carregar fraldas. 00:02:42.661 --> 00:02:47.051 Parece que estas compras não podem revelar grande coisa, em si mesmas, 00:02:47.051 --> 00:02:49.018 mas é um padrão de comportamento 00:02:49.018 --> 00:02:52.135 que, quando tomado no contexto de milhares de outras pessoas, 00:02:52.135 --> 00:02:54.892 começa de facto a revelar algumas pistas. 00:02:54.892 --> 00:02:56.685 É este tipo de coisas que fazemos 00:02:56.685 --> 00:02:59.612 para prever coisas sobre vocês nos "media" sociais. 00:02:59.612 --> 00:03:02.048 Procuramos pequenos padrões de comportamento 00:03:02.048 --> 00:03:04.730 que, quando detetados entre milhões de pessoas, 00:03:04.730 --> 00:03:07.436 nos permitem encontrar todo o tipo de coisas. NOTE Paragraph 00:03:07.436 --> 00:03:10.443 No meu laboratório, com colegas, desenvolvemos mecanismos 00:03:10.443 --> 00:03:14.230 para prever, com grande rigor, coisas como as vossas preferências políticas, 00:03:14.245 --> 00:03:17.997 a vossa personalidade, o género, a orientação sexual, 00:03:17.997 --> 00:03:20.870 a religião, a idade, a inteligência, 00:03:20.870 --> 00:03:22.264 juntamente com coisas como 00:03:22.264 --> 00:03:26.151 em que medida confiam nas vossas relações e se essas relações são fortes. 00:03:26.151 --> 00:03:30.000 Podemos fazer tudo isto, e bem. E, mais uma vez, não provém 00:03:30.000 --> 00:03:32.089 do que possam parecer informações óbvias. NOTE Paragraph 00:03:32.089 --> 00:03:34.370 O meu exemplo preferido é um estudo 00:03:34.370 --> 00:03:37.670 publicado este ano na revista "Proceedings of the National Academies". 00:03:37.670 --> 00:03:40.560 Encontram-no no Google — são quatro páginas, fáceis de ler. 00:03:40.562 --> 00:03:43.565 Eles analisam os "Gosto" no Facebook, 00:03:43.565 --> 00:03:45.485 as coisas de que vocês gostam, 00:03:45.485 --> 00:03:47.623 e usam-nas para prever todos esses atributos, 00:03:47.623 --> 00:03:49.268 juntamente com outros. 00:03:49.268 --> 00:03:55.009 No artigo, listam os cinco "Gosto" mais indiciadores de grande inteligência. 00:03:55.016 --> 00:03:58.480 Entre eles, estava: "gostar de uma página de batatas fritas encaracoladas". 00:03:58.490 --> 00:03:59.245 (Risos) 00:03:59.245 --> 00:04:01.338 Batatas fritas encaracoladas são deliciosas, 00:04:01.338 --> 00:04:03.868 mas gostar delas não significa necessariamente 00:04:03.868 --> 00:04:05.948 que somos mais inteligentes do que a média. 00:04:05.948 --> 00:04:09.155 Então, como é possível que um dos indicadores mais fortes 00:04:09.155 --> 00:04:12.165 da vossa inteligência seja gostar daquela página 00:04:12.175 --> 00:04:16.944 quando o conteúdo é totalmente irrelevante para o atributo que está a ser avaliado? 00:04:16.951 --> 00:04:20.295 Acontece que temos que olhar para uma série de teorias subjacentes 00:04:20.295 --> 00:04:22.722 para ver porque é que podemos fazer isto. 00:04:22.722 --> 00:04:25.635 Uma delas é uma teoria sociológica chamada homofilia, 00:04:25.635 --> 00:04:28.687 que diz que as pessoas são amigas de pessoas parecidas com elas. 00:04:28.687 --> 00:04:31.281 Se são inteligentes, tendem a ter amigos inteligentes, 00:04:31.281 --> 00:04:33.371 se são jovens, tendem a ter amigos jovens 00:04:33.371 --> 00:04:36.732 isto é uma verdade bem estabelecida, tem centenas de anos. 00:04:36.743 --> 00:04:40.525 Também sabemos muito sobre como a informação se espalha através das redes. 00:04:40.525 --> 00:04:44.699 Acontece que coisas como vídeos virais, "Gosto" no Facebook, ou outras informações 00:04:44.699 --> 00:04:48.899 se espalham exatamente da mesma maneira que as doenças se espalham na sociedade. 00:04:48.899 --> 00:04:51.118 Isto é uma coisa que estudamos há muito tempo. 00:04:51.118 --> 00:04:52.578 Temos bons modelos para isso. 00:04:52.578 --> 00:04:54.551 Portanto, podemos juntar estas coisas 00:04:54.551 --> 00:04:57.639 e começar a ver porque é que acontecem coisas como esta. 00:04:57.639 --> 00:04:59.453 Se eu quisesse formular uma hipótese, 00:04:59.453 --> 00:05:02.680 seria que foi um tipo inteligente que iniciou esta página, 00:05:02.680 --> 00:05:05.220 ou talvez que uma das primeiras pessoas a gostar dela 00:05:05.220 --> 00:05:06.355 pontuou alto no teste. 00:05:06.355 --> 00:05:08.643 Gostaram daquilo, e outros amigos viram, 00:05:08.643 --> 00:05:11.855 por homofilia, sabemos que provavelmente tinha amigos inteligentes, 00:05:11.855 --> 00:05:14.541 e assim espalhou por eles, e alguns gostaram 00:05:14.541 --> 00:05:16.960 e tinham amigos inteligentes e espalharam por esses 00:05:16.960 --> 00:05:21.350 e assim propagou-se pela rede a uma legião de pessoas inteligentes, 00:05:21.359 --> 00:05:23.115 de modo que, por fim, 00:05:23.115 --> 00:05:25.959 a ação de gostar da página das batatas fritas encaracoladas 00:05:25.959 --> 00:05:29.364 é indicadora de grande inteligência, não por causa do conteúdo, 00:05:29.377 --> 00:05:33.799 mas porque a ação de gostar reflete os atributos comuns 00:05:33.799 --> 00:05:36.267 de outras pessoas que fizeram o mesmo. NOTE Paragraph 00:05:36.267 --> 00:05:39.164 Isto é mesmo uma coisa bastante complicada, não é? 00:05:39.164 --> 00:05:41.363 É difícil sentarmo-nos e explicarmos 00:05:41.363 --> 00:05:44.211 a um utilizador vulgar e, mesmo que o façamos, 00:05:44.211 --> 00:05:46.399 o que pode o utilizador vulgar fazer? 00:05:46.399 --> 00:05:48.447 Como é que sabemos que gostar de uma coisa 00:05:48.447 --> 00:05:49.939 indica uma característica 00:05:49.939 --> 00:05:53.484 totalmente irrelevante para o conteúdo daquilo de que gostamos? 00:05:53.484 --> 00:05:58.260 Os utilizadores não têm o poder de controlar o uso dos dados 00:05:58.260 --> 00:06:01.372 e eu considero isso um problema real que está a agravar-se. NOTE Paragraph 00:06:01.372 --> 00:06:04.349 Portanto, penso que há algumas vias que devemos analisar 00:06:04.350 --> 00:06:06.260 para dar aos utilizadores algum controlo 00:06:06.260 --> 00:06:08.000 sobre o uso destes dados, 00:06:08.000 --> 00:06:09.940 porque nem sempre serão usados 00:06:09.940 --> 00:06:11.321 em seu benefício. 00:06:11.321 --> 00:06:14.383 Um exemplo que costumo usar, é que, se me fartar de ensinar, 00:06:14.389 --> 00:06:17.492 vou criar uma companhia que preveja estes atributos: 00:06:17.496 --> 00:06:20.616 se vocês trabalham bem em equipa, se são consumidores de drogas, 00:06:20.616 --> 00:06:21.968 se são alcoólicos. 00:06:21.968 --> 00:06:23.685 Sabemos como prever tudo isso. 00:06:23.685 --> 00:06:26.720 E vou vender relatórios às companhias de recursos humanos 00:06:26.720 --> 00:06:29.350 e às grandes empresas que pensem contratar-vos. 00:06:29.350 --> 00:06:30.826 Hoje, podemos fazê-lo. 00:06:30.826 --> 00:06:33.600 Eu podia iniciar esse negócio amanhã 00:06:33.600 --> 00:06:36.520 e vocês não teriam o mínimo controlo deste meu uso dos vossos dados. 00:06:36.520 --> 00:06:38.790 Penso que isso é um problema. NOTE Paragraph 00:06:38.790 --> 00:06:42.730 Assim, uma das vias a que podemos recorrer é a via da política e da lei. 00:06:42.732 --> 00:06:45.778 Sob certas perspectivas, penso que esse seria o mais eficaz, 00:06:45.778 --> 00:06:48.534 mas o problema é que temos que o fazer. 00:06:48.534 --> 00:06:51.314 Observando o nosso processo político em ação, 00:06:51.314 --> 00:06:53.693 faz-me pensar que é muito pouco provável 00:06:53.693 --> 00:06:57.280 arranjar um grupo de representantes que se sentem, oiçam falar disto, 00:06:57.280 --> 00:06:59.382 e depois produzam alterações radicais 00:06:59.382 --> 00:07:01.539 à lei da propriedade intelectual nos EU, 00:07:01.539 --> 00:07:04.000 para que os utilizadores controlem os seus dados. NOTE Paragraph 00:07:04.000 --> 00:07:06.974 Temos a via da autorregulação, em que os "media" sociais dizem: 00:07:06.974 --> 00:07:10.675 "São donos dos vossos dados. Podem controlar o modo como são usados". 00:07:10.675 --> 00:07:14.252 O problema é que o modelo de receitas da maior parte dos "media" sociais 00:07:14.252 --> 00:07:18.517 baseia-se em partilhar ou explorar os dados dos utilizadores, de vários modos. 00:07:18.527 --> 00:07:22.630 Diz-se que os utilizadores do Facebook não são clientes, são o produto. 00:07:22.638 --> 00:07:25.352 Então como é que conseguimos que uma companhia 00:07:25.352 --> 00:07:27.910 abra mão do controlo do seu principal ativo 00:07:27.910 --> 00:07:29.359 devolvendo-o aos utilizadores? 00:07:29.359 --> 00:07:33.180 É possível, mas não é uma coisa que vá mudar assim tão depressa. NOTE Paragraph 00:07:33.180 --> 00:07:36.950 Portanto, acho que a outra via que podemos usar e será muito mais eficaz 00:07:36.968 --> 00:07:38.476 é uma via mais científica. 00:07:38.476 --> 00:07:40.986 Foi a ciência que nos permitiu desenvolver 00:07:40.986 --> 00:07:44.786 todos os mecanismos de computação para estes dados pessoais. 00:07:44.788 --> 00:07:46.894 E na verdade é uma pesquisa muito semelhante 00:07:46.894 --> 00:07:50.722 que teremos que fazer se queremos desenvolver mecanismos 00:07:50.722 --> 00:07:54.369 que digam a um utilizador: "Este é o risco da ação que realizou". 00:07:54.369 --> 00:07:58.978 Ao dar um "Gosto" no Facebook, ou partilhar alguma informação pessoal, 00:07:58.983 --> 00:08:02.545 aumentaram a minha capacidade de prever se estão a usar drogas 00:08:02.571 --> 00:08:05.433 ou se estão bem integrados no vosso local de trabalho. 00:08:05.433 --> 00:08:08.851 E isso, creio, pode afetar se as pessoas querem partilhar alguma coisa, 00:08:08.851 --> 00:08:12.030 manterem-na em privado, ou apenas mantê-la offline. 00:08:12.030 --> 00:08:14.306 Podemos olhar para coisas como permitir 00:08:14.306 --> 00:08:16.567 que as pessoas codifiquem os dados que carregam, 00:08:16.567 --> 00:08:19.606 de modo que eles sejam invisíveis e sem préstimo no Facebook 00:08:19.607 --> 00:08:22.283 ou em serviços a que terceiros tenham acesso, 00:08:22.283 --> 00:08:25.940 mas que as pessoas escolhidas por quem os publicou 00:08:25.940 --> 00:08:28.153 possam ter acesso a eles. 00:08:28.153 --> 00:08:30.319 Esta é uma pesquisa extremamente excitante 00:08:30.319 --> 00:08:31.939 do ponto de vista intelectual, 00:08:31.939 --> 00:08:33.798 e os cientistas vão querer fazê-la. 00:08:33.798 --> 00:08:37.408 Isso dá-nos uma vantagem sobre a via legal. NOTE Paragraph 00:08:37.408 --> 00:08:40.742 Um dos problemas que as pessoas levantam quando falo sobre isto, é: 00:08:40.742 --> 00:08:43.374 "Se as pessoas começam a manter estes dados em privado, 00:08:43.374 --> 00:08:48.147 "todos os métodos que desenvolveram para prever atributos vão fracassar". 00:08:48.147 --> 00:08:51.660 E eu digo: "Encantada! Para mim, isso é um êxito". 00:08:51.660 --> 00:08:53.446 porque, enquanto cientista, 00:08:53.446 --> 00:08:57.134 o meu objetivo não é deduzir informações sobre utilizadores, 00:08:57.134 --> 00:08:59.901 é melhorar a forma como as pessoas interagem online. 00:08:59.901 --> 00:09:03.119 E por vezes isso envolve deduzir coisas sobre elas, 00:09:03.119 --> 00:09:06.141 mas, se os utilizadores não quiserem que eu use esses dados, 00:09:06.141 --> 00:09:08.179 penso que devem ter o direito de fazê-lo. 00:09:08.179 --> 00:09:10.430 Quero que os utilizadores sejam informados 00:09:10.430 --> 00:09:12.942 e autorizem as ferramentas que desenvolvemos. NOTE Paragraph 00:09:12.942 --> 00:09:15.894 Portanto, penso que encorajar este tipo de ciência 00:09:15.894 --> 00:09:17.240 e apoiar investigadores 00:09:17.240 --> 00:09:20.263 que querem devolver algum desse controlo aos utilizadores 00:09:20.263 --> 00:09:22.574 e retirá-lo às companhias dos "media" sociais 00:09:22.574 --> 00:09:23.740 significa avançar, 00:09:23.740 --> 00:09:26.102 à medida que essas ferramentas evoluem e avançam, 00:09:26.102 --> 00:09:28.720 significa que passaremos a ter uma base de utilizadores 00:09:28.720 --> 00:09:30.139 educada e com poder. 00:09:30.139 --> 00:09:33.499 E penso que todos concordamos que é um belo ideal para pôr em prática. NOTE Paragraph 00:09:33.499 --> 00:09:34.927 Obrigada. NOTE Paragraph 00:09:35.677 --> 00:09:38.757 (Aplausos)