WEBVTT 00:00:17.072 --> 00:00:19.897 Dez mil quilômetros de estradas, 00:00:19.897 --> 00:00:21.828 mil quilômetros de trilhos de metrô, 00:00:21.828 --> 00:00:23.837 650 quilômetros de ciclovias, 00:00:23.837 --> 00:00:25.721 e 800 metros de bonde elétrico 00:00:25.721 --> 00:00:27.619 se já esteve em Roosevelt Island. 00:00:27.619 --> 00:00:30.476 Esses são os números relativos à infraestrutura de Nova York. 00:00:30.476 --> 00:00:32.424 São estatísticas da nossa infraestrutura. 00:00:32.424 --> 00:00:35.630 Números divulgados em relatórios de órgãos municipais, 00:00:35.630 --> 00:00:38.413 como a Secretaria de Transporte, que orgulhosamente informa 00:00:38.413 --> 00:00:40.270 quantos quilômetros de estradas mantém. 00:00:40.270 --> 00:00:42.651 O MTA vai se gabar da extensão das linhas do metrô. 00:00:42.651 --> 00:00:45.305 A maioria desses órgãos fornecem estatísticas. 00:00:45.305 --> 00:00:48.539 Estas são de um relatório deste ano da Comissão de Táxis e Limusines, 00:00:48.539 --> 00:00:52.656 em que descobrimos que há cerca de 13,5 mil táxis aqui em Nova York. 00:00:52.656 --> 00:00:53.945 Bem interessante, né? 00:00:53.945 --> 00:00:56.651 Mas já se perguntaram de onde vêm esses números? 00:00:56.651 --> 00:00:59.991 Pois, para esses números existirem, alguém na prefeitura 00:00:59.991 --> 00:01:03.390 precisa parar e dizer: "Eis aqui um número que alguém pode querer saber. 00:01:03.390 --> 00:01:05.320 Um número que os cidadãos querem saber." 00:01:05.320 --> 00:01:08.974 Daí, voltam para seus dados brutos, contam, adicionam, calculam 00:01:08.974 --> 00:01:10.571 e aí publicam relatórios, 00:01:10.571 --> 00:01:13.283 e esses relatórios têm números assim. 00:01:13.283 --> 00:01:15.665 O problema é: como eles sabem todas nossas dúvidas? 00:01:15.675 --> 00:01:17.004 Temos muitas perguntas. 00:01:17.004 --> 00:01:19.900 De fato, há literalmente um número infinito de perguntas 00:01:19.900 --> 00:01:21.483 que podemos fazer sobre a cidade. 00:01:21.483 --> 00:01:23.630 Os órgãos do governo não dão conta. 00:01:23.630 --> 00:01:27.641 Assim, o paradigma não funciona, e acho que nossos urbanistas percebem isso, 00:01:27.641 --> 00:01:31.632 pois, em 2012, o prefeito Bloomberg sancionou uma lei que chamou 00:01:31.632 --> 00:01:35.941 de a mais ambiciosa e abrangente legislação de dados abertos do país. 00:01:35.941 --> 00:01:37.568 Em grande parte, ele está certo. 00:01:37.568 --> 00:01:42.080 Nos últimos dois anos, a cidade divulgou mil arquivos de dados nesse portal, 00:01:42.080 --> 00:01:43.733 e é bem impressionante. 00:01:43.733 --> 00:01:47.603 Então, vamos lá e vemos dados como estes e, em vez de só contar o número de táxis, 00:01:47.603 --> 00:01:49.260 podemos fazer diversas perguntas. 00:01:49.260 --> 00:01:50.673 Eu tinha uma pergunta: 00:01:50.673 --> 00:01:52.442 quando é a hora do rush em Nova York? 00:01:52.442 --> 00:01:54.950 Que é uma coisa bem chata: qual é a hora do rush? 00:01:54.950 --> 00:01:57.484 E pensei comigo mesmo: esses táxis não são só números, 00:01:57.484 --> 00:01:59.884 são dados de GPS rodando por nossas ruas, 00:01:59.884 --> 00:02:01.980 registrando cada corrida que fazem. 00:02:01.980 --> 00:02:04.345 Há dados aí, e olhei para esses dados 00:02:04.345 --> 00:02:08.073 e calculei a velocidade média dos táxis em Nova York durante o dia. 00:02:08.073 --> 00:02:11.883 Dá pra ver que, da meia-noite até cerca das 5h18 da manhã, 00:02:11.883 --> 00:02:15.580 a velocidade aumenta e, a partir daí, as coisas se invertem, 00:02:15.580 --> 00:02:19.434 e eles ficam cada vez mais lentos até cerca das 8h35 da manhã, 00:02:19.434 --> 00:02:22.251 quando acabam rodando em torno dos 17 km/h. 00:02:22.251 --> 00:02:25.501 O táxi comum roda a 17 km/h nas ruas da cidade, 00:02:25.501 --> 00:02:29.389 e acontece de ficar assim... 00:02:29.389 --> 00:02:30.697 ... o dia inteiro. 00:02:30.697 --> 00:02:33.045 (Risos) 00:02:33.045 --> 00:02:36.836 Daí pensei: acho que não há hora do rush em Nova York, apenas dia de rush. 00:02:36.836 --> 00:02:37.841 (Risos) 00:02:37.841 --> 00:02:40.268 Isso faz sentido e é importante por diversas razões. 00:02:40.268 --> 00:02:43.923 Para um gestor de transportes, deve ser bem interessante saber isso. 00:02:43.923 --> 00:02:45.832 Mas, se quiser chegar rápido a um lugar, 00:02:45.842 --> 00:02:48.979 agora sabe que basta pôr o alarme para as 4h45 da manhã, e pronto. 00:02:48.979 --> 00:02:50.107 É Nova York, certo? 00:02:50.107 --> 00:02:51.227 Mas há uma história aí. 00:02:51.227 --> 00:02:53.681 Esses dados não estavam disponíveis dessa forma. 00:02:53.681 --> 00:02:56.993 Na verdade, vieram do chamado Freedom of Information Law Request, 00:02:56.993 --> 00:02:58.108 ou Requisição FOIL. 00:02:58.108 --> 00:03:01.632 Este é um formulário do site da Comissão de Táxis e Limusines. 00:03:01.632 --> 00:03:04.223 Para acessar os dados, é preciso pegar esse formulário, 00:03:04.223 --> 00:03:06.125 preenchê-lo, e depois eles te notificam. 00:03:06.125 --> 00:03:08.902 Um cara chamado Chris Whong fez exatamente isso. 00:03:08.902 --> 00:03:10.843 Chris foi lá, e disseram para ele: 00:03:10.843 --> 00:03:13.710 "Traga um HD novinho em folha ao nosso escritório, 00:03:13.710 --> 00:03:17.040 deixe-o aqui por cinco horas, copiamos os dados e você busca de volta". 00:03:17.040 --> 00:03:19.305 E foi daí que vieram esses dados. 00:03:19.305 --> 00:03:22.349 Chris é o tipo do cara que quer tornar públicos esses dados, 00:03:22.349 --> 00:03:25.645 para ficarem on-line para todos, e esse gráfico veio daí. 00:03:25.645 --> 00:03:29.369 E o fato de isso existir é incrível; esses registros de GPS são muito legais. 00:03:29.369 --> 00:03:31.816 Mas os cidadãos precisarem andar por aí com HDs, 00:03:31.816 --> 00:03:34.183 coletando esses dados para torná-los públicos, 00:03:34.183 --> 00:03:36.281 quando já eram meio que públicos, acessíveis, 00:03:36.281 --> 00:03:39.037 mas não eram públicos, eram "públicos". 00:03:39.037 --> 00:03:40.802 O governo pode fazer melhor que isso. 00:03:40.802 --> 00:03:44.349 Não faz sentido nossos cidadãos andando por aí com HDs. 00:03:44.349 --> 00:03:46.922 Mas nem todos os dados dependem de uma Requisição FOIL. 00:03:46.922 --> 00:03:50.439 Eis um mapa que fiz dos cruzamentos mais perigosos de Nova York, 00:03:50.439 --> 00:03:52.646 baseado em acidentes com ciclistas. 00:03:52.646 --> 00:03:54.685 As áreas vermelhas são as mais perigosas. 00:03:54.685 --> 00:03:56.930 E a mais perigosa é o East Side de Manhattan, 00:03:56.930 --> 00:04:01.058 especialmente a área mais ao sul, com maior número de acidentes. 00:04:01.058 --> 00:04:04.140 Isso faz sentido, pois ali há mais ciclistas vindo das pontes. 00:04:04.140 --> 00:04:06.046 Mas há outros lugares dignos de atenção, 00:04:06.046 --> 00:04:08.507 como Williamsburg e a Avenida Roosevelt, no Queens. 00:04:08.507 --> 00:04:11.504 E é exatamente o tipo de dado que precisamos para o Vision Zero. 00:04:11.504 --> 00:04:13.828 É exatamente o que estamos procurando. 00:04:13.828 --> 00:04:15.948 Há uma história atrás desses dados também. 00:04:15.948 --> 00:04:17.944 Eles não surgiram do nada. 00:04:17.944 --> 00:04:20.525 Quantos aqui conhecem essa logomarca? 00:04:20.525 --> 00:04:21.659 É, alguns de vocês. 00:04:21.659 --> 00:04:25.343 Já tentaram copiar e colar dados de um arquivo PDF e depois decifrá-los? 00:04:25.343 --> 00:04:26.925 Mais mãos levantadas agora. 00:04:26.925 --> 00:04:30.263 Mais pessoas tentam copiar e colar do que conhecem a logomarca. Gostei! 00:04:30.263 --> 00:04:33.131 Na verdade, os dados que acabaram de ver estavam em PDF. 00:04:33.131 --> 00:04:39.114 De fato, há centenas de páginas em PDF disponibilizadas pela nossa polícia 00:04:39.114 --> 00:04:43.052 e, para acessar, ou vocês copiam e colam por centenas de horas, 00:04:43.052 --> 00:04:45.230 ou fazem como John Krauss. 00:04:45.230 --> 00:04:46.231 John Krauss pensou: 00:04:46.231 --> 00:04:49.182 "Não vou copiar e colar esses dados. Vou escrever um programa." 00:04:49.182 --> 00:04:51.894 Chama-se "NYPD Crash Data Band-Aid", 00:04:51.894 --> 00:04:54.907 e vai no site da polícia e baixa os PDFs. 00:04:54.907 --> 00:04:57.982 Todos os dias o programa procura; se encontrar um PDF, ele baixa, 00:04:57.982 --> 00:05:00.612 roda um programa que extrai os dados do PDF, 00:05:00.612 --> 00:05:01.956 produz um texto 00:05:01.956 --> 00:05:05.116 e coloca na Internet, para que as pessoas possam fazer mapas assim. 00:05:05.116 --> 00:05:08.401 E o fato de os dados estarem aqui, o fato de termos acesso a eles, 00:05:08.401 --> 00:05:11.452 aliás, cada linha dessa tabela é um acidente. 00:05:11.452 --> 00:05:12.970 Imaginem quantos PDFs há aqui. 00:05:12.970 --> 00:05:15.223 O fato de termos acesso a isso é ótimo. 00:05:15.223 --> 00:05:17.556 Mas parem de liberar dados em PDF, 00:05:17.556 --> 00:05:20.220 ou nossos cidadãos vão ter de extrair dados de PDF. 00:05:20.220 --> 00:05:22.166 Isso é desperdício do tempo dos cidadãos, 00:05:22.166 --> 00:05:24.174 e a prefeitura pode fazer melhor que isso. 00:05:24.174 --> 00:05:26.856 Bem, a boa notícia é que a administração Blasio 00:05:26.856 --> 00:05:29.777 liberou esses dados poucos meses atrás, 00:05:29.777 --> 00:05:31.736 e agora então podemos de fato acessá-los, 00:05:31.736 --> 00:05:34.183 mas ainda há uma porção de dados escondidos em PDF. 00:05:34.183 --> 00:05:37.621 Por exemplo, nossos dados criminais estão disponíveis apenas em PDF. 00:05:37.621 --> 00:05:41.642 E não apenas os dados criminais, o próprio orçamento do município. 00:05:41.642 --> 00:05:45.146 Nosso orçamento está disponível apenas no formato PDF. 00:05:45.146 --> 00:05:47.391 Não somos os únicos a não conseguir analisá-los. 00:05:47.391 --> 00:05:49.902 Nossos próprios legisladores, que votam o orçamento, 00:05:49.902 --> 00:05:51.915 também apenas o acessam em PDF. 00:05:51.915 --> 00:05:55.672 Daí, nossos legisladores não conseguem analisar o orçamento que estão votando. 00:05:55.672 --> 00:05:59.597 E acho que a cidade pode fazer um pouco melhor que isso. 00:05:59.597 --> 00:06:01.942 Mas há uma porção de dados não escondidos em PDFs. 00:06:01.942 --> 00:06:06.593 Eis um exemplo de um mapa que fiz com as hidrovias mais sujas de Nova York. 00:06:06.593 --> 00:06:08.519 Bem, como medi essa sujeira? 00:06:08.519 --> 00:06:12.425 Foi de um jeito um pouco estranho, mas olhei o nível dos coliformes fecais, 00:06:12.425 --> 00:06:15.627 que é uma medida da matéria fecal em cada uma das nossas hidrovias. 00:06:15.627 --> 00:06:18.798 Quanto maior o círculo, mais suja é a água. 00:06:18.798 --> 00:06:22.173 Assim, os círculos grandes são água suja, e os menores, água mais limpa. 00:06:22.173 --> 00:06:24.121 O que veem são hidrovias internas. 00:06:24.121 --> 00:06:27.380 Dados que foram coletados pela prefeitura nos últimos cinco anos. 00:06:27.380 --> 00:06:29.716 E as hidrovias internas são, em geral, mais sujas. 00:06:29.716 --> 00:06:31.132 Faz sentido, não é mesmo? 00:06:31.132 --> 00:06:33.260 E aprendi umas coisas com isso. 00:06:33.260 --> 00:06:38.977 Primeira, nunca nadem em algo que termine com "creek" ou "canal". 00:06:38.977 --> 00:06:41.861 Segundo, também descobri a hidrovia mais suja de Nova York 00:06:41.861 --> 00:06:43.717 por essa medida, uma medida. 00:06:43.717 --> 00:06:45.020 Em Coney Island Creek, 00:06:45.020 --> 00:06:48.066 não a Coney Island onde nadam, felizmente, mas do outro lado, 00:06:48.066 --> 00:06:52.685 vi que 94% das amostras coletadas lá nos últimos cinco anos 00:06:52.685 --> 00:06:54.860 tinham níveis fecais tão altos 00:06:54.860 --> 00:06:58.151 que deveria ser ilegal nadar naquela água. 00:06:58.151 --> 00:07:01.699 E esse não é o tipo de fato propalado num relatório municipal, né? 00:07:01.709 --> 00:07:03.807 Não vai estar na capa página do NYC.gov. 00:07:03.807 --> 00:07:04.943 Não vão ver isso lá, 00:07:04.943 --> 00:07:07.955 mas o fato de podermos acessar esses dados é incrível. 00:07:07.955 --> 00:07:09.815 Mas, repito, não foi superfácil, 00:07:09.815 --> 00:07:11.871 pois não estavam no portal de dados abertos. 00:07:11.871 --> 00:07:15.595 No portal de dados abertos, havia apenas parte deles, um ano ou poucos meses. 00:07:15.595 --> 00:07:18.278 Eles estavam no site da Secretaria do Meio Ambiente. 00:07:18.278 --> 00:07:23.213 E cada um desses links é uma planilha Excel, e cada planilha é diferente. 00:07:23.213 --> 00:07:26.297 Cada cabeçalho é diferente: você copia, cola, reorganiza. 00:07:26.297 --> 00:07:28.082 E aí pode fazer mapas, o que é ótimo, 00:07:28.082 --> 00:07:31.223 mas a cidade pode fazer melhor, padronizando os dados. 00:07:31.223 --> 00:07:34.043 E estamos chegando lá, pois há este site feito pela Socrata, 00:07:34.043 --> 00:07:35.721 chamado Open Data Portal NYC. 00:07:35.721 --> 00:07:39.525 Aqui é onde ficam 1,1 mil arquivos sem esses problemas que mencionei, 00:07:39.525 --> 00:07:41.589 e esse número está crescendo, o que é ótimo. 00:07:41.589 --> 00:07:46.165 Vocês podem baixar dados em qualquer formato, CSV, PDF ou Excel. 00:07:46.165 --> 00:07:49.300 O que quiserem, podem baixar do jeito que acharem melhor. 00:07:49.300 --> 00:07:51.156 O problema é que, uma vez feito isso, 00:07:51.156 --> 00:07:55.295 vão descobrir que cada órgão codifica os endereços de forma diferente. 00:07:55.295 --> 00:07:57.300 Assim, podemos ter nome da rua, cruzamento, 00:07:57.300 --> 00:07:59.735 rua, bairro, endereço, edifício, endereço do prédio. 00:07:59.735 --> 00:08:02.463 Então, mesmo tendo o portal, 00:08:02.463 --> 00:08:05.392 gasta-se tempo padronizando nossos campos de endereço. 00:08:05.392 --> 00:08:07.790 E essa não é a melhor forma de usarmos nosso tempo. 00:08:07.790 --> 00:08:09.407 Podemos fazer melhor como cidade. 00:08:09.407 --> 00:08:11.083 Podemos padronizar nossos endereços 00:08:11.083 --> 00:08:13.181 e, assim, vamos ter mais mapas como este. 00:08:13.181 --> 00:08:15.632 Este é um mapa de hidrantes de Nova York, 00:08:15.632 --> 00:08:17.495 mas não de quaisquer hidrantes. 00:08:17.495 --> 00:08:22.112 Estes são os 250 hidrantes campeões de multas de trânsito. 00:08:22.112 --> 00:08:24.788 (Risos) 00:08:24.788 --> 00:08:27.259 Assim, aprendi algumas coisas com este mapa. 00:08:27.259 --> 00:08:30.149 Primeiro, não estacione no Upper East Side. 00:08:30.149 --> 00:08:33.596 De jeito nenhum; não importa onde parar, vai levar uma multa de hidrante. 00:08:33.596 --> 00:08:37.722 Segundo, descobri os hidrantes campeões de multa em Nova York. 00:08:37.722 --> 00:08:39.115 Eles estão no Lower East Side 00:08:39.115 --> 00:08:44.457 e arrecadam mais de US$ 55 mil por ano em multa por estacionar em local proibido. 00:08:44.457 --> 00:08:47.262 E achei estranho quando vi isso. 00:08:47.262 --> 00:08:50.074 Então pesquisei um pouco mais, e acontece que há um hidrante 00:08:50.074 --> 00:08:52.150 e algo chamado extensão da calçada, 00:08:52.150 --> 00:08:55.353 um lugar de uns 2m para se andar, e depois um lugar para estacionar. 00:08:55.353 --> 00:08:58.790 Então os carros chegam e veem o hidrante: "A vaga vai até lá, estou bem". 00:08:58.790 --> 00:09:02.024 Na verdade, a vaga está lá demarcada bonitinha. 00:09:02.024 --> 00:09:06.102 Daí, estacionam ali, mas a polícia discorda dessa marcação, e multa. 00:09:06.102 --> 00:09:08.035 E não fui o único a levar uma multa. 00:09:08.035 --> 00:09:13.362 Vejam só o carro do Street View do Google ali com a mesma multa de trânsito. 00:09:13.362 --> 00:09:18.915 Daí, escrevi sobre isso no meu blog, I Quant NY, e o DOT respondeu, dizendo: 00:09:18.915 --> 00:09:22.792 "Apesar de o DOT não ter recebido qualquer reclamação sobre esse lugar, 00:09:22.792 --> 00:09:27.021 vamos rever a marcação na pista e fazer as alterações necessárias". 00:09:27.021 --> 00:09:28.419 E pensei cá comigo: 00:09:28.419 --> 00:09:31.634 "Resposta típica do governo, tudo bem, vou cuidar da minha vida". 00:09:31.634 --> 00:09:36.139 Mas, poucas semanas depois, algo incrível aconteceu. 00:09:36.139 --> 00:09:38.378 Repintaram o lugar, 00:09:38.378 --> 00:09:41.129 e por um segundo vislumbrei o futuro dos dados abertos, 00:09:41.129 --> 00:09:42.796 pois vejam só o que aconteceu aqui. 00:09:42.796 --> 00:09:48.423 Durante cinco anos, levamos multas nesse lugar, pois era confuso, 00:09:48.423 --> 00:09:52.804 e daí um cidadão descobriu isso, avisou à prefeitura e, em poucas semanas, 00:09:52.804 --> 00:09:54.936 o problema foi resolvido. Incrível! 00:09:54.936 --> 00:09:58.782 E há quem veja isso como um fiscal. Não é, tem a ver com parceria. 00:09:58.795 --> 00:10:02.124 Empoderar os cidadãos para serem melhores parceiros do governo. 00:10:02.124 --> 00:10:05.111 E não é tão difícil assim, só precisamos de algumas mudanças. 00:10:05.111 --> 00:10:08.783 Se camuflarem os dados, e os cidadãos tiverem todas as vezes de requisitá-los, 00:10:08.783 --> 00:10:11.739 melhor liberá-los, é sinal de que é preciso torná-los públicos. 00:10:11.739 --> 00:10:15.015 E, se você é um órgão do governo liberando um PDF, 00:10:15.015 --> 00:10:18.719 vamos aprovar legislação que exija publicar isso com os dados originais, 00:10:18.719 --> 00:10:20.554 pois esses dados vêm de algum lugar, 00:10:20.554 --> 00:10:23.359 não sei de onde, mas vêm, e depois podem publicá-los em PDF. 00:10:23.359 --> 00:10:25.931 E vamos adotar e compartilhar padrões de dados abertos, 00:10:25.931 --> 00:10:28.280 começando com nossos endereços aqui em Nova York. 00:10:28.280 --> 00:10:32.157 Vamos padronizar nossos endereços, pois somos referência em dados abertos. 00:10:32.157 --> 00:10:34.808 Apesar desses problemas, somos líderes absolutos nisso. 00:10:34.808 --> 00:10:38.335 Se estabelecermos um padrão para os dados, outros vão nos seguir. 00:10:38.335 --> 00:10:40.494 O estado vai seguir, talvez o governo federal. 00:10:40.494 --> 00:10:43.163 Sei que parece loucura, mas outros países poderão seguir, 00:10:43.163 --> 00:10:46.282 e não estamos tão longe assim de escrever um programa 00:10:46.282 --> 00:10:48.906 para mapear informação de 100 países. 00:10:48.906 --> 00:10:51.760 Não é ficção científica; estamos bem perto disso na verdade. 00:10:51.760 --> 00:10:54.297 E, a propósito, quem estamos empoderando com isso? 00:10:54.297 --> 00:10:57.354 Não é apenas John Krauss ou Chris Whong. 00:10:57.354 --> 00:11:00.687 Há centenas de "meetups" acontecendo em Nova York agora mesmo. 00:11:00.687 --> 00:11:04.086 "Meetups" ativos, com milhares de pessoas participando 00:11:04.086 --> 00:11:08.978 depois do trabalho e nos finais de semana, analisando dados abertos, 00:11:08.978 --> 00:11:10.934 para tornar nossa cidade um lugar melhor. 00:11:10.934 --> 00:11:15.929 Grupos como BetaNYC, que semana passada lançou o citygram.nyc, 00:11:15.929 --> 00:11:19.991 que dá acesso às reclamações feitas no site da prefeitura, por região. 00:11:19.991 --> 00:11:22.276 É só colocar o endereço e acessar as reclamações. 00:11:22.276 --> 00:11:25.514 E não é apenas a comunidade tecnológica que está atrás dessas coisas. 00:11:25.514 --> 00:11:27.949 São os gestores urbanos, como meus alunos em Pratt. 00:11:27.949 --> 00:11:32.563 Agentes de políticas públicas, todo mundo, cidadãos de diversos segmentos. 00:11:32.563 --> 00:11:35.530 E, com algumas mudanças pequenas, graduais, 00:11:35.530 --> 00:11:38.638 podemos estimular a paixão e a habilidade de nossos cidadãos 00:11:38.638 --> 00:11:41.577 para usar dados abertos e fazer nossa cidade ainda melhor, 00:11:41.577 --> 00:11:45.838 seja com um conjunto de dados, ou com um lugar para estacionar. 00:11:45.838 --> 00:11:47.213 Obrigado. 00:11:47.213 --> 00:11:50.274 (Aplausos)