YouTube

Got a YouTube account?

New: enable viewer-created translations and captions on your YouTube channel!

Portuguese, Brazilian subtitles

← Como encontramos o pior lugar para estacionar em Nova York usando "big data" | Ben Wellington | TEDxNewYork

Get Embed Code
12 Languages

Showing Revision 153 created 02/05/2017 by Raissa Mendes.

  1. Dez mil quilômetros de estradas,
  2. mil quilômetros de trilhos de metrô,
  3. 650 quilômetros de ciclovias,
  4. e 800 metros de bonde elétrico
  5. se já esteve em Roosevelt Island.
  6. Esses são os números relativos
    à infraestrutura de Nova York.
  7. São estatísticas da nossa infraestrutura.
  8. Números divulgados em relatórios
    de órgãos municipais,
  9. como a Secretaria de Transporte,
    que orgulhosamente informa
  10. quantos quilômetros de estradas mantém.
  11. O MTA vai se gabar da extensão
    das linhas do metrô.
  12. A maioria desses órgãos
    fornecem estatísticas.
  13. Estas são de um relatório deste ano
    da Comissão de Táxis e Limusines,
  14. em que descobrimos que há cerca
    de 13,5 mil táxis aqui em Nova York.
  15. Bem interessante, né?
  16. Mas já se perguntaram
    de onde vêm esses números?
  17. Pois, para esses números
    existirem, alguém na prefeitura
  18. precisa parar e dizer: "Eis aqui um número
    que alguém pode querer saber.
  19. Um número que os cidadãos querem saber."
  20. Daí, voltam para seus dados brutos,
    contam, adicionam, calculam
  21. e aí publicam relatórios,
  22. e esses relatórios têm números assim.
  23. O problema é: como eles
    sabem todas nossas dúvidas?
  24. Temos muitas perguntas.
  25. De fato, há literalmente
    um número infinito de perguntas
  26. que podemos fazer sobre a cidade.
  27. Os órgãos do governo não dão conta.
  28. Assim, o paradigma não funciona, e acho
    que nossos urbanistas percebem isso,
  29. pois, em 2012, o prefeito Bloomberg
    sancionou uma lei que chamou
  30. de a mais ambiciosa e abrangente
    legislação de dados abertos do país.
  31. Em grande parte, ele está certo.
  32. Nos últimos dois anos, a cidade divulgou
    mil arquivos de dados nesse portal,
  33. e é bem impressionante.
  34. Então, vamos lá e vemos dados como estes
    e, em vez de só contar o número de táxis,
  35. podemos fazer diversas perguntas.
  36. Eu tinha uma pergunta:
  37. quando é a hora do rush em Nova York?
  38. Que é uma coisa bem chata:
    qual é a hora do rush?
  39. E pensei comigo mesmo:
    esses táxis não são só números,
  40. são dados de GPS rodando por nossas ruas,
  41. registrando cada corrida que fazem.
  42. Há dados aí, e olhei para esses dados
  43. e calculei a velocidade média
    dos táxis em Nova York durante o dia.
  44. Dá pra ver que, da meia-noite
    até cerca das 5h18 da manhã,
  45. a velocidade aumenta e, a partir daí,
    as coisas se invertem,
  46. e eles ficam cada vez mais lentos
    até cerca das 8h35 da manhã,
  47. quando acabam rodando
    em torno dos 17 km/h.
  48. O táxi comum roda a 17 km/h
    nas ruas da cidade,
  49. e acontece de ficar assim...
  50. ... o dia inteiro.
  51. (Risos)
  52. Daí pensei: acho que não há hora do rush
    em Nova York, apenas dia de rush.
  53. (Risos)
  54. Isso faz sentido e é importante
    por diversas razões.
  55. Para um gestor de transportes,
    deve ser bem interessante saber isso.
  56. Mas, se quiser chegar rápido a um lugar,
  57. agora sabe que basta pôr o alarme
    para as 4h45 da manhã, e pronto.
  58. É Nova York, certo?
  59. Mas há uma história aí.
  60. Esses dados não estavam
    disponíveis dessa forma.
  61. Na verdade, vieram do chamado
    Freedom of Information Law Request,
  62. ou Requisição FOIL.
  63. Este é um formulário do site
    da Comissão de Táxis e Limusines.
  64. Para acessar os dados,
    é preciso pegar esse formulário,
  65. preenchê-lo, e depois eles te notificam.
  66. Um cara chamado Chris Whong
    fez exatamente isso.
  67. Chris foi lá, e disseram para ele:
  68. "Traga um HD novinho em folha
    ao nosso escritório,
  69. deixe-o aqui por cinco horas, copiamos
    os dados e você busca de volta".
  70. E foi daí que vieram esses dados.
  71. Chris é o tipo do cara que quer
    tornar públicos esses dados,
  72. para ficarem on-line para todos,
    e esse gráfico veio daí.
  73. E o fato de isso existir é incrível;
    esses registros de GPS são muito legais.
  74. Mas os cidadãos precisarem
    andar por aí com HDs,
  75. coletando esses dados
    para torná-los públicos,
  76. quando já eram meio
    que públicos, acessíveis,
  77. mas não eram públicos, eram "públicos".
  78. O governo pode fazer melhor que isso.
  79. Não faz sentido nossos cidadãos
    andando por aí com HDs.
  80. Mas nem todos os dados dependem
    de uma Requisição FOIL.
  81. Eis um mapa que fiz dos cruzamentos
    mais perigosos de Nova York,
  82. baseado em acidentes com ciclistas.
  83. As áreas vermelhas são as mais perigosas.
  84. E a mais perigosa é
    o East Side de Manhattan,
  85. especialmente a área mais ao sul,
    com maior número de acidentes.
  86. Isso faz sentido, pois ali há
    mais ciclistas vindo das pontes.
  87. Mas há outros lugares dignos de atenção,
  88. como Williamsburg
    e a Avenida Roosevelt, no Queens.
  89. E é exatamente o tipo de dado
    que precisamos para o Vision Zero.
  90. É exatamente o que estamos procurando.
  91. Há uma história atrás desses dados também.
  92. Eles não surgiram do nada.
  93. Quantos aqui conhecem essa logomarca?
  94. É, alguns de vocês.
  95. Já tentaram copiar e colar dados
    de um arquivo PDF e depois decifrá-los?
  96. Mais mãos levantadas agora.
  97. Mais pessoas tentam copiar e colar
    do que conhecem a logomarca. Gostei!
  98. Na verdade, os dados que acabaram
    de ver estavam em PDF.
  99. De fato, há centenas de páginas em PDF
    disponibilizadas pela nossa polícia
  100. e, para acessar, ou vocês copiam
    e colam por centenas de horas,
  101. ou fazem como John Krauss.
  102. John Krauss pensou:
  103. "Não vou copiar e colar esses dados.
    Vou escrever um programa."
  104. Chama-se "NYPD Crash Data Band-Aid",
  105. e vai no site da polícia e baixa os PDFs.
  106. Todos os dias o programa procura;
    se encontrar um PDF, ele baixa,
  107. roda um programa
    que extrai os dados do PDF,
  108. produz um texto
  109. e coloca na Internet, para que as pessoas
    possam fazer mapas assim.
  110. E o fato de os dados estarem aqui,
    o fato de termos acesso a eles,
  111. aliás, cada linha dessa
    tabela é um acidente.
  112. Imaginem quantos PDFs há aqui.
  113. O fato de termos acesso a isso é ótimo.
  114. Mas parem de liberar dados em PDF,
  115. ou nossos cidadãos vão
    ter de extrair dados de PDF.
  116. Isso é desperdício
    do tempo dos cidadãos,
  117. e a prefeitura pode fazer melhor que isso.
  118. Bem, a boa notícia
    é que a administração Blasio
  119. liberou esses dados poucos meses atrás,
  120. e agora então podemos de fato acessá-los,
  121. mas ainda há uma porção
    de dados escondidos em PDF.
  122. Por exemplo, nossos dados criminais
    estão disponíveis apenas em PDF.
  123. E não apenas os dados criminais,
    o próprio orçamento do município.
  124. Nosso orçamento está disponível
    apenas no formato PDF.
  125. Não somos os únicos
    a não conseguir analisá-los.
  126. Nossos próprios legisladores,
    que votam o orçamento,
  127. também apenas o acessam em PDF.
  128. Daí, nossos legisladores não conseguem
    analisar o orçamento que estão votando.
  129. E acho que a cidade pode fazer
    um pouco melhor que isso.
  130. Mas há uma porção de dados
    não escondidos em PDFs.
  131. Eis um exemplo de um mapa que fiz
    com as hidrovias mais sujas de Nova York.
  132. Bem, como medi essa sujeira?
  133. Foi de um jeito um pouco estranho,
    mas olhei o nível dos coliformes fecais,
  134. que é uma medida da matéria fecal
    em cada uma das nossas hidrovias.
  135. Quanto maior o círculo,
    mais suja é a água.
  136. Assim, os círculos grandes são água suja,
    e os menores, água mais limpa.
  137. O que veem são hidrovias internas.
  138. Dados que foram coletados pela prefeitura
    nos últimos cinco anos.
  139. E as hidrovias internas são,
    em geral, mais sujas.
  140. Faz sentido, não é mesmo?
  141. E aprendi umas coisas com isso.
  142. Primeira, nunca nadem em algo
    que termine com "creek" ou "canal".
  143. Segundo, também descobri
    a hidrovia mais suja de Nova York
  144. por essa medida, uma medida.
  145. Em Coney Island Creek,
  146. não a Coney Island onde nadam,
    felizmente, mas do outro lado,
  147. vi que 94% das amostras coletadas
    lá nos últimos cinco anos
  148. tinham níveis fecais tão altos
  149. que deveria ser ilegal nadar naquela água.
  150. E esse não é o tipo de fato propalado
    num relatório municipal, né?
  151. Não vai estar na capa página do NYC.gov.
  152. Não vão ver isso lá,
  153. mas o fato de podermos
    acessar esses dados é incrível.
  154. Mas, repito, não foi superfácil,
  155. pois não estavam
    no portal de dados abertos.
  156. No portal de dados abertos, havia apenas
    parte deles, um ano ou poucos meses.
  157. Eles estavam no site
    da Secretaria do Meio Ambiente.
  158. E cada um desses links é uma planilha
    Excel, e cada planilha é diferente.
  159. Cada cabeçalho é diferente:
    você copia, cola, reorganiza.
  160. E aí pode fazer mapas, o que é ótimo,
  161. mas a cidade pode fazer melhor,
    padronizando os dados.
  162. E estamos chegando lá, pois
    há este site feito pela Socrata,
  163. chamado Open Data Portal NYC.
  164. Aqui é onde ficam 1,1 mil arquivos
    sem esses problemas que mencionei,
  165. e esse número está
    crescendo, o que é ótimo.
  166. Vocês podem baixar dados
    em qualquer formato, CSV, PDF ou Excel.
  167. O que quiserem, podem baixar
    do jeito que acharem melhor.
  168. O problema é que, uma vez feito isso,
  169. vão descobrir que cada órgão codifica
    os endereços de forma diferente.
  170. Assim, podemos ter
    nome da rua, cruzamento,
  171. rua, bairro, endereço, edifício,
    endereço do prédio.
  172. Então, mesmo tendo o portal,
  173. gasta-se tempo padronizando
    nossos campos de endereço.
  174. E essa não é a melhor forma
    de usarmos nosso tempo.
  175. Podemos fazer melhor como cidade.
  176. Podemos padronizar nossos endereços
  177. e, assim, vamos ter mais mapas como este.
  178. Este é um mapa de hidrantes de Nova York,
  179. mas não de quaisquer hidrantes.
  180. Estes são os 250 hidrantes
    campeões de multas de trânsito.
  181. (Risos)
  182. Assim, aprendi algumas
    coisas com este mapa.
  183. Primeiro, não estacione
    no Upper East Side.
  184. De jeito nenhum; não importa onde
    parar, vai levar uma multa de hidrante.
  185. Segundo, descobri os hidrantes
    campeões de multa em Nova York.
  186. Eles estão no Lower East Side
  187. e arrecadam mais de US$ 55 mil por ano
    em multa por estacionar em local proibido.
  188. E achei estranho quando vi isso.
  189. Então pesquisei um pouco mais,
    e acontece que há um hidrante
  190. e algo chamado extensão da calçada,
  191. um lugar de uns 2m para se andar,
    e depois um lugar para estacionar.
  192. Então os carros chegam e veem o hidrante:
    "A vaga vai até lá, estou bem".
  193. Na verdade, a vaga está
    lá demarcada bonitinha.
  194. Daí, estacionam ali, mas a polícia
    discorda dessa marcação, e multa.
  195. E não fui o único a levar uma multa.
  196. Vejam só o carro do Street View do Google
    ali com a mesma multa de trânsito.
  197. Daí, escrevi sobre isso no meu blog,
    I Quant NY, e o DOT respondeu, dizendo:
  198. "Apesar de o DOT não ter recebido
    qualquer reclamação sobre esse lugar,
  199. vamos rever a marcação na pista
    e fazer as alterações necessárias".
  200. E pensei cá comigo:
  201. "Resposta típica do governo,
    tudo bem, vou cuidar da minha vida".
  202. Mas, poucas semanas depois,
    algo incrível aconteceu.
  203. Repintaram o lugar,
  204. e por um segundo vislumbrei
    o futuro dos dados abertos,
  205. pois vejam só o que aconteceu aqui.
  206. Durante cinco anos, levamos multas
    nesse lugar, pois era confuso,
  207. e daí um cidadão descobriu isso,
    avisou à prefeitura e, em poucas semanas,
  208. o problema foi resolvido. Incrível!
  209. E há quem veja isso como um fiscal.
    Não é, tem a ver com parceria.
  210. Empoderar os cidadãos para serem
    melhores parceiros do governo.
  211. E não é tão difícil assim,
    só precisamos de algumas mudanças.
  212. Se camuflarem os dados, e os cidadãos
    tiverem todas as vezes de requisitá-los,
  213. melhor liberá-los, é sinal de que é
    preciso torná-los públicos.
  214. E, se você é um órgão do governo
    liberando um PDF,
  215. vamos aprovar legislação que exija
    publicar isso com os dados originais,
  216. pois esses dados vêm de algum lugar,
  217. não sei de onde, mas vêm,
    e depois podem publicá-los em PDF.
  218. E vamos adotar e compartilhar
    padrões de dados abertos,
  219. começando com nossos
    endereços aqui em Nova York.
  220. Vamos padronizar nossos endereços,
    pois somos referência em dados abertos.
  221. Apesar desses problemas,
    somos líderes absolutos nisso.
  222. Se estabelecermos um padrão
    para os dados, outros vão nos seguir.
  223. O estado vai seguir,
    talvez o governo federal.
  224. Sei que parece loucura,
    mas outros países poderão seguir,
  225. e não estamos tão longe assim
    de escrever um programa
  226. para mapear informação de 100 países.
  227. Não é ficção científica; estamos
    bem perto disso na verdade.
  228. E, a propósito, quem estamos
    empoderando com isso?
  229. Não é apenas John Krauss ou Chris Whong.
  230. Há centenas de "meetups" acontecendo
    em Nova York agora mesmo.
  231. "Meetups" ativos, com milhares
    de pessoas participando
  232. depois do trabalho e nos finais de semana,
    analisando dados abertos,
  233. para tornar nossa cidade um lugar melhor.
  234. Grupos como BetaNYC, que semana
    passada lançou o citygram.nyc,
  235. que dá acesso às reclamações feitas
    no site da prefeitura, por região.
  236. É só colocar o endereço
    e acessar as reclamações.
  237. E não é apenas a comunidade tecnológica
    que está atrás dessas coisas.
  238. São os gestores urbanos,
    como meus alunos em Pratt.
  239. Agentes de políticas públicas, todo mundo,
    cidadãos de diversos segmentos.
  240. E, com algumas mudanças
    pequenas, graduais,
  241. podemos estimular a paixão
    e a habilidade de nossos cidadãos
  242. para usar dados abertos
    e fazer nossa cidade ainda melhor,
  243. seja com um conjunto de dados,
    ou com um lugar para estacionar.
  244. Obrigado.
  245. (Aplausos)