French subtitles

← Comment nous avons trouvé la pire place de parking de New-York - en utilisant des données de masse | Ben Wellington | TEDxNewYork

Get Embed Code
12 Languages

Showing Revision 9 created 05/25/2015 by Elisabeth Buffard.

  1. Près de 10 000 km de routes,
  2. près de 6 000 km de rails de métro,
  3. près de 650 km de pistes cyclables,
  4. et 800 m de rails de tram,
  5. si vous avez déjà été à Roosevelt Island.
  6. Ce sont les chiffres qui constituent
    l'infrastructure de NY,
  7. les statistiques de nos infrastructures.
  8. Ce sont les chiffres
    des rapports des agences civiles.
  9. Par exemple, le département des transports
    publiera sûrement
  10. les kilomètres de voies
    qu'ils entretiennent.
  11. La MTA se vantera du nombre
    de kilomètres de rail existants.
  12. Mais la plupart des agences
    nous donnent des statistiques.
  13. Ceci vient d'un rapport de 2015
    de la Commission Taxi & Limousine ,
  14. où on apprend qu'il y a
    environ 13 500 taxis, ici, à New-York.
  15. Plutôt intéressant, non ?
  16. Mais avez vous déjà pensé
    d'où venaient ces chiffres ?
  17. Parce que pour que ces chiffres existent,
    quelqu'un à l'agence
  18. doit se dire, « Tiens, voilà un chiffre
    qui pourrait intéresser quelqu'un.
  19. C'est un chiffre qui intéresse
    nos citoyens. »
  20. Donc ils plongent dans leur données,
  21. ils comptent, ajoutent, calculent,
  22. puis ils écrivent des rapports.
  23. Et ces rapports contiennent
    ce genre de chiffres.
  24. Le problème est comment
    anticipent-ils nos questions ?
  25. Nous avons plein de questions.
  26. Il y a littéralement
    un nombre infini de questions
  27. qu'on se pose sur notre ville.
  28. Les agences ne pourront jamais suivre.
  29. Le paradigme ne marche pas vraiment
  30. et je pense que nos politiques
    s'en rendent compte,
  31. puisqu'en 2012, le maire Bloomberg
    a ratifié une loi qu'il a appelé
  32. la législation la plus ambitieuse
    et complète du pays.
  33. De bien des façons, il a raison.
  34. En deux ans, la ville a publié
    1000 jeux de données sur le portail public
  35. et c'est plutôt génial.
  36. Vous voyez de telles données,
  37. et au lieu de compter le nombre de taxis,
  38. on commence à poser d'autres questions.
  39. Donc j'ai une question :
    Quand est l'heure de pointe à New York ?
  40. C'est plutôt agaçant.
    A quelle heure exactement ?
  41. Et j'ai pensé, ces taxis ne sont pas
    que des chiffres,
  42. ce sont des traceurs GPS
    dans les rues qui enregistrent
  43. chaque virage à droite.
  44. Ce sont des données.
  45. J'ai regardé ces données
    et fait un graphe
  46. de la vitesse moyenne des taxis
    à NY pendant la journée.
  47. Vous pouvez voir que de minuit
    à environ 5h18, la vitesse augmente,
  48. et qu'à partir de là, les choses changent.
  49. Ils ralentissent encore et encore
    jusqu'à 8h35
  50. où ils arrivent à 18,5 km/h.
  51. Le taxi moyen roule à 18,5 km/h
    dans les rues de notre ville,
  52. et il apparaît que ça reste ainsi
  53. toute la journée.
  54. (Rires)
  55. Je me suis dit,
    il n'y a pas d'heure de pointe à NY,
  56. il y a un "jour de pointe".
  57. (Rires)
  58. Ça a du sens.
  59. C'est important pour deux raisons.
  60. Si vous planifiez des transports,
    ça peut être assez intéressant à savoir.
  61. Mais si voulez bouger rapidement,
  62. vous savez maintenant que
    vous mettrez votre réveil à 4h45.
  63. New York, non ?
  64. Ces données ont une histoire,
  65. ce n'était pas disponible de cette façon.
  66. C'est venu de quelque chose appelé
    une requête pour la liberté d'information,
  67. ou une requête FOIL.
  68. Ce document est sur le site
    de la Commission Taxi & Limousine.
  69. Pour accéder à ces données,
    vous avez besoin du document,
  70. de le remplir et ils vous répondront.
  71. Et un gars appelé Chris Whong
    a fait exactement ça.
  72. Chris y est allé et ils lui ont dit,
  73. « Venez avec un disque dur tout neuf,
  74. laissez-le pendant 5 heures,
    nous y copierons les données. »
  75. Voilà d'où ces données viennent.
  76. Chris est le genre à vouloir
    rendre les données publiques,
  77. et elles finissent donc en ligne,
    c'est de là que vient ce graphe.
  78. Et le fait qu'il existe est incroyable.
  79. Ces traceurs GPS - vraiment cool !
  80. Mais avoir des citoyens
    qui se baladent avec des disques durs,
  81. récupérant des données
    pour les rendre publiques ...
  82. C'était déjà un peu public,
    vous y aviez accès,
  83. c'était "public",
    ce n'était pas public.
  84. Nous pouvons faire mieux
    en tant que ville,
  85. nos citoyens ne devraient pas avoir
    besoin de demander.
  86. Aujourd'hui, tout n'est pas accessible
    avec une requête FOIL.
  87. Voici une carte que j'ai faite
    des carrefours les plus dangereux
  88. d'après les accidents cyclistes.
  89. Les zones dangereuses sont en rouge.
  90. Ça montre d'abord
    l'est de Manhattan,
  91. en particulier la partie basse
    a plus d'accidents de cyclistes.
  92. C'est sensé
  93. car il y a plus de cyclistes
    venant des ponts.
  94. D'autres lieux sont intéressants.
  95. Il y a Williamsburg.
    Il y a l'avenue Roosevelt du Queens.
  96. C'est le type de données
    nécessaire pour la vision zéro.
  97. C'est ce que nous cherchons.
  98. Il y a une histoire
    pour ces données aussi.
  99. Ces données ont une origine.
  100. Combien parmi vous connaissent ce logo ?
  101. Oui, j'en vois certains.
  102. Avez-vous déjà essayé de copier
    et coller depuis un PDF
  103. et en tirer du sens ?
  104. J'en vois plus.
  105. Plus connaissent le copier-coller PDF
    que le logo. J'aime ça.
  106. Il se trouve que les données
    que vous avez vues, viennent d'un PDF.
  107. En fait, des centaines et des centaines
    de PDF publiés par notre propre NYPD,
  108. et pour y accéder,
  109. vous devez soit les copier-coller
    pendant des centaines d'heures,
  110. soit vous êtes John Krauss.
  111. John Krauss s'est dit,
  112. je ne vais pas copier-coller ces données,
    je vais coder un programme.
  113. Il s'appelle le NYPD Crash Data Band-Aid.
  114. Il va sur le site de la NYPD
    et télécharge des PDFs.
  115. Tous les jours, il cherche ;
  116. s'il trouve un PDF, il le télécharge
  117. et il exécute un programme
    d'extraction de PDF
  118. qui donne un fichier texte,
  119. et le mettrait en ligne pour
    nous permettre de faire de telles cartes.
  120. Et le fait que ces données soit là,
    que nous y ayons accès,
  121. chaque accident, en outre,
    est une ligne dans ce tableau.
  122. Imaginez le nombre de PDFs.
  123. Le fait que nous y ayons accès est génial.
  124. Mais ne les publions pas en format PDF.
  125. Ça oblige nos citoyens
    à coder des extracteurs de PDF.
  126. Leur temps pourrait
    être mieux utilisé,
  127. et nous, comme ville,
    pouvons faire mieux.
  128. La bonne nouvelle est que
    l'administration actuelle
  129. a en fait publié ces données
    il y a quelques mois,
  130. donc nous pouvons y accéder.
  131. Mais de nombreuses données
    sont encore dans des PDFs.
  132. Par exemple, les données sur les crimes
    sont seulement en PDFs.
  133. Et pas seulement elles,
  134. notre propre budget municipal y est aussi.
  135. Notre budget municipal est lisible
    seulement en format PDF.
  136. Mais personne ne peut l'analyser car
  137. nos propres législateurs
    qui votent le budget,
  138. l'ont aussi qu'en PDF.
  139. Donc nos législateurs ne peuvent
    analyser le budget qu'ils votent.
  140. Et je pense que, comme ville,
    nous pouvons faire un peu mieux aussi.
  141. Plein de données ne sont pas
    en PDFs aujourd'hui.
  142. Voici une carte que j'ai faite.
  143. Ce sont les cours d'eau
    les plus sales de NY.
  144. Comment ai-je mesuré leur saleté ?
  145. Eh bien, c'est un peu étrange,
  146. mais j'ai regardé
    la teneur en coliformes fécaux,
  147. qui est une mesure de la matière fécale
    dans tous nos cours d'eau.
  148. Plus le cercle est grand,
    plus l'eau est sale.
  149. Les grands cercles sont les eaux sales;
    et les petits, les propres.
  150. Il s'agit des cours d'eaux intérieurs.
  151. Ce sont toutes les données rassemblées
    par la ville depuis cinq ans.
  152. Les cours d'eaux intérieurs
    sont plus souvent sales.
  153. Ça du sens, non ?
  154. Et j'ai ainsi appris quelques trucs.
  155. En un : ne jamais nager dans ce qui finit
    dans un canal ou un ruisseau
  156. Deuxièmement : j'ai aussi découvert
    les eaux les plus sales de NY
  157. avec cette mesure, une mesure.
  158. Dans le Coney Island Creek,
  159. qui n'est pas où vous nagez,
    heureusement, mais de l'autre côté.
  160. 94% des échantillons
    prélevés depuis 5 ans,
  161. avaient des niveaux
    de matières fécales si importants,
  162. qu'il aurait été illégal
    de s'y baigner.
  163. Et ce n'est pas le genre de fait
    que vous allez voir
  164. écrit en gros dans les rapports
    ou à la une de nyc.gov.
  165. Vous ne le verrez pas là-bas,
  166. mais le fait que nous ayons
    ces données est génial.
  167. Mais ce n'était pas très facile,
  168. car ces données
    n'étaient pas sur le portail.
  169. Si vous allez sur le portail de données,
  170. vous n'y verriez qu'un petit peu,
    que quelques mois.
  171. C'était en fait sur le site du département
    pour l'environnement.
  172. Chacun des liens est une feuille Excel
    et chacune d'elles est différente.
  173. Chaque en-tête change :
    vous copiez, coller, réorganiser.
  174. Et vous pouvez faire des cartes
    et c'est super mais à nouveau,
  175. nous pouvons faire mieux,
    nous pouvons normaliser les choses.
  176. Nous y arrivons grâce
    au site fait par Socrata
  177. appelé le Open Data Portal NYC.
  178. Il y a 1100 lots de données
    ne souffrant pas
  179. de ce dont je viens de parler,
  180. et ce nombre augmente,
    et c'est super.
  181. Vous pouvez télécharger ces données
    dans tous les formats, CSV, PDF ou Excel.
  182. Vous pouvez télécharger ces données
    comme vous le voulez.
  183. Le problème est qu'après,
  184. vous verrez que chaque agence
    présente son adresse à sa façon.
  185. Donc une donnera le nom de la rue,
    ou le carrefour,
  186. ou le quartier, la rue puis le bâtiment
    ou l'inverse.
  187. Donc, encore une fois, vous passez
    du temps même avec le portail,
  188. vous passez du temps à normaliser
    le champ d'adresse.
  189. Je pense que ce temps pourrait
    être mieux utilisé,
  190. nous pouvons faire mieux.
  191. Nous pouvons normaliser tout ça.
  192. Ainsi, nous pourrons
    faire plus de cartes.
  193. Voici une carte
    des bouches d'incendie de NY.
  194. Mais pas n'importe lesquelles.
  195. Ce sont les 250 plus rentables
    bouches d'incendies
  196. en terme d'amendes de stationnement.
  197. (Rires)
  198. J'ai appris quelques trucs de cette carte.
  199. De un, ne pas se garer
    dans Upper East Side.
  200. Ne le faites pas. Quelque soit l'endroit,
    vous aurez une amende.
  201. De deux, j'ai trouvé les 2 bouches
    d'incendie plus rentables de NY.
  202. C'est dans le Lower East Side,
  203. et elles rapportent plus de 55 000 dollars
    par an en contraventions.
  204. Ça m'a semblé étrange
    quand je l'ai remarqué,
  205. donc j'ai creusé un peu
    et il s'avère
  206. qu'on avait une bouche d'incendie
    et quelque chose appelé un îlot,
  207. qui est un espace de 2 mètres piéton,
  208. puis une place de parking.
  209. Donc les conducteurs viennent
    et pensent :
  210. « La bouche est là-bas, c'est bon. »
  211. et il y a en fait une belle place
    magnifiquement peinte pour eux.
  212. Ils se garent donc et la police
    qui n'est pas du même avis,
  213. leur donne une amende.
  214. Et ce n'est pas seulement moi
    qui a eu une amende.
  215. Voici la vue Google street, et on voit
    une voiture avec cette même amende.
  216. Donc je l'ai écrit sur mon blog,
    I Quant NY,
  217. et le département des transports
    a répondu :
  218. « Bien que nous n'ayons pas reçu
    de plainte à propos de cet endroit,
  219. nous allons revoir les marquages
    et faire les modifications appropriées. »
  220. J'ai pensé que c'était la réponse typique
    du gouvernement,
  221. donc j'ai continué ma vie.
  222. Mais quelques semaines plus tard,
    quelque chose d'incroyable est arrivé.
  223. Ils ont repeint l'îlot.
  224. Pour une seconde j'ai vu
    le futur des données ouvertes
  225. car pensez à ce qu'il vient d'arriver.
  226. Pendant 5 ans, cet îlot a généré
    des amendes car le marquage était confus.
  227. Puis un citoyen a vu le problème,
    il prévient la ville et peu après,
  228. le problème est résolu. C'est génial.
  229. Beaucoup voit ces données ouvertes
    comme du contrôle,
  230. mais c'est un partenariat.
  231. Nous pouvons permettre à nos citoyens
    d'aider le gouvernement,
  232. et ce n'est pas si difficile.
  233. Peu de changements sont requis.
  234. Si vous diffusez,
  235. si vous recevez de plus en plus
    de demandes de données,
  236. publiez-les, c'est un signe
    que ça devrait être public.
  237. Et si vous être une agence gouvernementale
    publiant un PDF,
  238. passons une loi qui vous oblige à publier
    également les données brutes,
  239. car ces données viennent
    de quelque part.
  240. Je ne sais pas d'où
    mais vous publiez-les avec le PDF.
  241. Adoptons des standards
    de publication de données.
  242. Commençons pas nos adresses,
    ici, à New-York.
  243. Débutons juste
    par normaliser nos adresses.
  244. Car NY est un leader
    des données ouvertes.
  245. Malgré tout, nous sommes
    un leader des données ouvertes,
  246. et si nous commençons à tout normaliser,
    et créons des standards,
  247. d'autres suivront.
  248. L'état suivra et peut-être
    le gouvernement fédéral,
  249. d'autres pays pourraient suivre,
  250. et nous ne sommes pas si loin d'un jour
    où l'on pourrait écrire un programme
  251. et cartographier
    l'information de 100 pays.
  252. Ce n'est pas de la SF,
    nous en sommes assez proches.
  253. Et par ailleurs,
    qui responsabilisons nous ?
  254. Car ce n'est pas seulement John Krauss,
    ce n'est pas que Chris Whong.
  255. Il y a des centaines de rencontres à NY
    de nos jours,
  256. des rencontres actives.
  257. Des milliers de gens assistent
    à ces rencontres.
  258. Ces personnes viennent le soir
    ou en weekend,
  259. et ils viennent à ces rencontres
    pour analyser ces données,
  260. et améliorer notre ville.
  261. Des groupes comme BetaNYC qui,
    la semaine dernière, a publié citygram.nyc
  262. qui vous permet de souscrire
    à 311 plaintes
  263. près de chez vous ou de votre bureau.
  264. Vous entrez votre adresse, et accédez
    aux plaintes.
  265. Et ce n'et pas que le milieu technologique
    qui s'intéresse à cela.
  266. Ce sont des urbanistes tels que
    mes étudiants de Pratt.
  267. Ce sont les défenseurs
    des politiques publiques,
  268. des citoyens de milieux différents.
  269. Et avec quelques petits changements,
  270. nous pouvons débloquer la passion
    et la capacité de nos citoyens
  271. à exploiter ces données
    et améliorer notre ville,
  272. même si c'est un lot de données
    ou une place de parking à la fois.
  273. Merci.
  274. (Applaudissements)