Comment nous avons trouvé la pire place de parking de New-York - en utilisant des données de masse | Ben Wellington | TEDxNewYork
-
0:17 - 0:20Près de 10 000 km de routes,
-
0:20 - 0:22près de 6 000 km de rails de métro,
-
0:22 - 0:24près de 650 km de pistes cyclables,
-
0:24 - 0:26et 800 m de rails de tram,
-
0:26 - 0:28si vous avez déjà été à Roosevelt Island.
-
0:28 - 0:30Ce sont les chiffres qui constituent
l'infrastructure de NY, -
0:30 - 0:32les statistiques de nos infrastructures.
-
0:32 - 0:35Ce sont les chiffres
des rapports des agences civiles. -
0:35 - 0:38Par exemple, le département des transports
publiera sûrement -
0:38 - 0:40les kilomètres de voies
qu'ils entretiennent. -
0:40 - 0:43La MTA se vantera du nombre
de kilomètres de rail existants. -
0:43 - 0:45Mais la plupart des agences
nous donnent des statistiques. -
0:45 - 0:48Ceci vient d'un rapport de 2015
de la Commission Taxi & Limousine , -
0:48 - 0:53où on apprend qu'il y a
environ 13 500 taxis, ici, à New-York. -
0:53 - 0:54Plutôt intéressant, non ?
-
0:54 - 0:57Mais avez vous déjà pensé
d'où venaient ces chiffres ? -
0:57 - 1:00Parce que pour que ces chiffres existent,
quelqu'un à l'agence -
1:00 - 1:03doit se dire, « Tiens, voilà un chiffre
qui pourrait intéresser quelqu'un. -
1:03 - 1:05C'est un chiffre qui intéresse
nos citoyens. » -
1:05 - 1:07Donc ils plongent dans leur données,
-
1:07 - 1:09ils comptent, ajoutent, calculent,
-
1:09 - 1:11puis ils écrivent des rapports.
-
1:11 - 1:13Et ces rapports contiennent
ce genre de chiffres. -
1:13 - 1:16Le problème est comment
anticipent-ils nos questions ? -
1:16 - 1:17Nous avons plein de questions.
-
1:17 - 1:20Il y a littéralement
un nombre infini de questions -
1:20 - 1:22qu'on se pose sur notre ville.
-
1:22 - 1:24Les agences ne pourront jamais suivre.
-
1:24 - 1:25Le paradigme ne marche pas vraiment
-
1:25 - 1:28et je pense que nos politiques
s'en rendent compte, -
1:28 - 1:32puisqu'en 2012, le maire Bloomberg
a ratifié une loi qu'il a appelé -
1:32 - 1:36la législation la plus ambitieuse
et complète du pays. -
1:36 - 1:38De bien des façons, il a raison.
-
1:38 - 1:42En deux ans, la ville a publié
1000 jeux de données sur le portail public -
1:42 - 1:44et c'est plutôt génial.
-
1:44 - 1:46Vous voyez de telles données,
-
1:46 - 1:48et au lieu de compter le nombre de taxis,
-
1:48 - 1:49on commence à poser d'autres questions.
-
1:49 - 1:52Donc j'ai une question :
Quand est l'heure de pointe à New York ? -
1:52 - 1:55C'est plutôt agaçant.
A quelle heure exactement ? -
1:55 - 1:58Et j'ai pensé, ces taxis ne sont pas
que des chiffres, -
1:58 - 2:00ce sont des traceurs GPS
dans les rues qui enregistrent -
2:00 - 2:02chaque virage à droite.
-
2:02 - 2:03Ce sont des données.
-
2:03 - 2:05J'ai regardé ces données
et fait un graphe -
2:05 - 2:08de la vitesse moyenne des taxis
à NY pendant la journée. -
2:08 - 2:13Vous pouvez voir que de minuit
à environ 5h18, la vitesse augmente, -
2:13 - 2:16et qu'à partir de là, les choses changent.
-
2:16 - 2:20Ils ralentissent encore et encore
jusqu'à 8h35 -
2:20 - 2:22où ils arrivent à 18,5 km/h.
-
2:22 - 2:26Le taxi moyen roule à 18,5 km/h
dans les rues de notre ville, -
2:26 - 2:28et il apparaît que ça reste ainsi
-
2:28 - 2:31toute la journée.
-
2:31 - 2:33(Rires)
-
2:33 - 2:35Je me suis dit,
il n'y a pas d'heure de pointe à NY, -
2:35 - 2:37il y a un "jour de pointe".
-
2:37 - 2:38(Rires)
-
2:38 - 2:39Ça a du sens.
-
2:39 - 2:40C'est important pour deux raisons.
-
2:40 - 2:44Si vous planifiez des transports,
ça peut être assez intéressant à savoir. -
2:44 - 2:46Mais si voulez bouger rapidement,
-
2:46 - 2:49vous savez maintenant que
vous mettrez votre réveil à 4h45. -
2:49 - 2:50New York, non ?
-
2:50 - 2:51Ces données ont une histoire,
-
2:51 - 2:53ce n'était pas disponible de cette façon.
-
2:53 - 2:57C'est venu de quelque chose appelé
une requête pour la liberté d'information, -
2:57 - 2:59ou une requête FOIL.
-
2:59 - 3:01Ce document est sur le site
de la Commission Taxi & Limousine. -
3:01 - 3:04Pour accéder à ces données,
vous avez besoin du document, -
3:04 - 3:06de le remplir et ils vous répondront.
-
3:06 - 3:09Et un gars appelé Chris Whong
a fait exactement ça. -
3:09 - 3:11Chris y est allé et ils lui ont dit,
-
3:11 - 3:14« Venez avec un disque dur tout neuf,
-
3:14 - 3:17laissez-le pendant 5 heures,
nous y copierons les données. » -
3:17 - 3:19Voilà d'où ces données viennent.
-
3:19 - 3:22Chris est le genre à vouloir
rendre les données publiques, -
3:22 - 3:26et elles finissent donc en ligne,
c'est de là que vient ce graphe. -
3:26 - 3:28Et le fait qu'il existe est incroyable.
-
3:28 - 3:30Ces traceurs GPS - vraiment cool !
-
3:30 - 3:32Mais avoir des citoyens
qui se baladent avec des disques durs, -
3:32 - 3:35récupérant des données
pour les rendre publiques ... -
3:35 - 3:37C'était déjà un peu public,
vous y aviez accès, -
3:37 - 3:39c'était "public",
ce n'était pas public. -
3:39 - 3:41Nous pouvons faire mieux
en tant que ville, -
3:41 - 3:44nos citoyens ne devraient pas avoir
besoin de demander. -
3:44 - 3:47Aujourd'hui, tout n'est pas accessible
avec une requête FOIL. -
3:47 - 3:50Voici une carte que j'ai faite
des carrefours les plus dangereux -
3:50 - 3:53d'après les accidents cyclistes.
-
3:53 - 3:55Les zones dangereuses sont en rouge.
-
3:55 - 3:57Ça montre d'abord
l'est de Manhattan, -
3:57 - 4:01en particulier la partie basse
a plus d'accidents de cyclistes. -
4:01 - 4:02C'est sensé
-
4:02 - 4:04car il y a plus de cyclistes
venant des ponts. -
4:04 - 4:06D'autres lieux sont intéressants.
-
4:06 - 4:09Il y a Williamsburg.
Il y a l'avenue Roosevelt du Queens. -
4:09 - 4:11C'est le type de données
nécessaire pour la vision zéro. -
4:11 - 4:14C'est ce que nous cherchons.
-
4:14 - 4:16Il y a une histoire
pour ces données aussi. -
4:16 - 4:18Ces données ont une origine.
-
4:18 - 4:21Combien parmi vous connaissent ce logo ?
-
4:21 - 4:22Oui, j'en vois certains.
-
4:22 - 4:25Avez-vous déjà essayé de copier
et coller depuis un PDF -
4:25 - 4:26et en tirer du sens ?
-
4:26 - 4:27J'en vois plus.
-
4:27 - 4:31Plus connaissent le copier-coller PDF
que le logo. J'aime ça. -
4:31 - 4:34Il se trouve que les données
que vous avez vues, viennent d'un PDF. -
4:34 - 4:39En fait, des centaines et des centaines
de PDF publiés par notre propre NYPD, -
4:39 - 4:40et pour y accéder,
-
4:40 - 4:44vous devez soit les copier-coller
pendant des centaines d'heures, -
4:44 - 4:46soit vous êtes John Krauss.
-
4:46 - 4:47John Krauss s'est dit,
-
4:47 - 4:50je ne vais pas copier-coller ces données,
je vais coder un programme. -
4:50 - 4:52Il s'appelle le NYPD Crash Data Band-Aid.
-
4:52 - 4:55Il va sur le site de la NYPD
et télécharge des PDFs. -
4:55 - 4:57Tous les jours, il cherche ;
-
4:57 - 4:59s'il trouve un PDF, il le télécharge
-
4:59 - 5:01et il exécute un programme
d'extraction de PDF -
5:01 - 5:02qui donne un fichier texte,
-
5:02 - 5:06et le mettrait en ligne pour
nous permettre de faire de telles cartes. -
5:06 - 5:09Et le fait que ces données soit là,
que nous y ayons accès, -
5:09 - 5:12chaque accident, en outre,
est une ligne dans ce tableau. -
5:12 - 5:13Imaginez le nombre de PDFs.
-
5:13 - 5:15Le fait que nous y ayons accès est génial.
-
5:15 - 5:18Mais ne les publions pas en format PDF.
-
5:18 - 5:20Ça oblige nos citoyens
à coder des extracteurs de PDF. -
5:20 - 5:22Leur temps pourrait
être mieux utilisé, -
5:22 - 5:25et nous, comme ville,
pouvons faire mieux. -
5:25 - 5:27La bonne nouvelle est que
l'administration actuelle -
5:27 - 5:30a en fait publié ces données
il y a quelques mois, -
5:30 - 5:32donc nous pouvons y accéder.
-
5:32 - 5:34Mais de nombreuses données
sont encore dans des PDFs. -
5:34 - 5:38Par exemple, les données sur les crimes
sont seulement en PDFs. -
5:38 - 5:39Et pas seulement elles,
-
5:39 - 5:42notre propre budget municipal y est aussi.
-
5:42 - 5:45Notre budget municipal est lisible
seulement en format PDF. -
5:45 - 5:47Mais personne ne peut l'analyser car
-
5:47 - 5:50nos propres législateurs
qui votent le budget, -
5:50 - 5:52l'ont aussi qu'en PDF.
-
5:52 - 5:56Donc nos législateurs ne peuvent
analyser le budget qu'ils votent. -
5:56 - 6:00Et je pense que, comme ville,
nous pouvons faire un peu mieux aussi. -
6:00 - 6:02Plein de données ne sont pas
en PDFs aujourd'hui. -
6:02 - 6:04Voici une carte que j'ai faite.
-
6:04 - 6:07Ce sont les cours d'eau
les plus sales de NY. -
6:07 - 6:08Comment ai-je mesuré leur saleté ?
-
6:08 - 6:10Eh bien, c'est un peu étrange,
-
6:10 - 6:12mais j'ai regardé
la teneur en coliformes fécaux, -
6:12 - 6:16qui est une mesure de la matière fécale
dans tous nos cours d'eau. -
6:16 - 6:19Plus le cercle est grand,
plus l'eau est sale. -
6:19 - 6:22Les grands cercles sont les eaux sales;
et les petits, les propres. -
6:22 - 6:24Il s'agit des cours d'eaux intérieurs.
-
6:24 - 6:27Ce sont toutes les données rassemblées
par la ville depuis cinq ans. -
6:27 - 6:30Les cours d'eaux intérieurs
sont plus souvent sales. -
6:30 - 6:31Ça du sens, non ?
-
6:31 - 6:33Et j'ai ainsi appris quelques trucs.
-
6:33 - 6:39En un : ne jamais nager dans ce qui finit
dans un canal ou un ruisseau -
6:39 - 6:42Deuxièmement : j'ai aussi découvert
les eaux les plus sales de NY -
6:42 - 6:44avec cette mesure, une mesure.
-
6:44 - 6:45Dans le Coney Island Creek,
-
6:45 - 6:48qui n'est pas où vous nagez,
heureusement, mais de l'autre côté. -
6:48 - 6:5394% des échantillons
prélevés depuis 5 ans, -
6:53 - 6:55avaient des niveaux
de matières fécales si importants, -
6:55 - 6:58qu'il aurait été illégal
de s'y baigner. -
6:58 - 7:01Et ce n'est pas le genre de fait
que vous allez voir -
7:01 - 7:04écrit en gros dans les rapports
ou à la une de nyc.gov. -
7:04 - 7:05Vous ne le verrez pas là-bas,
-
7:05 - 7:08mais le fait que nous ayons
ces données est génial. -
7:08 - 7:10Mais ce n'était pas très facile,
-
7:10 - 7:12car ces données
n'étaient pas sur le portail. -
7:12 - 7:14Si vous allez sur le portail de données,
-
7:14 - 7:16vous n'y verriez qu'un petit peu,
que quelques mois. -
7:16 - 7:19C'était en fait sur le site du département
pour l'environnement. -
7:19 - 7:24Chacun des liens est une feuille Excel
et chacune d'elles est différente. -
7:24 - 7:27Chaque en-tête change :
vous copiez, coller, réorganiser. -
7:27 - 7:30Et vous pouvez faire des cartes
et c'est super mais à nouveau, -
7:30 - 7:32nous pouvons faire mieux,
nous pouvons normaliser les choses. -
7:32 - 7:35Nous y arrivons grâce
au site fait par Socrata -
7:35 - 7:36appelé le Open Data Portal NYC.
-
7:36 - 7:38Il y a 1100 lots de données
ne souffrant pas -
7:38 - 7:40de ce dont je viens de parler,
-
7:40 - 7:42et ce nombre augmente,
et c'est super. -
7:42 - 7:47Vous pouvez télécharger ces données
dans tous les formats, CSV, PDF ou Excel. -
7:47 - 7:50Vous pouvez télécharger ces données
comme vous le voulez. -
7:50 - 7:51Le problème est qu'après,
-
7:51 - 7:56vous verrez que chaque agence
présente son adresse à sa façon. -
7:56 - 7:58Donc une donnera le nom de la rue,
ou le carrefour, -
7:58 - 8:00ou le quartier, la rue puis le bâtiment
ou l'inverse. -
8:00 - 8:03Donc, encore une fois, vous passez
du temps même avec le portail, -
8:03 - 8:06vous passez du temps à normaliser
le champ d'adresse. -
8:06 - 8:08Je pense que ce temps pourrait
être mieux utilisé, -
8:08 - 8:10nous pouvons faire mieux.
-
8:10 - 8:11Nous pouvons normaliser tout ça.
-
8:11 - 8:14Ainsi, nous pourrons
faire plus de cartes. -
8:14 - 8:16Voici une carte
des bouches d'incendie de NY. -
8:16 - 8:18Mais pas n'importe lesquelles.
-
8:18 - 8:20Ce sont les 250 plus rentables
bouches d'incendies -
8:20 - 8:22en terme d'amendes de stationnement.
-
8:22 - 8:25(Rires)
-
8:25 - 8:27J'ai appris quelques trucs de cette carte.
-
8:27 - 8:30De un, ne pas se garer
dans Upper East Side. -
8:30 - 8:34Ne le faites pas. Quelque soit l'endroit,
vous aurez une amende. -
8:34 - 8:38De deux, j'ai trouvé les 2 bouches
d'incendie plus rentables de NY. -
8:38 - 8:39C'est dans le Lower East Side,
-
8:39 - 8:45et elles rapportent plus de 55 000 dollars
par an en contraventions. -
8:45 - 8:47Ça m'a semblé étrange
quand je l'ai remarqué, -
8:47 - 8:49donc j'ai creusé un peu
et il s'avère -
8:49 - 8:53qu'on avait une bouche d'incendie
et quelque chose appelé un îlot, -
8:53 - 8:54qui est un espace de 2 mètres piéton,
-
8:54 - 8:56puis une place de parking.
-
8:56 - 8:58Donc les conducteurs viennent
et pensent : -
8:58 - 8:59« La bouche est là-bas, c'est bon. »
-
8:59 - 9:02et il y a en fait une belle place
magnifiquement peinte pour eux. -
9:02 - 9:05Ils se garent donc et la police
qui n'est pas du même avis, -
9:05 - 9:06leur donne une amende.
-
9:06 - 9:09Et ce n'est pas seulement moi
qui a eu une amende. -
9:09 - 9:14Voici la vue Google street, et on voit
une voiture avec cette même amende. -
9:14 - 9:16Donc je l'ai écrit sur mon blog,
I Quant NY, -
9:16 - 9:18et le département des transports
a répondu : -
9:18 - 9:23« Bien que nous n'ayons pas reçu
de plainte à propos de cet endroit, -
9:23 - 9:27nous allons revoir les marquages
et faire les modifications appropriées. » -
9:27 - 9:30J'ai pensé que c'était la réponse typique
du gouvernement, -
9:30 - 9:32donc j'ai continué ma vie.
-
9:32 - 9:37Mais quelques semaines plus tard,
quelque chose d'incroyable est arrivé. -
9:37 - 9:39Ils ont repeint l'îlot.
-
9:39 - 9:41Pour une seconde j'ai vu
le futur des données ouvertes -
9:41 - 9:43car pensez à ce qu'il vient d'arriver.
-
9:43 - 9:48Pendant 5 ans, cet îlot a généré
des amendes car le marquage était confus. -
9:48 - 9:53Puis un citoyen a vu le problème,
il prévient la ville et peu après, -
9:53 - 9:55le problème est résolu. C'est génial.
-
9:55 - 9:58Beaucoup voit ces données ouvertes
comme du contrôle, -
9:58 - 9:59mais c'est un partenariat.
-
9:59 - 10:03Nous pouvons permettre à nos citoyens
d'aider le gouvernement, -
10:03 - 10:04et ce n'est pas si difficile.
-
10:04 - 10:06Peu de changements sont requis.
-
10:06 - 10:07Si vous diffusez,
-
10:07 - 10:09si vous recevez de plus en plus
de demandes de données, -
10:09 - 10:12publiez-les, c'est un signe
que ça devrait être public. -
10:12 - 10:15Et si vous être une agence gouvernementale
publiant un PDF, -
10:15 - 10:19passons une loi qui vous oblige à publier
également les données brutes, -
10:19 - 10:21car ces données viennent
de quelque part. -
10:21 - 10:24Je ne sais pas d'où
mais vous publiez-les avec le PDF. -
10:24 - 10:26Adoptons des standards
de publication de données. -
10:26 - 10:29Commençons pas nos adresses,
ici, à New-York. -
10:29 - 10:31Débutons juste
par normaliser nos adresses. -
10:31 - 10:33Car NY est un leader
des données ouvertes. -
10:33 - 10:35Malgré tout, nous sommes
un leader des données ouvertes, -
10:35 - 10:38et si nous commençons à tout normaliser,
et créons des standards, -
10:38 - 10:39d'autres suivront.
-
10:39 - 10:42L'état suivra et peut-être
le gouvernement fédéral, -
10:42 - 10:43d'autres pays pourraient suivre,
-
10:43 - 10:47et nous ne sommes pas si loin d'un jour
où l'on pourrait écrire un programme -
10:47 - 10:49et cartographier
l'information de 100 pays. -
10:49 - 10:52Ce n'est pas de la SF,
nous en sommes assez proches. -
10:52 - 10:54Et par ailleurs,
qui responsabilisons nous ? -
10:54 - 10:58Car ce n'est pas seulement John Krauss,
ce n'est pas que Chris Whong. -
10:58 - 11:01Il y a des centaines de rencontres à NY
de nos jours, -
11:01 - 11:02des rencontres actives.
-
11:02 - 11:05Des milliers de gens assistent
à ces rencontres. -
11:05 - 11:07Ces personnes viennent le soir
ou en weekend, -
11:07 - 11:10et ils viennent à ces rencontres
pour analyser ces données, -
11:10 - 11:11et améliorer notre ville.
-
11:11 - 11:16Des groupes comme BetaNYC qui,
la semaine dernière, a publié citygram.nyc -
11:16 - 11:18qui vous permet de souscrire
à 311 plaintes -
11:18 - 11:20près de chez vous ou de votre bureau.
-
11:20 - 11:23Vous entrez votre adresse, et accédez
aux plaintes. -
11:23 - 11:26Et ce n'et pas que le milieu technologique
qui s'intéresse à cela. -
11:26 - 11:28Ce sont des urbanistes tels que
mes étudiants de Pratt. -
11:28 - 11:31Ce sont les défenseurs
des politiques publiques, -
11:31 - 11:33des citoyens de milieux différents.
-
11:33 - 11:36Et avec quelques petits changements,
-
11:36 - 11:39nous pouvons débloquer la passion
et la capacité de nos citoyens -
11:39 - 11:42à exploiter ces données
et améliorer notre ville, -
11:42 - 11:46même si c'est un lot de données
ou une place de parking à la fois. -
11:46 - 11:47Merci.
-
11:47 - 11:50(Applaudissements)
- Title:
- Comment nous avons trouvé la pire place de parking de New-York - en utilisant des données de masse | Ben Wellington | TEDxNewYork
- Description:
-
Les agences municipales ont accès à une richesse de données et de statistiques décrivant chaque aspect de la vie urbaine. Mais comme l'analyste Ben Wellington le suggère dans cette conférence amusante, elles ne savent parfois pas quoi faire avec. Il montre comment une combinaison de questions inattendues et un traitement intelligent des données peut produire des idées étrangement utiles, et partage des conseils sur comment publier ces énormes jeux de données pour que n'importe qui puisse les utiliser.
- Video Language:
- English
- Team:
- closed TED
- Project:
- TEDxTalks
- Duration:
- 11:52