Près de 10 000 km de routes,
près de 6 000 km de rails de métro,
près de 650 km de pistes cyclables,
et 800 m de rails de tram,
si vous avez déjà été à Roosevelt Island.
Ce sont les chiffres qui constituent
l'infrastructure de NY,
les statistiques de nos infrastructures.
Ce sont les chiffres
des rapports des agences civiles.
Par exemple, le département des transports
publiera sûrement
les kilomètres de voies
qu'ils entretiennent.
La MTA se vantera du nombre
de kilomètres de rail existants.
Mais la plupart des agences
nous donnent des statistiques.
Ceci vient d'un rapport de 2015
de la Commission Taxi & Limousine ,
où on apprend qu'il y a
environ 13 500 taxis, ici, à New-York.
Plutôt intéressant, non ?
Mais avez vous déjà pensé
d'où venaient ces chiffres ?
Parce que pour que ces chiffres existent,
quelqu'un à l'agence
doit se dire, « Tiens, voilà un chiffre
qui pourrait intéresser quelqu'un.
C'est un chiffre qui intéresse
nos citoyens. »
Donc ils plongent dans leur données,
ils comptent, ajoutent, calculent,
puis ils écrivent des rapports.
Et ces rapports contiennent
ce genre de chiffres.
Le problème est comment
anticipent-ils nos questions ?
Nous avons plein de questions.
Il y a littéralement
un nombre infini de questions
qu'on se pose sur notre ville.
Les agences ne pourront jamais suivre.
Le paradigme ne marche pas vraiment
et je pense que nos politiques
s'en rendent compte,
puisqu'en 2012, le maire Bloomberg
a ratifié une loi qu'il a appelé
la législation la plus ambitieuse
et complète du pays.
De bien des façons, il a raison.
En deux ans, la ville a publié
1000 jeux de données sur le portail public
et c'est plutôt génial.
Vous voyez de telles données,
et au lieu de compter le nombre de taxis,
on commence à poser d'autres questions.
Donc j'ai une question :
Quand est l'heure de pointe à New York ?
C'est plutôt agaçant.
A quelle heure exactement ?
Et j'ai pensé, ces taxis ne sont pas
que des chiffres,
ce sont des traceurs GPS
dans les rues qui enregistrent
chaque virage à droite.
Ce sont des données.
J'ai regardé ces données
et fait un graphe
de la vitesse moyenne des taxis
à NY pendant la journée.
Vous pouvez voir que de minuit
à environ 5h18, la vitesse augmente,
et qu'à partir de là, les choses changent.
Ils ralentissent encore et encore
jusqu'à 8h35
où ils arrivent à 18,5 km/h.
Le taxi moyen roule à 18,5 km/h
dans les rues de notre ville,
et il apparaît que ça reste ainsi
toute la journée.
(Rires)
Je me suis dit,
il n'y a pas d'heure de pointe à NY,
il y a un "jour de pointe".
(Rires)
Ça a du sens.
C'est important pour deux raisons.
Si vous planifiez des transports,
ça peut être assez intéressant à savoir.
Mais si voulez bouger rapidement,
vous savez maintenant que
vous mettrez votre réveil à 4h45.
New York, non ?
Ces données ont une histoire,
ce n'était pas disponible de cette façon.
C'est venu de quelque chose appelé
une requête pour la liberté d'information,
ou une requête FOIL.
Ce document est sur le site
de la Commission Taxi & Limousine.
Pour accéder à ces données,
vous avez besoin du document,
de le remplir et ils vous répondront.
Et un gars appelé Chris Whong
a fait exactement ça.
Chris y est allé et ils lui ont dit,
« Venez avec un disque dur tout neuf,
laissez-le pendant 5 heures,
nous y copierons les données. »
Voilà d'où ces données viennent.
Chris est le genre à vouloir
rendre les données publiques,
et elles finissent donc en ligne,
c'est de là que vient ce graphe.
Et le fait qu'il existe est incroyable.
Ces traceurs GPS - vraiment cool !
Mais avoir des citoyens
qui se baladent avec des disques durs,
récupérant des données
pour les rendre publiques ...
C'était déjà un peu public,
vous y aviez accès,
c'était "public",
ce n'était pas public.
Nous pouvons faire mieux
en tant que ville,
nos citoyens ne devraient pas avoir
besoin de demander.
Aujourd'hui, tout n'est pas accessible
avec une requête FOIL.
Voici une carte que j'ai faite
des carrefours les plus dangereux
d'après les accidents cyclistes.
Les zones dangereuses sont en rouge.
Ça montre d'abord
l'est de Manhattan,
en particulier la partie basse
a plus d'accidents de cyclistes.
C'est sensé
car il y a plus de cyclistes
venant des ponts.
D'autres lieux sont intéressants.
Il y a Williamsburg.
Il y a l'avenue Roosevelt du Queens.
C'est le type de données
nécessaire pour la vision zéro.
C'est ce que nous cherchons.
Il y a une histoire
pour ces données aussi.
Ces données ont une origine.
Combien parmi vous connaissent ce logo ?
Oui, j'en vois certains.
Avez-vous déjà essayé de copier
et coller depuis un PDF
et en tirer du sens ?
J'en vois plus.
Plus connaissent le copier-coller PDF
que le logo. J'aime ça.
Il se trouve que les données
que vous avez vues, viennent d'un PDF.
En fait, des centaines et des centaines
de PDF publiés par notre propre NYPD,
et pour y accéder,
vous devez soit les copier-coller
pendant des centaines d'heures,
soit vous êtes John Krauss.
John Krauss s'est dit,
je ne vais pas copier-coller ces données,
je vais coder un programme.
Il s'appelle le NYPD Crash Data Band-Aid.
Il va sur le site de la NYPD
et télécharge des PDFs.
Tous les jours, il cherche ;
s'il trouve un PDF, il le télécharge
et il exécute un programme
d'extraction de PDF
qui donne un fichier texte,
et le mettrait en ligne pour
nous permettre de faire de telles cartes.
Et le fait que ces données soit là,
que nous y ayons accès,
chaque accident, en outre,
est une ligne dans ce tableau.
Imaginez le nombre de PDFs.
Le fait que nous y ayons accès est génial.
Mais ne les publions pas en format PDF.
Ça oblige nos citoyens
à coder des extracteurs de PDF.
Leur temps pourrait
être mieux utilisé,
et nous, comme ville,
pouvons faire mieux.
La bonne nouvelle est que
l'administration actuelle
a en fait publié ces données
il y a quelques mois,
donc nous pouvons y accéder.
Mais de nombreuses données
sont encore dans des PDFs.
Par exemple, les données sur les crimes
sont seulement en PDFs.
Et pas seulement elles,
notre propre budget municipal y est aussi.
Notre budget municipal est lisible
seulement en format PDF.
Mais personne ne peut l'analyser car
nos propres législateurs
qui votent le budget,
l'ont aussi qu'en PDF.
Donc nos législateurs ne peuvent
analyser le budget qu'ils votent.
Et je pense que, comme ville,
nous pouvons faire un peu mieux aussi.
Plein de données ne sont pas
en PDFs aujourd'hui.
Voici une carte que j'ai faite.
Ce sont les cours d'eau
les plus sales de NY.
Comment ai-je mesuré leur saleté ?
Eh bien, c'est un peu étrange,
mais j'ai regardé
la teneur en coliformes fécaux,
qui est une mesure de la matière fécale
dans tous nos cours d'eau.
Plus le cercle est grand,
plus l'eau est sale.
Les grands cercles sont les eaux sales;
et les petits, les propres.
Il s'agit des cours d'eaux intérieurs.
Ce sont toutes les données rassemblées
par la ville depuis cinq ans.
Les cours d'eaux intérieurs
sont plus souvent sales.
Ça du sens, non ?
Et j'ai ainsi appris quelques trucs.
En un : ne jamais nager dans ce qui finit
dans un canal ou un ruisseau
Deuxièmement : j'ai aussi découvert
les eaux les plus sales de NY
avec cette mesure, une mesure.
Dans le Coney Island Creek,
qui n'est pas où vous nagez,
heureusement, mais de l'autre côté.
94% des échantillons
prélevés depuis 5 ans,
avaient des niveaux
de matières fécales si importants,
qu'il aurait été illégal
de s'y baigner.
Et ce n'est pas le genre de fait
que vous allez voir
écrit en gros dans les rapports
ou à la une de nyc.gov.
Vous ne le verrez pas là-bas,
mais le fait que nous ayons
ces données est génial.
Mais ce n'était pas très facile,
car ces données
n'étaient pas sur le portail.
Si vous allez sur le portail de données,
vous n'y verriez qu'un petit peu,
que quelques mois.
C'était en fait sur le site du département
pour l'environnement.
Chacun des liens est une feuille Excel
et chacune d'elles est différente.
Chaque en-tête change :
vous copiez, coller, réorganiser.
Et vous pouvez faire des cartes
et c'est super mais à nouveau,
nous pouvons faire mieux,
nous pouvons normaliser les choses.
Nous y arrivons grâce
au site fait par Socrata
appelé le Open Data Portal NYC.
Il y a 1100 lots de données
ne souffrant pas
de ce dont je viens de parler,
et ce nombre augmente,
et c'est super.
Vous pouvez télécharger ces données
dans tous les formats, CSV, PDF ou Excel.
Vous pouvez télécharger ces données
comme vous le voulez.
Le problème est qu'après,
vous verrez que chaque agence
présente son adresse à sa façon.
Donc une donnera le nom de la rue,
ou le carrefour,
ou le quartier, la rue puis le bâtiment
ou l'inverse.
Donc, encore une fois, vous passez
du temps même avec le portail,
vous passez du temps à normaliser
le champ d'adresse.
Je pense que ce temps pourrait
être mieux utilisé,
nous pouvons faire mieux.
Nous pouvons normaliser tout ça.
Ainsi, nous pourrons
faire plus de cartes.
Voici une carte
des bouches d'incendie de NY.
Mais pas n'importe lesquelles.
Ce sont les 250 plus rentables
bouches d'incendies
en terme d'amendes de stationnement.
(Rires)
J'ai appris quelques trucs de cette carte.
De un, ne pas se garer
dans Upper East Side.
Ne le faites pas. Quelque soit l'endroit,
vous aurez une amende.
De deux, j'ai trouvé les 2 bouches
d'incendie plus rentables de NY.
C'est dans le Lower East Side,
et elles rapportent plus de 55 000 dollars
par an en contraventions.
Ça m'a semblé étrange
quand je l'ai remarqué,
donc j'ai creusé un peu
et il s'avère
qu'on avait une bouche d'incendie
et quelque chose appelé un îlot,
qui est un espace de 2 mètres piéton,
puis une place de parking.
Donc les conducteurs viennent
et pensent :
« La bouche est là-bas, c'est bon. »
et il y a en fait une belle place
magnifiquement peinte pour eux.
Ils se garent donc et la police
qui n'est pas du même avis,
leur donne une amende.
Et ce n'est pas seulement moi
qui a eu une amende.
Voici la vue Google street, et on voit
une voiture avec cette même amende.
Donc je l'ai écrit sur mon blog,
I Quant NY,
et le département des transports
a répondu :
« Bien que nous n'ayons pas reçu
de plainte à propos de cet endroit,
nous allons revoir les marquages
et faire les modifications appropriées. »
J'ai pensé que c'était la réponse typique
du gouvernement,
donc j'ai continué ma vie.
Mais quelques semaines plus tard,
quelque chose d'incroyable est arrivé.
Ils ont repeint l'îlot.
Pour une seconde j'ai vu
le futur des données ouvertes
car pensez à ce qu'il vient d'arriver.
Pendant 5 ans, cet îlot a généré
des amendes car le marquage était confus.
Puis un citoyen a vu le problème,
il prévient la ville et peu après,
le problème est résolu. C'est génial.
Beaucoup voit ces données ouvertes
comme du contrôle,
mais c'est un partenariat.
Nous pouvons permettre à nos citoyens
d'aider le gouvernement,
et ce n'est pas si difficile.
Peu de changements sont requis.
Si vous diffusez,
si vous recevez de plus en plus
de demandes de données,
publiez-les, c'est un signe
que ça devrait être public.
Et si vous être une agence gouvernementale
publiant un PDF,
passons une loi qui vous oblige à publier
également les données brutes,
car ces données viennent
de quelque part.
Je ne sais pas d'où
mais vous publiez-les avec le PDF.
Adoptons des standards
de publication de données.
Commençons pas nos adresses,
ici, à New-York.
Débutons juste
par normaliser nos adresses.
Car NY est un leader
des données ouvertes.
Malgré tout, nous sommes
un leader des données ouvertes,
et si nous commençons à tout normaliser,
et créons des standards,
d'autres suivront.
L'état suivra et peut-être
le gouvernement fédéral,
d'autres pays pourraient suivre,
et nous ne sommes pas si loin d'un jour
où l'on pourrait écrire un programme
et cartographier
l'information de 100 pays.
Ce n'est pas de la SF,
nous en sommes assez proches.
Et par ailleurs,
qui responsabilisons nous ?
Car ce n'est pas seulement John Krauss,
ce n'est pas que Chris Whong.
Il y a des centaines de rencontres à NY
de nos jours,
des rencontres actives.
Des milliers de gens assistent
à ces rencontres.
Ces personnes viennent le soir
ou en weekend,
et ils viennent à ces rencontres
pour analyser ces données,
et améliorer notre ville.
Des groupes comme BetaNYC qui,
la semaine dernière, a publié citygram.nyc
qui vous permet de souscrire
à 311 plaintes
près de chez vous ou de votre bureau.
Vous entrez votre adresse, et accédez
aux plaintes.
Et ce n'et pas que le milieu technologique
qui s'intéresse à cela.
Ce sont des urbanistes tels que
mes étudiants de Pratt.
Ce sont les défenseurs
des politiques publiques,
des citoyens de milieux différents.
Et avec quelques petits changements,
nous pouvons débloquer la passion
et la capacité de nos citoyens
à exploiter ces données
et améliorer notre ville,
même si c'est un lot de données
ou une place de parking à la fois.
Merci.
(Applaudissements)