Return to Video

Comment l'analyse de données générales m'a permis de trouver les pires endroits où se garer à New York

  • 0:01 - 0:04
    10 000 km de routes,
  • 0:04 - 0:06
    1000 km de rails de métro,
  • 0:06 - 0:07
    640 km d'aménagements cyclables
  • 0:07 - 0:09
    et un tramway aérien de 945 m reliant
  • 0:09 - 0:11
    Manhattan à Roosevelt Island.
  • 0:11 - 0:14
    Ces quelques nombres décrivent
    l'infrastructure routière
  • 0:14 - 0:17
    de la ville de New York.
  • 0:17 - 0:20
    Les rapports des organismes
    municipaux contiennent ces données.
  • 0:20 - 0:23
    Le département des transports, vous dira
  • 0:23 - 0:24
    le nombre de km de routes entretenus
  • 0:24 - 0:27
    Le MTA se vantera du nombre de km
    de voies de métro.
  • 0:27 - 0:29
    La plupart des organismes établissent
    des statistiques.
  • 0:29 - 0:32
    Voici des données
    d'un rapport de cette année
  • 0:32 - 0:33
    de la commission des taxis,
  • 0:33 - 0:36
    qui nous apprennent qu'il y a environ
    13 500 taxis ici à New York.
  • 0:36 - 0:38
    Intéressant, n'est-ce pas?
  • 0:38 - 0:41
    Mais vous êtes-vous déjà demandé
    d'où viennent ces nombres?
  • 0:41 - 0:44
    Pour qu'ils existent,
    des fonctionnaires ont dû
  • 0:44 - 0:48
    s'arrêter et se dire, hum, voici une
    donnée qui intéresse peut-être quelqu'un.
  • 0:48 - 0:50
    Voilà un nombre dont
    nos citoyens ont besoin.
  • 0:50 - 0:52
    Ils sortent alors leurs
    données brutes,
  • 0:52 - 0:53
    comptent, ajoutent, calculent,
  • 0:53 - 0:55
    et rédigent des rapports
  • 0:55 - 0:57
    contenant de nouveaux chiffres.
  • 0:57 - 1:00
    Mais le problème : comment
    devinent-ils nos questions?
  • 1:00 - 1:01
    Nous en avons beaucoup.
  • 1:01 - 1:05
    En fait, le nombre de questions
    que nous nous posons sur notre ville
  • 1:05 - 1:06
    est infini et les organismes
  • 1:06 - 1:08
    peinent à nous suivre.
  • 1:08 - 1:12
    Cette façon de faire n'est pas au point et
    je crois que nos décideurs le réalisent,
  • 1:12 - 1:16
    car en 2012, le maire Bloomberg
    a signé ce qu'il a appelé la mesure
  • 1:16 - 1:20
    législative sur les données ouvertes
    la plus ambitieuse et exhaustive au pays.
  • 1:20 - 1:21
    Il a raison à bien des égards.
  • 1:21 - 1:24
    En deux ans, la ville a publié
    1000 jeux de données sur notre
  • 1:24 - 1:26
    portail des données ouvertes,
  • 1:26 - 1:27
    ce qui n'est pas mal.
  • 1:27 - 1:29
    Vous regardez des données comme celles-là
  • 1:29 - 1:32
    et vous commencez à vous
    poser des questions qui
  • 1:32 - 1:34
    vont au-delà du simple
    nombre de taxis.
  • 1:34 - 1:35
    Moi, je me suis demandé,
  • 1:35 - 1:36
    quelle est l'heure de pointe à NY?
  • 1:36 - 1:39
    La réponse ne nous vient
    pas naturellement.
  • 1:39 - 1:42
    Et je me suis dit, ces taxis sont
    plus que des nombres,
  • 1:42 - 1:44
    ils transportent des GPS qui enregistrent
  • 1:44 - 1:46
    chaque course qu'ils font.
  • 1:46 - 1:49
    J'ai donc jeté un œil à ces données,
  • 1:49 - 1:53
    et j'ai tracé une courbe de la vitesse
    moyenne des taxis durant la journée.
  • 1:53 - 1:56
    Vous pouvez voir qu'à partir de minuit
    jusqu'à environ 5 h 18,
  • 1:56 - 2:00
    la vitesse augmente,
    puis les choses se gâtent et
  • 2:00 - 2:04
    la vitesse décroît et décroît
    et décroît jusqu'à 8 h 35,
  • 2:04 - 2:06
    où elle se stabilise à environ
    18,5 km par heure.
  • 2:06 - 2:10
    Les taxis roulent en moyenne à 18,5 km/h
    dans les rues de notre ville,
  • 2:10 - 2:12
    et leur vitesse demeure telle quelle
  • 2:12 - 2:15
    toute la journée.
  • 2:15 - 2:16
    (Rires)
  • 2:16 - 2:20
    J'en conclus donc qu'il n'y a pas
    d'heure de pointe à New York,
  • 2:20 - 2:21
    mais des journées de pointe.
  • 2:21 - 2:24
    Logique. Et c'est important
    pour diverses raisons.
  • 2:24 - 2:28
    Si vous travaillez dans le domaine du
    transport, c'est intéressant pour vous.
  • 2:28 - 2:30
    Et si vous êtes quelqu'un de pressé,
  • 2:30 - 2:32
    vous savez maintenant que vous
    devez vous réveiller à 4 h 45.
  • 2:32 - 2:34
    New York, non?
  • 2:34 - 2:36
    Mais ces données
    ont elles aussi une
  • 2:36 - 2:38
    histoire : elles n'étaient
    publiées nulle part
  • 2:38 - 2:41
    et ont été obtenues par suite d'une
    demande faite en vertu
  • 2:41 - 2:43
    de la loi del’accès à l’information.
  • 2:43 - 2:46
    Le formulaire pour faire une telle
    demande est sur le site de la TLC.
  • 2:46 - 2:49
    Pour obtenir les données, vous
    devez le remplir, l'envoyer, puis
  • 2:49 - 2:51
    attendre qu'on communique avec nous.
  • 2:51 - 2:53
    C'est ce qu'a fait Chris Whong.
  • 2:53 - 2:55
    Voici ce que le TLC lui a demandé :
  • 2:55 - 2:58
    « Apportez-nous un disque
    dur neuf. Nous y copierons
  • 2:58 - 3:01
    les données et vous pourrez venir le
    chercher cinq heures plus tard. »
  • 3:01 - 3:03
    Voilà d'où les données proviennent.
  • 3:03 - 3:06
    Chris est de ceux qui veulent
    que de telles données soient
  • 3:06 - 3:10
    publiques, et il les a mis en ligne,
    ce qui m'a permis de faire la carte.
  • 3:10 - 3:14
    Le fait que ces enregistrements GPS
    existent -- vraiment cool.
  • 3:14 - 3:17
    Mais le fait que des citoyens
    se promènent avec des disques durs
  • 3:17 - 3:19
    pour aller chercher des données,
  • 3:19 - 3:22
    qui en soi sont « publiques », mais
  • 3:22 - 3:23
    qui ne sont pas rendues publiques,
  • 3:23 - 3:25
    nous pouvons faire mieux comme ville.
  • 3:25 - 3:28
    Nul besoin que nos citoyens
    trimbalent des disques durs.
  • 3:28 - 3:31
    Mais certaines données
    sont déjà à disposition.
  • 3:31 - 3:34
    Voici une carte que j'ai créée des
    intersections de NY enregistrant le plus
  • 3:34 - 3:36
    d'accidents impliquant des cyclistes.
  • 3:36 - 3:38
    Les zones rouges sont
    les plus dangereuses.
  • 3:38 - 3:41
    Ce que l'on observe, c'est
    que la portion est de l'île,
  • 3:41 - 3:45
    particulièrement dans le sud de la
    ville, enregistre le plus d'accidents.
  • 3:45 - 3:46
    Ce n'est pas illogique,
  • 3:46 - 3:48
    car beaucoup de cyclistes
    sortent du pont à cet endroit.
  • 3:48 - 3:50
    Mais d'autres zones,
    comme Williamsburg,
  • 3:50 - 3:53
    Roosevelt Avenue dans Queens,
    méritent notre attention.
  • 3:53 - 3:55
    C'est le genre de données
    dont Vision Zero a besoin.
  • 3:55 - 3:58
    C'est ce qui fait notre bonheur.
  • 3:58 - 4:00
    Mais encore une fois,
    il y a une histoire
  • 4:00 - 4:02
    à raconter au sujet de ces données.
  • 4:02 - 4:04
    Combien d'entre vous connaissent ce logo?
  • 4:04 - 4:06
    Je vois des hochements de tête.
  • 4:06 - 4:08
    Avez-vous déjà copié et
    collé des données d'un PDF,
  • 4:08 - 4:10
    puis essayé d'y voir clair?
  • 4:10 - 4:11
    Vous l'êtes apparemment.
  • 4:11 - 4:14
    Plus à avoir fait du copier-coller
    qu'à reconnaître le logo. Intéressant.
  • 4:14 - 4:18
    Les données que vous avez vues
    se trouvaient à l'origine dans un PDF.
  • 4:18 - 4:21
    En fait, dans un PDF de
    plusieurs centaines de pages
  • 4:21 - 4:23
    créé par notre service de police,
  • 4:23 - 4:26
    et pour pouvoir les utiliser, vous
    deviez faire du copier-coller,
  • 4:26 - 4:28
    pendant des heures,
  • 4:28 - 4:29
    ou vous appelez John Krauss.
  • 4:29 - 4:30
    John Krauss s'est dit,
  • 4:30 - 4:34
    je ne vais pas copier ces données,
    mais plutôt créer un programme,
  • 4:34 - 4:36
    le NYPD Crash Data Band-Aid,
  • 4:36 - 4:39
    qui se promène sur le site Web du NYPD
    pour y dénicher des PDF.
  • 4:39 - 4:42
    Chaque jour, il cherche,
    trouve et télécharge des PDF,
  • 4:42 - 4:44
    puis en extrait le contenu qu'il
  • 4:44 - 4:46
    transforme en texte et
  • 4:46 - 4:49
    qu'il publie sur le Web, pour que
    l'on puisse faire des cartes.
  • 4:49 - 4:53
    Et le fait que nous ayons ces données --
  • 4:53 - 4:55
    en passant, chaque ligne
    du tableau est un accident.
  • 4:55 - 4:57
    Vous pouvez imaginer le nombre de PDF.
  • 4:57 - 4:59
    Le fait que nous y ayons
    accès est formidable,
  • 4:59 - 5:01
    mais ne les publions pas dans des PDF,
  • 5:01 - 5:04
    car nos citoyens chercheront
    le moyen de les en extraire.
  • 5:04 - 5:06
    Nos citoyens n'ont pas de temps à perdre,
  • 5:06 - 5:08
    et comme ville nous pouvons offrir mieux.
  • 5:08 - 5:11
    La bonne nouvelle, c'est
    que l'administration Blasio
  • 5:11 - 5:13
    a publié ces données il y a quelques mois,
  • 5:13 - 5:15
    Mais beaucoup de données restent enfermées
  • 5:15 - 5:18
    dans des PDF, ce qui est notamment le cas
  • 5:18 - 5:21
    des données sur les crimes.
  • 5:21 - 5:25
    Tout comme du budget
    de notre propre ville.
  • 5:25 - 5:29
    Le budget de NY n'est actuellement
    disponible qu'en format PDF.
  • 5:29 - 5:31
    Nous ne sommes pas les
    seuls que cela embête.
  • 5:31 - 5:34
    Nos propres législateurs, ceux
    qui votent le budget,
  • 5:34 - 5:36
    le reçoivent en PDF.
  • 5:36 - 5:40
    Nos législateurs ne peuvent pas
    analyser le budget qu'ils votent.
  • 5:40 - 5:43
    Et je crois que comme ville nous
    pouvons faire un peu mieux que cela.
  • 5:43 - 5:46
    Toutes les données ne sont
    pas cachées dans des PDF.
  • 5:46 - 5:47
    Voici une carte que j'ai faite
  • 5:47 - 5:50
    des voies de navigation
    les plus sales de New York.
  • 5:50 - 5:52
    Que veux-je dire par sale?
  • 5:52 - 5:54
    C'est quelque peu étrange,
  • 5:54 - 5:56
    mais j'ai pris le nombre
    de coliformes fécaux,
  • 5:56 - 5:59
    soit la quantité de matière fécale,
    dans chacune de nos voies d'eau.
  • 5:59 - 6:03
    Plus le cercle est grand,
    plus l'eau est sale,
  • 6:03 - 6:06
    et vice versa.
    Ce que vous voyez ce sont
  • 6:06 - 6:08
    les voies navigables intérieures.
  • 6:08 - 6:11
    Il s'agit de données que la ville
    recueille depuis cinq ans.
  • 6:11 - 6:14
    Les voies intérieures sont
    généralement plus sales,
  • 6:14 - 6:15
    C'est assez évident, non?
  • 6:15 - 6:18
    Voici ce que j'ai découvert
    grâce à cette carte.
  • 6:18 - 6:22
    Premièrement, il ne faut jamais nager
    dans un « creek » ou un « canal ».
  • 6:22 - 6:26
    Deuxièmement, la voie la plus sale
    de New York est Coney Island Creek,
  • 6:26 - 6:28
    d'après cette mesure.
  • 6:28 - 6:31
    Ce n'est heureusement pas le Coney
    Island où vous vous baignez.
  • 6:31 - 6:32
    C'est de l'autre côté.
  • 6:32 - 6:36
    Mais à Coney Island Creek, 94 % des
    échantillons prélevés depuis cinq ans
  • 6:36 - 6:38
    contenaient tellement de coliformes fécaux
  • 6:38 - 6:41
    que les lois de l'État le rendent
    impropre à la baignade.
  • 6:41 - 6:44
    Et ce n'est pas le genre
    de faits que les rapports
  • 6:44 - 6:46
    de la ville contiennent ou qui
  • 6:46 - 6:48
    figure sur la page d'accueil
    du nyc.gov, non?
  • 6:48 - 6:50
    Vous ne les y verrez pas, mais
  • 6:50 - 6:52
    le fait qu'on puisse trouver
    ces données est génial.
  • 6:52 - 6:54
    Ici encore, ce ne fut pas facile, car
  • 6:54 - 6:56
    elles ne figuraient pas
    dans le portail des
  • 6:56 - 6:58
    données ouvertes, où vous trouverez
  • 6:58 - 7:01
    seulement des chiffres pour
    un an ou quelques mois.
  • 7:01 - 7:04
    Elles étaient plutôt sur le site
    du DEP de la ville de NY.
  • 7:04 - 7:08
    Chacun de ces liens ouvre un tableur Excel
    différent, avec des titres différents.
  • 7:08 - 7:10
    Vous copiez, collez, réorganisez le tout,
  • 7:10 - 7:13
    puis faites des cartes et
    c'est bien, mais encore une fois,
  • 7:13 - 7:16
    nous pouvons faire mieux comme
    ville et établir des normes.
  • 7:16 - 7:19
    Et nous y arrivons par des sites
    Web comme celui de Socrata
  • 7:19 - 7:20
    appelé l'Open Data Portal NYC,
  • 7:20 - 7:22
    où 1100 jeux de données,
    qui ne souffrent pas
  • 7:22 - 7:24
    des maux que j'ai décrits se trouvent,
  • 7:24 - 7:26
    et leur nombre ne
    cesse de croître.
  • 7:26 - 7:29
    Vous pouvez y télécharger les données
    que vous voulez dans une foule
  • 7:29 - 7:34
    de formats : CSV,
    PDF, XLS ou autres.
  • 7:34 - 7:35
    Vous découvrirez alors que
  • 7:35 - 7:39
    le format des adresses n'est pas
    le même d'un organisme à l'autre.
  • 7:39 - 7:41
    L'un classe ses données par rue ou par
  • 7:41 - 7:43
    intersection, l'autre par quartier
    ou adresse postale.
  • 7:43 - 7:47
    Même avec ce portail, vous perdez
    du temps, car vous devez
  • 7:47 - 7:49
    uniformiser les champs des adresses.
  • 7:49 - 7:51
    Et nos citoyens ont d'autres
    chats à fouetter.
  • 7:51 - 7:53
    Nous pouvons faire mieux comme ville.
  • 7:53 - 7:55
    Nous pourrions normaliser nos adresses,
  • 7:55 - 7:57
    ce qui nous aiderait
    à créer plus de cartes.
  • 7:57 - 8:00
    En voici une des
    bornes d'incendie de NY,
  • 8:00 - 8:01
    mais pas de n'importe quelle borne.
  • 8:01 - 8:06
    Il s'agit des 250 bornes ayant remis le
    plus grand nombre de contraventions.
  • 8:06 - 8:08
    (Rires)
  • 8:08 - 8:11
    J'ai fait des découvertes
    grâce à cette carte.
  • 8:11 - 8:14
    Primo, ne vous garez
    pas dans l'Upper East Side.
  • 8:14 - 8:17
    Peu importe où vous vous
    garerez, vous aurez un ticket.
  • 8:17 - 8:21
    J'ai également trouvé les deux
    bornes les plus lucratives pour la ville,
  • 8:21 - 8:23
    deux bornes dans le Lower East Side,
  • 8:23 - 8:28
    qui rapportent plus de 55 000 $
    par année en contraventions.
  • 8:28 - 8:31
    Cela m'a surpris.
  • 8:31 - 8:34
    J'ai donc fait des recherches
    et j'ai découvert
  • 8:34 - 8:36
    qu'une avancée de trottoir de sept pieds
  • 8:36 - 8:38
    sépare la place de parking
  • 8:38 - 8:39
    de la borne d'incendie.
  • 8:39 - 8:42
    Un conducteur arrive et se dit :
  • 8:42 - 8:44
    « La borne est là-bas, je suis ok. »
  • 8:44 - 8:47
    Il regarde les lignes de parking
    dessinées au sol et se gare.
  • 8:47 - 8:50
    Les policiers, qui ne voient pas
    les choses du même œil, lui
  • 8:50 - 8:51
    collent une amende.
  • 8:51 - 8:54
    Je ne suis pas le seul
    à avoir remarqué cela.
  • 8:54 - 8:56
    La voiture de Google qui passait par là
  • 8:56 - 8:57
    a photographié la scène.
  • 8:57 - 9:02
    J'en ai parlé dans mon blogue I Quant NY,
    à la suite de quoi le DOT m'a répondu,
  • 9:02 - 9:03
    et a déclaré :
  • 9:03 - 9:06
    « Bien que le DOT n'ait reçu
    aucune plainte au sujet de
  • 9:06 - 9:11
    cet emplacement, nous allons
    revoir le marquage au sol. »
  • 9:11 - 9:14
    Je me suis dit, voilà une
    réponse typique,
  • 9:14 - 9:16
    merci, passons à autre chose.
  • 9:16 - 9:20
    Mais, quelques semaines plus tard, une
    chose extraordinaire s'est produite.
  • 9:20 - 9:22
    Ils ont refait les lignes, et pendant
  • 9:22 - 9:25
    une seconde, j'ai vu l'avenir
    de l'ouverture des données,
  • 9:25 - 9:27
    car pensez à ce qui est arrivé ici.
  • 9:27 - 9:32
    Durant cinq ans, ceux qui se garaient-là
    recevaient un ticket sans comprendre,
  • 9:32 - 9:36
    puis un citoyen a fait une observation,
    en a fait part à la ville et en quelques
  • 9:36 - 9:38
    semaines tout était réglé.
  • 9:38 - 9:41
    C'est formidable. Plusieurs personnes
    voient là un rôle de cerbère.
  • 9:41 - 9:43
    Les données sont plutôt un outil,
  • 9:43 - 9:46
    qui nous permettent d'être de vrais
    partenaires du gouvernement,
  • 9:46 - 9:48
    et ce n'est pas si complexe.
  • 9:48 - 9:49
    Peu de changements sont requis.
  • 9:49 - 9:50
    Si vous vous faites
  • 9:50 - 9:53
    régulièrement demander vos données,
  • 9:53 - 9:57
    rendez-les publiques, c'est un signe
    qu'elles devraient l'être.
  • 9:57 - 9:59
    Votons aussi une loi qui
    oblige les organismes
  • 9:59 - 10:03
    gouvernementaux qui mettent en
    ligne des PDF à joindre à ceux-ci
  • 10:03 - 10:05
    les données brutes, car
    celles-ci proviennent
  • 10:05 - 10:07
    nécessairement de quelque part,
  • 10:07 - 10:09
    et devraient être accessibles.
  • 10:09 - 10:11
    Fixons des normes
    sur les données ouvertes
  • 10:11 - 10:14
    et uniformisons le format
  • 10:14 - 10:16
    des adresses de New York.
  • 10:16 - 10:18
    Malgré tout ce que j'ai dit, NY reste un
  • 10:18 - 10:21
    leader dans le domaine
    des données ouvertes
  • 10:21 - 10:24
    et si nous choisissons d'établir
    des normes en la matière
  • 10:24 - 10:28
    d'autres feront de même. L'État,
    le gouvernement fédéral, voire d'autres
  • 10:28 - 10:29
    pays pourraient nous suivre.
  • 10:29 - 10:32
    Nous approchons d'une ère où nous
    aurons un programme qui pourra
  • 10:32 - 10:34
    créeons des cartes avec les
    données de 100 pays.
  • 10:34 - 10:37
    Ce n'est pas de la science fiction,
    nous y sommes presque.
  • 10:37 - 10:39
    Mais au fait, à qui donnons-nous
    le pouvoir?
  • 10:39 - 10:42
    Car il ne s'agit pas seulement de
    John Krauss et de Chris Whong,
  • 10:42 - 10:45
    Il y a actuellement des
    centaines de Meetup actifs
  • 10:45 - 10:46
    à New York.
  • 10:46 - 10:48
    Ils sont des milliers
    à participer à ces réunions.
  • 10:48 - 10:51
    Ils y assistent après le
    travail et les weekends,
  • 10:51 - 10:53
    pour passer en revue des
    données et améliorer la
  • 10:53 - 10:55
    qualité de vie dans notre ville.
  • 10:55 - 10:59
    Des groupes comme BetaNYC, qui la
    semaine dernière a lancé citygram.nyc,
  • 10:59 - 11:02
    où vous pouvez vous
    abonner à un bulletin des
  • 11:02 - 11:04
    plaintes que la ville
    reçoit au 311 dans un
  • 11:04 - 11:06
    rayon autour de chez vous
    ou de votre travail.
  • 11:06 - 11:09
    Et ce n'est pas que la communauté
    techno que cela intéresse.
  • 11:09 - 11:12
    Les urbanistes, mes
    étudiants, les défenseurs
  • 11:12 - 11:14
    du domaine public, des citoyens
  • 11:14 - 11:17
    de tous les milieux.
    Tout le monde s'y intéresse.
  • 11:17 - 11:19
    Et tous ces petits changements progressifs
  • 11:19 - 11:23
    attisent la passion de nos
    citoyens et leur permettent
  • 11:23 - 11:26
    d'utiliser des données pour
    améliorer notre ville,
  • 11:26 - 11:29
    que ce soit une donnée ou
    une place de stationnement à la fois.
  • 11:29 - 11:32
    Merci.
  • 11:32 - 11:35
    (Applaudissements)
Title:
Comment l'analyse de données générales m'a permis de trouver les pires endroits où se garer à New York
Speaker:
Ben Wellington
Description:

Les organismes municipaux ont accès à de nombreuses données et statistiques sur tous les aspects de la vie urbaine. Mais comme le suggère l'analyste de données Ben Wellington dans sa conférence, ces organismes ne savent pas toujours quoi faire avec leurs données. Il fait la preuve qu'il est possible de répondre à des questions incongrues grâce à des mesures de traitement de données, et ainsi d'obtenir des renseignements étrangement utiles, et il partage avec nous ses conseils afin que les grands ensembles de données rendus publics puissent être utilisés par tous.

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
11:48

French subtitles

Revisions