Aller au contenu principal
25 octobre 2019
Rémi Tavon
Université de Sherbrooke

Les autres lauréat-e-s 2019 du Concours de vulgarisation de la recherche :
- Alexandra Schilte pour "Les néonomades : se chercher, se trouver, se raconter. Et se vendre."       
- Elise Bouchard pour "Voyage autour de la Terre : à la découverte des forêts!"
- Mylène Legault et Jean-Nicolas Bourdon pour "L'autisme : un losange dans un monde de carrés"

Mieux détecter pour mieux orienter

Grâce à des outils tels que Google Maps, il n’a jamais été aussi facile de se déplacer à pieds sans se perdre dans les méandres tortueux de nos villes. Toutefois, ces déplacements peuvent donner du fil à retordre à certains usagers, comme les personnes en fauteuil roulant. Une borne fontaine qui encombre le passage, une pente abrupte ou encore une crevasse profonde dans un trottoir peuvent contraindre ces personnes à prendre des risques, voire à faire demi-tour. Dans ce contexte, la planification de trajet aiderait, en amont, à suggérer des itinéraires adaptés. Cependant, la prise en compte de la topographie d’une ville, d’obstacles temporaires ou permanents ou de la détérioration d’un trottoir demeure un défi d’envergure.   

Au confluent des efforts investis en accessibilité universelle et des progrès récents en intelligence artificielle (IA) – un vaste domaine qui s’intéresse à l’automatisation des tâches intellectuelles habituellement effectuées par des humains – se dessine un horizon encourageant pour les personnes à mobilité réduite. En effet, depuis l’avènement récent des réseaux de neurones artificiels, le nombre d’applications liées à l’IA a décuplé. Parmi celles-ci, citons l’application « FaceApp », qui permet de vieillir un visage à partir d’une photo. Google multiplie également ses prouesses technologiques avec « Google Photos », qui effectue avec précision la reconnaissance automatique d’objets présents sur des photos téléversées par ses usagers. Cela permet de chercher dans sa banque d’images personnelles par des mots-clés comme « famille », « montagne » ou « vélo »!

Qu’est qu’un réseau de neurones artificiel? Il s’agit d’un type d’algorithme informatique constitué de plusieurs milliers de noyaux de calculs, les neurones, organisés en couches successives et hiérarchiques. Lorsqu’un réseau traite une image, par exemple, ses couches fondamentales cernent d’abord des motifs et contours prépondérants. Les couches terminales, quant à elles, peuvent détecter des éléments complexes tels qu’une roue de voiture ou la tête d’un chat. Tel un humain qui apprend d’abord à identifier un arbre, puis à déterminer s’il s’agit d’un érable ou d’un chêne, les couches qui composent ces réseaux démontrent donc un niveau de spécialisation croissant. Enfin, leur force réside dans les connexions complexes qu’ils peuvent nouer automatiquement, par le processus d’apprentissage. Celui-ci permet aux réseaux de « comprendre », de manière plus intuitive que rationnelle, certains concepts importants pour la tâche programmée, telle la classification d’images de chats et chiens.

Mon projet de maîtrise est né dans ce contexte d’innovation foisonnante. L’objectif principal consiste à détecter automatiquement la détérioration des trottoirs sur des images de scènes urbaines. Le principal débouché de ma maîtrise serait de bonifier les outils de planification de trajet afin qu’ils proposent des itinéraires adaptés aux personnes en fauteuil roulant, tout comme Google Maps adapte un itinéraire automobile en fonction de la circulation et des accidents. De plus, les villes pourraient réaliser d’importantes économies en ciblant plus efficacement les infrastructures détériorées afin d’en planifier l’entretien. Une question demeure : comment l’utilisation de réseaux de neurones artificiels peut-elle faciliter les déplacements des usagers en fauteuil roulant?

En milieu urbain, la recherche en IA est dominée par le développement de la voiture autonome. À l’instar de plusieurs avancées technologiques, les outils développés dans ce secteur peuvent servir au déploiement de nombreuses applications dans d’autres domaines, en accessibilité universelle par exemple. En effet, d’immenses banques d’images de scènes urbaines ont été développés récemment afin d’entraîner des réseaux de neurones à reconnaître, au pixel près, des piétons, des voitures ou autres éléments urbains. Ces jeux de données peuvent également servir de base d’apprentissage pour l’entraînement d’un réseau qui effectue une tâche différente, mais connexe, en l’occurrence la détection d’un trottoir endommagé. Cette méthode s’appelle le « transfert d’apprentissage ».

Ainsi, mon réseau de prédilection, nommé insipidement « Deeplabv3+ », a d’abord été formé à reconnaître des trottoirs en pavé uni dans plusieurs villes d’Allemagne. Étant donné que leurs cousins bétonnés de notre côté de l’Atlantique revêtent une apparence différente, une nouvelle base de données a été constituée pour mon projet, afin d’« affiner » l’apprentissage du réseau choisi. Les données utilisées sont les images panoramiques urbaines Google Street View, celles-là mêmes qui permettent de jeter un coup d’œil à hauteur d’homme sur un lieu inexploré dans la plateforme Google Maps (voir image 1).

Image 1: Exemple d'un panorama Google Street View utilisé pour l'apprentissage de Deeplav3+. Cette photo a été prise dans le quartier Saint-Simon, à Montréal. Crédit : Google 2018
Image 1: Exemple d'un panorama Google Street View utilisé pour l'apprentissage de Deeplav3+. Cette photo a été prise dans le quartier Saint-Simon, à Montréal - © Google 2018

Après un léger entraînement, Deeplabv3+ réussit aisément à distinguer les pixels « non-trottoir » des pixels « trottoir » (voir image 2a). Dans une étape subséquente, un autre réseau récupère les pixels « trottoir » et les classe entre « trottoir sain » et « trottoir avec défaut majeur » (voir image 2b). À l’heure actuelle, les résultats de ce second réseau demeurent toutefois mitigés. Celui-ci détecte plusieurs défauts là où il n’y en a pas (faux positifs) et en omet parfois là où il y en a (faux négatifs).

--
Image 2 : a) Détection des pixels « trottoir » par Deeplabv3+ - © Google 2018
-
Image 2 : b) Détection, par un second réseau de neurones artificiel, d'une zone «trottoir avec défaut majeur» - © Google 2018

Pourquoi cette seconde tâche constitue-t-elle un défi supplémentaire? Rappelons d’abord que l’apprentissage automatique n’est pas le fruit du hasard. Les méthodes les plus courantes dans ce domaine font appel à une quantité faramineuse de données accompagnées de leur réponse pour la tâche programmée. Ces données « annotées » permettent au réseau en apprentissage de déterminer s’il a tort ou raison de prédire qu’une certaine zone comporte la présence d’un trottoir, et ce, pour chaque image soumise à l’entraînement. Tel un parent qui enseigne à son bambin à distinguer un cheval d’un âne, ces données permettent aux réseaux d’apprendre les caractéristiques qui distinguent un objet d’un autre, tout en demeurant insensibles aux variations existantes pour un même objet. Au terme d’un processus itératif parfois long, les données d’apprentissage auxquelles il a accès déterminent les ajustements qu’il apporte aux neurones qui le composent, jusqu’à ce qu’il maximise sa performance.

Dans ce contexte, il faut plusieurs centaines d’images avec des trottoirs fortement endommagés pour que notre second réseau apprenne à accomplir sa tâche avec brio. Pour l’instant, moins de 1% des 10 000 images Google Street View extraites comportent des tronçons de trottoirs avec un défaut susceptible de bloquer le passage à une personne en fauteuil roulant. Il est donc bien difficile pour notre réseau néophyte de se faire une tête… À suivre!

Auteur(e)

  • Guy Drouin
    Université d'Ottawa

    Guy Drouin est professeur titulaire à l’Université d’Ottawa depuis 1990. Il détient un doctorat en génétique de l’Université de Cambridge, et il a poursuivi ses études postdoctorales à l’Université Harvard. Ses recherches portent sur l’évolution des gènes et des génomes. Il enseigne la génétique, l’évolution moléculaire et la génétique évolutive des humains. Il s’intéresse aussi à l’enseignement des sciences en milieu minoritaire.

     

    Note de la rédaction : Les textes publiés et les opinions exprimées dans Découvrir n'engagent que les auteurs, et ne représentent pas nécessairement les positions de l’Acfas.

Commentaires