Articles en ligne
Mathématiques, informatique, robotique
Des puces pour décoder le vivant
Les visionnaires de la bio-informatique
Des applications multiples
Au Québec, un retard
Une stratégie de démarrage
Jérôme Laroche est biologiste. Pourtant, il passe la majeure partie de son temps devant une créature inerte. Il s'agit d'un ordinateur, ou plutôt d'un monstre informatique, qui lui sert à décrypter le vivant. Il est l'une des rares personnes au Québec à pratiquer ce qu'on appelle la bio-informatique, une science encore jeune, mais promue à un brillant avenir.
La bio-informatique regroupe l'ensemble des applications de l'informatique à la biologie. Cette science multidisplinaire a pour objet d'organiser, de gérer et d'analyser de grandes quantités de données au moyen de supercalculateurs. Au Centre de bio-informatique de l'Université Laval, Jérôme Laroche utilise un bolide constitué de 12 processeurs Origin 2000 conçus par Silicone Graphic. Il cherche à comprendre la structure des génomes. « Nous voulons découvrir les règles grammaticales à la base de l'écriture du grand livre humain. » Pour ce faire, les chercheurs doivent concevoir des programmes informatiques ressemblant un peu aux moteurs de recherche d'Internet, tels Google ou Alta Vista. Le programme commande de petits robots virtuels qui se baladent sur le génome à la recherche d'information. Ils cherchent, par exemple, la distribution des mots les plus courts ou des mots répétés, autant d'indices qui permettent de découvrir « l'organisation grammaticale du génome ».
Jérôme Laroche travaille au sein d'une équipe multidisciplinaire : avec Nicolas Juge, son collègue mathématicien, il imagine les modèles mathématiques pouvant expliquer la disposition du génome; puis, avec des programmeurs-analystes, il conçoit les programmes informatiques permettant de valider ces modèles. Il développe d'abord les algorithmes, c'est-à-dire une liste des critères que le programmeur devra considérer au moment de l'écriture du programme, comme le type d'information à obtenir et les probabilités statistiques associées à cette information. Puis, le programmeur transforme ces algorithmes en lignes de codes informatiques... Il reste ensuite à exploiter le programme, à analyser les résultats et à comparer les modèles avec ceux imaginés au départ.
Les visionnaires de la bio-informatique
L'analyse des bases de données de séquences biologiques a été la première application de la bio-informatique. C'était au milieu des années 1980. À cette époque, les découvertes d'un chercheur californien, Russell Doolittle, ont attiré de nombreux chercheurs à travers le monde vers cette nouvelle avenue. Doolittle avait séquencé une protéine présente dans des tissus cancéreux, en la comparant avec d'autres séquences de protéines existantes. Il s'était alors rendu compte qu'il pouvait établir une homologie entre sa protéine et un facteur de croissance du singe. À partir de ce moment-là, on s'est mis à développer toutes sortes d'outils pour mieux comparer les séquences et on a multiplié les projets de banques de données biologiques.
Au même moment, au Québec, des visionnaires percevaient l'importance de l'informatique en biologie. « Ces gens faisaient de la bio-informatique sans le savoir », explique François Major, un bio-informaticien de l'Université de Montréal. Son directeur de doctorat, Robert Cedergren, pratiquait la bio-chimie dans les années 1980. Il avait alors compris que la modélisation et le traitement des séquences allaient se répandre et, qu'un jour, on ne pourrait plus se passer des ordinateurs. Il avait vu juste.
Des applications multiples
Avec les projets d'analyse de génomes, on a accumulé tellement de données qu'il est maintenant impossible de comparer les séquences à l'œil nu, comme l'a fait initialement Russell Doolittle. « Si l'on veut être capables de détecter un indice dans un génome sans être inondés de données, il faut fabriquer des " microscopes informatiques ", illustre Nicolas Juge. Nos cellules comptent 3 milliards de nucléotides répartis dans 23 paires de chromosomes. Nos fichiers informatiques peuvent rassembler tout le matériel issu d'un chromosome, c'est-à-dire 360 millions de lettres. Il faut donc des ordinateurs capables de compiler ces données et de les comparer à un autre fichier de séquences tout aussi volumineux. » Gene Myers, vice- président de la compagnie Celera Genomics, parle d'un « tsunami d'information ». « Le génome humain, c'est une base de données équivalant à 80 000 disques compacts! »
La bio-informatique s'est ainsi révélée indispensable pour compléter le séquençage du génome humain, notamment pour stocker les résultats dans des bases de données. D'ailleurs, c'est en partie grâce à cette science que le projet s'est terminé quatre ans plus tôt que prévu, en février 2001. Mais maintenant que le séquençage de notre génome est complété, la bio-informatique est-elle encore utile? « Plus que jamais, affirme Martin Godbout, président de Génome Canada. Nous avons un dictionnaire de 30 000 mots dont on connaît l'épellation et l'emplacement au sein du génome. Mais il nous manque encore la définition de plus de 25 000 mots de ce répertoire, c'est-à-dire le rôle de chaque gène. C'est un travail qui demandera de cinq à sept ans. »
Comment transformer ces données brutes en connaissances utilisables? Il s'agit non seulement de déterminer la fonction de chaque gène et de savoir dans quelles circonstances il s'exprime, mais aussi de découvrir les relations possibles entre les mutations et les désordres physiologiques connus, ou encore, d'analyser la structure et les fonctions des protéines exprimées par les gènes. Pour poursuivre ces recherches, il faut concevoir des programmes informatiques afin de fouiller les données, de les comparer et de les analyser. C'est ce qu'on appelle le « data mining », une version moderne de l'analyse de données qui fait appel à des techniques statistiques, à l'intelligence artificielle et aux réseaux neuronaux.
Les applications de la bio-informatique sont nombreuses. À l'Université de Sherbrooke, Jean-François Perreault utilise cet outil en infectiologie. « Les virus de l'hépatite virale B, C et D ont tendance à muter facilement, ce qui rend problématique l'utilisation des antibiotiques. Pour combattre ces hépatites, une des stratégies pourrait consister à s'attaquer aux portions d'ARN restées intactes au fil des mutations. Pour cela, il faut recourir à la bio- informatique, c'est-à-dire aligner les séquences d'ARN et trouver celles qui se sont conservées au fil des mutations. »
De son côté, à la Faculté des arts et des sciences de l'Université de Montréal, François Major développe des outils de simulation informatique pour modéliser de l'ARN en trois dimensions. Cette nouvelle lunette qu'offre la bio-informatique pourrait aider à comprendre les mécanismes de transmission héréditaire de la maladie de Creuszfeld Jacob. « On pense qu'un nœud se forme dans l'ARN messager, nœud qui peut interagir avec des protéines. Cette interaction permettrait à la protéine prion de changer de forme, ce qui engendrerait le développement de la maladie. » La bio-informatique entre en jeu quand vient le temps de dessiner l'ARN à l'écran. Pour ce faire, il faut comparer la disposition de séquences semblables chez de nombreuses espèces animales. « Ce n'est qu'un début, dit Jean-Pierre Perreault, qui collabore régulièrement avec François Major. Éventuellement, des systèmes intelligents nous diront, en agissant sur telle ou telle structure : j'obtiens ceci, que j'ai déjà vu dans une base de données. Imaginez les liens que l'on pourra établir! ».
« Aujourd'hui, la bio-informatique est devenue un outil essentiel à travers le monde dans plusieurs secteurs. Elle est aussi importante que le guichet automatique dans le système bancaire », avance Jean-Pierre Perreault. Déjà, on emploie l'expression in silico, par opposition à in vivo et à in vitro, pour désigner cette toute nouvelle façon d'analyser les informations recueillies sur les processus biologiques par un recours intensif à l'ordinateur. S'il est difficile de prévoir la croissance de la bio-informatique en termes économiques, il reste certain que cette science constituera de plus en plus une composante essentielle du développement de plusieurs secteurs industriels.
Au Québec, un retard
L'industrie pharmaceutique est une de celles qui devraient bénéficier le plus de l'apport des découvertes en génomique et donc de la bio-informatique. Ces deux sciences permettront de rationaliser le processus de mise au point de nouveaux médicaments autour de cibles thérapeutiques extrêmement précises. Les entreprises pharmaceutiques ont d'ailleurs déjà commencé à développer des compétences en bio-informatique à l'interne. Il en va de même dans les grandes entreprises de biotechnologies. Éventuellement, les compagnies spécialisées en environnement, en agriculture et en foresterie emboîteront le pas.
Pour l'instant, au Québec et au Canada, il est difficile de retracer les activités de bio-informatique en dehors du domaine de la génomique. Une recension des entreprises de bio-informatique canadiennes effectuée par la Chaire en gestion des bio- industries de l'UQAM montre un secteur d'activités encore très émergent. On ne compterait que 14 entreprises de bio-informatique proprement dites au Canada, la plupart de petite taille et très jeunes. Le Québec en compte encore peu. Mais étant donné le nombre important d'entreprises pharmaceutiques et biotechnologiques, le terrain est très favorable au développement de cette industrie au Québec. Selon une étude faite pour le compte de BIOTECanada, en 1998, 42 p. 100 des firmes de biotechnologies canadiennes se trouvaient en sol québécois.
Dans un autre mémoire sur le développement de la bio-informatique, BIOTECanada relève comme principal point fort l'excellence - reconnue mondialement - de quelques chercheurs et équipes scientifiques travaillant dans le domaine de la bio-informatique, mais comme point faible, une pénurie de ressources humaines qualifiées pour l'industrie. Ce point de vue est partagé par plusieurs personnes dans le milieu. « Le Québec a pris un peu de retard », constate Nicolas Juge, retard qu'il attribue au manque de souplesse des structures gouvernementales pour se positionner dans de nouveaux créneaux. « Génome Québec aurait pu être créé bien plus tôt », affirme-t-il. Pour sa part, Gertraud Burger, directrice du Laboratoire de séquençage à large échelle du génome des organelles (OGMP), à l'Université de Montréal, a ressenti durement la pénurie de ressources humaines en bio-informatique dans le cadre de ses projets de recherche. « Dans le secteur public et privé, c'est encore pire », dit-elle. Récemment, Normand de Montigny, directeur général du Centre québécois d'innovation en biotechnologie (CQIB), ce premier incubateur d'affaires québécois spécialisé dans les biotechnologies, faisait valoir la nécessité de développer des entreprises spécialisées dans ce secteur. Martin Godbout, président de Génome Canada, renchérit : « La capacité du Québec de démontrer qu'il est un leader en génomique dépendra de la bio-informatique. »
Une stratégie de démarrage
La pénurie de main-d'œuvre est particulièrement criante parce que la bio-informatique fait appel à une combinaison relativement rare de compétences, pour laquelle il n'existait pas a priori de programmes de formation. Aujourd'hui, la très grande majorité des gens qui pratiquent la bio-informatique se sont formés « sur le tas » et osent à peine s'appeler bio-informaticiens. Dans un avis émis en janvier 2001, le Conseil de la science et de la technologie propose une stratégie de démarrage de la bio-informatique au Québec, et ce, avec cinq recommandations.
Première recommandation : on souhaitait, en toute priorité, mettre en place avant septembre 2001 un programme intensif de formation-perfectionnement en bio-informatique. Ces programmes ont commencé à émerger. En septembre 2001, une trentaine d'étudiants, sélectionnés parmi une centaine de candidats, ont inauguré le nouveau programme de premier cycle de l'Université de Montréal en bio-informatique. Une autre université canadienne, l'Université de Waterloo, offre une formation de premier cycle qui comprend une mineure et une majeure en biochimie et en informatique. Il existe aussi un certificat en bio-informatique, accrédité par les facultés de science et de médecine des universités de Colombie-Britannique et du Nouveau-Brunswick, qui comprend des ateliers ambulants donnés par le Réseau canadien des maladies génétiques. Les sessions sont données successivement de façon intensive dans plusieurs villes canadiennes et sont annoncées dans Internet (www.bioinformatics.ca/workshops.php). Ce site contient d'ailleurs une mine de renseignements sur la bio-informatique : les programmes de formation, les cours, les bourses, les événements, les ressources humaines et les emplois.
Le Conseil recommandait aussi de permettre dès l'hiver 2002 à une dizaine de boursiers d'acquérir une formation supérieure en bio-informatique à l'extérieur du Québec. Actuellement, Génome Québec s'apprête à répondre à ce besoin en développant une plate-forme de bio-informatique qui comprendra notamment un important volet formation. « On veut encourager un plus grand nombre de personnes à se diriger dans ce domaine à la maîtrise et au doctorat, par de l'aide financière », explique Paul L'Archevêque, président-directeur général de Génome Québec. Chez Génome Canada, qui financera cette plate-forme, on espère former au moins 20 bio-informaticiens au Québec cette année, en encourageant des jeunes ou moins jeunes à se former au sein de leurs milieux et en offrant des bourses pour acquérir une formation supérieure à l'extérieur du Québec.
Autre souhait : mettre en place des activités et des programmes universitaires de formation de deuxième et troisième cycles en bio-informatique au Québec. L'Université de Montréal y travaille déjà.
Une quatrième recommandation visait à développer l'activité de bio-informatique au Québec à l'intérieur d'un réseau de projets de recherche structurants en génomique, en protéomique de même qu'en bio-informatique proprement dite. Pour répondre à cette demande, la plate-forme de Génome Québec comprendra aussi un volet service et un volet recherche, qui permettront notamment de stimuler le développement de la bio-informatique en finançant l'achat d'équipements au sein des entreprises. Enfin, le Conseil proposait de fournir aux entreprises de bio-industries du Québec, à partir de 2002, des moyens fiscaux d'incitation reliés à l'embauche de bio-informaticiens. Cette voie ne semble pas prioritaire pour l'instant.
Toutes ces initiatives sont « incontournables », juge Martin Godbout, qui prédit que « sans la bio-informatique, le Québec ne passera pas le virage de la génomique ». Ces projets permettront également à des jeunes de se positionner avantageusement sur le marché du travail. Les étudiants qui choisiront cette voie ne manqueront pas de boulot. Les besoins en bio-informatique ne peuvent qu'augmenter au cours des prochaines années, selon Nicolas Juge. La quantité d'information en génomique double tous les 10 mois. Plusieurs entreprises québécoises qui ont participé à un sondage lancé par le Département de biochimie de l'Université de Montréal, ont confirmé leurs besoins en ressources humaines formées en bio-informatique. « Les futurs bio-informaticiens se trouveront du travail sans doute aucun, à Montréal ou ailleurs », signale Mme Gertraud Burger, qui est responsable du programme de premier cycle de l'Université de Montréal.
« Les bio-informaticiens joueront un rôle majeur dans les 100 prochaines années », croit Jérôme Laroche. Les percées effectuées par les bio-informaticiens seront énormes. Francis Ouellet, un bio-informaticien francophone de la Colombie-Britannique, ajoute : « Bientôt, les programmes de biologie comprendront un cours de bio-informatique. On devra tous utiliser la bio-informatique comme on utilise la bibliothèque... Déjà, on ne peut plus envisager de faire de la recherche en biologie sans Internet ni la bio-informatique. »
Si votre perception de l’informatique se limite toujours à un processeur, un clavier et une souris, vous auriez peut-être avantage à vous secouer un peu. On pourrait bientôt vous traiter de ringard! Désormais, les ordinateurs sont partout et prennent toutes les formes. Pourtant, ils sont de plus en plus invisibles. Bienvenue dans l’ère de l’informatique diffuse…
Au Québec, le professeur Sylvain Giroux est l’un des précurseurs d’une nouvelle vague technologique. «Les ordinateurs du 21e siècle tiendront davantage compte de l’environnement humain et s’effaceront petit à petit dans le décor, croit-il. Notre équipe de recherche à l’Université de Sherbrooke, le laboratoire DOMUS, travaille précisément dans cette optique.»
Le professeur envisage un jour, pas très lointain, où chacun d’entre nous traînera dans ses poches une puce informatique. En rentrant du boulot, monsieur Tout-le-monde pourra s’adresser à l’équipement électronique le plus proche, son téléviseur par exemple, et demander un litre de lait. Le téléviseur, reconnaissant la commande vocale, communiquera avec le supermarché du coin par Internet et transmettra la commande. Pour l’usager, nul besoin de préciser qu’il préfère la marque Québon, de type écrémé. Ce genre d’information sera déjà enregistré sur la fameuse puce électronique, tout comme son numéro de carte de crédit.
La puce pourrait aussi être utile au boulot. «Un poste de travail pourrait détecter l’arrivée d’un employé et, à l’aide des préférences enregistrées sur la puce, se configurer automatiquement, poursuit M. Giroux. Il pourrait, par exemple, installer les logiciels préférés de l’usager sur l’ordinateur, tamiser la lumière, facturer les appels téléphoniques de l’employé sur le compte approprié, etc. La puce permettrait aussi de savoir exactement où se trouve un collègue dans une tour à bureaux. Pour le rejoindre, on passerait une commande vocale à un ordinateur et le téléphone le plus proche de l’interlocuteur se mettrait à sonner.»
En attendant ce genre d’applications futuristes, le professeur Giroux travaille sur des projets très concrets. Il utilise bel et bien une puce portative conçue pour mémoriser les préférences d’un usager et communiquer avec les appareils électroniques en périphérie. Toutefois, la puce de ce chercheur ne vise pas les travailleurs, mais plutôt les personnes aux prises avec l’Alzheimer ou la schizophrénie.
Plus spécifiquement, le projet du laboratoire DOMUS a pour but d’aider ces patients à vivre le plus longtemps possible dans leur maison,et ce de façon autonome. «Nous équipons les appareils domestiques et les meubles de capteurs de toutes sortes, explique-t-il. En interagissant avec la puce portée par les patients, ces équipements sont en mesure de prendre des décisions intelligentes.»
Un exemple? Une personne atteinte d’Alzheimer porte une puce où il est noté, entre autres, qu’elle cuisine généralement les lundis après-midi et aime préparer le thé tous les jours vers 16 h 00. Des capteurs fixés en périphérie de la cuisinière sont en mesure de suivre ces activités.
«Par exemple, si l’on sonne à la porte un lundi à 16 h 10 et que la personne s’absente de la cuisine pour aller ouvrir, les capteurs le noteront, dit M. Giroux. Puis, si, après avoir discuté avec le visiteur, la personne oublie qu’elle était en train de préparer à manger et décide d’aller faire une sieste, des capteurs de poids installés sous le matelas détecteront qu’elle s’est couchée. Si elle ne retourne pas à la cuisine après un certain temps, le système central décèlera le danger. Il enverra un message approprié à la personne, en faisant sonner le téléphone ou autrement.»
Évidemment, il ne faudrait pas que des alertes soient déclenchées inutilement. Dans le cas de la cuisinière, un système de traitement de l’image pourrait aider à reconnaître ce qui se trouve sur le feu. Un ragoût peut effectivement bouillir beaucoup plus longtemps qu’une simple casserole remplie d’eau…
D’ici quelques mois, l’Université de Sherbrooke aura terminé la construction d’un appartement complètement équipé des technologies du laboratoire DOMUS. «Il s’agira d’un 4 1/2 avec cuisine, salle de bains, salle à manger, chambre à coucher et salon, raconte l’informaticien. Nous inviterons des personnes à venir y habiter quelques jours pour tester ce nouvel environnement. Ce sera l’un des premiers foyers conçus selon les principes de l’informatique diffuse.»
Caroline Julien
Revenir en haut