Imprimer

330 - Étude de lexiques à vocation particulière : approches théoriques, méthodologiques, pédagogiques et multidisciplinaires

Du mercredi 14 au jeudi 15 mai 2014

Le lexique d’une langue n’est pas vu comme un objet monolithique. Son étude passe par l’identification de caractéristiques particulières non seulement de mots isolés, mais aussi de regroupements de mots qu’on pourrait appeler des ensembles lexicaux. On peut les définir de différentes manières, pas mutuellement exclusives : par thématique (ex. le lexique de l’environnement), par niveau d’apprentissage (ex. « Basic English »), par caractéristiques sémantiques (ex. événements, prédicats, objets, etc.), par contexte d’utilisation (ex. terminologie spécialisée par rapport à langue générale). Selon l’optique retenue, les méthodes d’identification, de caractérisation, d’enseignement et de description ne sont pas les mêmes.

Il devient intéressant de comparer les différentes approches afin de voir dans quelles mesures elles peuvent s’alimenter et s’enrichir mutuellement. Le travail en vase clos des chercheurs s’intéressant à la thématique peut conduire à des recherches en parallèle qui ne sont que trop rarement mises en commun dans un cadre d’échange multidisciplinaire. Une considération moins monolithique du lexique ne pourra que conduire à des descriptions plus flexibles et complémentaires.

Le colloque permettra :

1) de réunir des chercheurs intéressés par cette la thématique du lexique à vocation particulière afin qu’ils puissent échanger sur leur cadre théorique, leur méthode et leur utilisation des divers sous-ensembles lexicaux;

2) d’explorer les bases théoriques de classes de vocabulaire ou de sous-ensemble lexicaux ou terminologiques;

3) de caractériser des ensembles lexicaux; et

4) de réunir des chercheurs provenant de pays différents.

Dans un tel contexte, réunir des chercheurs provenant de la didactique, de la lexicologie, de la lexicographie, de la terminologie, de la linguistique de corpus et de l’informatique, des sciences cognitives, des sciences de l’information et des divers domaines spécialisés contribuera nécessairement à enrichir la réflexion sur le sujet.

Lire la suite »
Colloque
Section 300 - Lettres, arts et sciences humaines
Responsables
UdeM - Université de Montréal
UdeM - Université de Montréal
Ajouter à mon horaire
Afficher tous les résumés
Avant-midi
09 h 45 à 10 h 00
Communications orales
Mot de bienvenue
10 h 00 à 16 h 00
Communications orales
Lexicologie, lexicographie et terminologie
10 h 00
« J'aime / J'aime pas » ce terme 
, Virginie ZAMPA (LIDILEM (Grenoble),)

Cette étude vise à savoir si les termes sont perçus de façon positive ou négative. Pour cela, nous proposons un jeu nommé LikeIt (www.jeuxdemots.org/likeit.php). Une des utilisations de la polarité des termes est la désambiguïsation lexicale. Par exemple, dans la phrase « ma journée est mauvaise, j'ai eu un redressement », le terme redressement est polysémique et un seul de ses sens (« redressement fiscal ») a une polarité négative. La présence du terme « mauvaise », à polarité négative, permet d'aider à la sélection du sens du terme « redressement ».

Les termes proposés sont pris dans le réseau lexical de jeudemots.org. Pour l'amorçage, deux mots ont été polarisés manuellement : « bon » (positif) et « mauvais » (négatif). Les mots sont ensuite choisis soit parmi les mots déjà polarisés, soit parmi les mots en lien direct avec un mot déjà polarisé. Le joueur peut voter « j'aime », « j'aime pas » ou « neutre ».

Au 30 janvier 2014, 31 415 termes ont été polarisés (346 290 votes). 61,9% des termes recueillent l'unanimité sur une des trois possibilités. Les termes unanimement positifs sont par exemple « agréable », « paix », « ami », « espoir » ; négatifs : « embarrassé », « indigne », « angoisse », « offense ». Mais des termes tels que « envies », « psychanalyser », « scrupule » obtiennent 50% de votes positifs et 50% de négatifs. Enfin, certains polysèmes ont des polarités opposées selon le sens (exemple : vol>déplacement aérien (100% positif) et >voleur (100% négatif)).



Résumé
10 h 30
Pause
11 h 00
Catégorisation du genre chez les noms communs de personnes 
Louise-Laurence LARIVIÈRE (UdeM - Université de Montréal)
11 h 30
Organisation systématique des combinaisons lexicales spécialisées à base nominale dans un dictionnaire de l'environnement 
Zhichao JIA (UdeM - Université de Montréal)

Les collocations spécialisées ou combinaisons lexicales spécialisées (L'Homme 1998) soulèvent des défis importants pour le traitement automatique des langues, la didactique des langues et la traduction spécialisée. Ces dernières années, de plus en plus de ressources lexicographiques et terminologiques intègrent les collocations à leur macrostructure ou à leur microstructure. Toutefois, l'utilisateur doit souvent parcourir de nombreuses lignes pour trouver les collocations voulues. Dans un travail antérieur (Jia et L'Homme, à paraître), un modèle onomasiologique composé de deux classes sémantiques : générique et intermédiaire, a été proposé pour classer les combinaisons à base nominale dans un dictionnaire d'informatique intitulé DiCoInfo. Qu'est-ce que ce modèle onomasiologique? Ce modèle s'adapte-t-il aux autres domaines de spécialité, par exemple l'environnement? Est-ce que, dans le domaine de l'environnement, les mots clés, les collocatifs ou leurs combinaisons présentent des particularités syntaxiques ou sémantiques propres à ce domaine qui rendront notre modèle invalide? Si la réponse est positive, comment adapter notre modèle? Dans notre présentation, nous essayerons d'abord de répondre à ces questions. Notre méthodologie est basée sur l'analyse de corpus. À la fin nous montrerons comment utiliser les fonctions lexicales (Mel'cuk et al. 1995) pour classer systématiquement des combinaisons à base nominale dans un dictionnaire de l'environnement en ligne, le DiCoEnviro.

Résumé
12 h 00
Dîner
13 h 30
Pour une recension et description des « termes tendance »
Aline Francoeur (Université Laval), Louis Philibert-Morrissette (Université Laval), Maxime COLLIN

Les quotidiens et magazines regorgent de termes émergents dont l'avenir est incertain. Qu'adviendra-t-il des online shaming, squeezed generation, Tebowing, wage slavery, work-life overload et autres « termes tendance », difficilement classables dans un domaine de spécialité précis? Trop généraux pour intégrer les banques de terminologie, pas assez courants ni bien établis pour figurer dans les dictionnaires de langue, ces termes par essence transitoires et circonstanciels, liés aux technologies ou aux modes de vie du moment, à des personnages ou événements singuliers, etc., risquent de devenir des oubliés de la terminologie et de la lexicographie. Entre-temps, ils présentent un défi pour les traducteurs francophones, et cela, malgré l'existence d'équivalents français dans bien des cas. Le défi tient au fait que ces termes et équivalents ne sont consignés nulle part et qu'ils apparaissent généralement dans des sources dont le contenu n'est pas indexé par Google. La recension et la description de ces termes viendrait ainsi combler un vide important. Dans cette optique, nous travaillons à la création d'une base de données qui leur sera consacrée et dont le contenu se distinguera de celui des banques de terminologie, dictionnaires de langue et banques de néologismes. Notre communication vise à présenter ce contenu et à expliquer les décisions qui ont été prises en regard des termes qui seront retenus et des catégories de données qui seront privilégiées pour les décrire.

Résumé
14 h 00
La terminologie de l'informatique : étude terminologique des verbes arabes spécialisés  
Nizar GHAZZAWI (UdeM - Université de Montréal)

Dans le contexte de notre analyse du vocabulaire technique du domaine de la technologie informatique, nous entendons nous concentrer sur les verbes arabes de ce domaine. Notre objectif est d'analyser ces unités afin de montrer leurs propriétés linguistiques et la façon dont elles véhiculent les connaissances spécialisées. Notre cadre théorique pour cette analyse est la Sémantique des cadres de Fillmore (1976). L'originalité de ce genre de travail est sa nouveauté pour un domaine tel que l'informatique, surtout pour la langue arabe. Notre méthodologie de travail consiste à monter un corpus de langue arabe portant sur la technologie informatique. À partir de ce corpus, nous procédons à l'extraction des candidats termes à l'aide d'un extracteur automatique, TermoStat (Drouin 2003). Après une étape de validation des candidats termes en fonction des critères de validation terminologique de L'Homme (2004), nous annotons les contextes que nous prélevons pour chaque unité lexicale choisie. Cette méthodologie nous permet de dégager les aspects syntaxico-sémantiques de nos verbes. À la suite de ces étapes, nous parviendrons à un regroupement de ces unités selon les aspects qu'elles partagent entre elles, ce qui détermine leur appartenance à un cadre (frame) donné. Notre choix de cadres se base sur les cadres déjà proposés par le projet de FrameNet (Ruppenhofer 2010). Dans notre travail, nous présenterons des résultats préliminaires et nous nous basons sur l'analyse de trente verbes.

Résumé
14 h 30
Pause
15 h 00
Catégorisation sémantique des noms simples du lexique scientifique transdisciplinaire  
Sylvain HATIER (Université Stendhal Grenoble 3), Agnès TUTIN (Université Stendhal Grenoble 3), Marie-Paule JACQUES (Université Stendhal Grenoble 3), Evelyne JACQUEY (UL - Université de Lorraine), Laurence KISTER (UL - Université de Lorraine)

Notre travail s'inscrit au sein du projet ANR TermITH dont l'objectif est l'indexation automatique d'écrits scientifiques en sciences humaines et sociales. Nous cherchons à établir une liste du lexique scientifique transdisciplinaire (LST : méthode, résultat) qui sera exploité lors de la détection de termes. Dans cette perspective, nous constituons des listes de mots simples (noms, adjectifs et verbes).

Notre processus d'extraction, combinant fréquence, dispersion et spécificité (Drouin 2007, Paquot 2010, Da Sylva 2010), se base sur l'utilisation conjointe d'un corpus d'articles scientifiques et d'un corpus de contraste diversifié (écrits journalistiques, fiction, oral transcrit, sous-titres) de grande échelle. La distribution régulière inter-disciplinaire et la non présence systématique dans les segments répétés nous permettent de filtrer nos listes. La validation finale s'effectue manuellement en s'appuyant sur les cooccurrents syntaxiques les plus productifs et sur des exemples phrastiques.

Nous présenterons une catégorisation sémantique établie en partant d'un échantillon de 150 noms dans notre lexique. Il s'agit d'analyser plus précisément les noms prototypiques du LST ainsi que ceux du lexique abstrait général en nous basant sur une méthode distributionnelle inspirée de la typologie de Flaux et Van de Velde (2000).

La catégorisation sémantique nous permettra d'affiner la détection de termes, en favorisant par exemple les cooccurrences LST-termes (Jacquey et al 2013).

Résumé
15 h 30
La pertinence d'une approche sociohistorique en terminologie : l'exemple de l'attelage
Dominique Pelletier (Université d’Ottawa)

La terminologie est ancrée dans un fonctionnalisme qu'elle doit surpasser si elle souhaite évoluer.
L'avancement de la science et de la technologie a créé une pression importante sur la demande en terminologie à laquelle les chercheurs et terminologues ont dû répondre, donnant lieu à une évolution très rapide de la discipline. En tenant compte de cette évolution, on constate que la terminologie en est venue à opérer sur des bases fonctionnalistes, dans une optique de performance, de normalisation et de développement d'outils informatiques d'aide à la terminologie. En outre, les besoins de productivité engendrés par les domaines spécialisés et leur impact sur le secteur langagier ont dirigé l'orientation de la formation et de la recherche principalement vers l'optimisation du rendement du terminologue et la normalisation des vocabulaires spécialisés. Ainsi, la fiche terminologique est toujours demeurée le produit d'un travail synchronique, ciblé et performant. Mais la fiche ne pourrait-elle pas devenir un outil de préservation de la connaissance et de compréhension du terme en contexte? Nous nous penchons, ici, sur la question de pertinence du contenu des études terminologiques, et sur les contraintes liées à la transmission et à l'avancement de la connaissance en terminologie. Nous présenterons une étude terminologique sur l'attelage, discipline à forte teneur historique, afin de prouver l'apport d'une telle démarche à l'étude et à la pratique de la terminologie.


Résumé
Afficher tous les résumés
Avant-midi
09 h 30 à 11 h 00
Communications orales
Didactique
09 h 30
Élaboration d'un modèle d'article de dictionnaire de collocations du lexique scientifique transdisciplinaire
Karine POULIOT (HEC Montréal)

Dans la lignée des recherches sur le lexique scientifique transdisciplinaire (LST) pour l'élaboration d'outils d'aide à la rédaction, nous désirons poser les jalons qui permettraient d'élaborer un dictionnaire décrivant les collocations des principaux termes propres au LST.
Dans cette communication, nous résumerons d'abord le contexte général dans lequel s'inscrit la recherche que nous avons réalisée dans le cadre d'un mémoire en didactique à l'Université de Montréal. Puis, nous présenterons deux modèles originaux d'article de dictionnaire conçus pour donner accès aux collocations du LST. Les modèles d'articles seront ensuite appliqués à la description d'un échantillon de termes nominaux : analyse, caractéristique, figure, hypothèse, rapport et résultat; et verbaux : décrire et étudier.
Les articles ont l'avantage de proposer une organisation cohérente de ce lexique sur les plans syntaxique et sémantique. En outre, ils permettent de présenter les termes du LST dans des contextes variés, ce qui peut contribuer au développement de la compétence lexicale.

Résumé
10 h 00
Méthodologie de conversion de dictionnaires spécialisés en dictionnaires spécialisés d'apprentissage 
Marjan ALIPOUR (UdeM - Université de Montréal)

Les dictionnaires spécialisés d'apprentissage favorisant une meilleure communication spécialisée deviennent nécessaires en raison des avancées technologiques. Notre étude porte sur la conversion d'un dictionnaire spécialisé en un dictionnaire spécialisé d'apprentissage. Notre objectif est l'élaboration d'une méthodologie grâce à laquelle on obtient un dictionnaire spécialisé d'apprentissage utile et convivial. Notre travail se distingue par sa concentration sur les fonctions d'un dictionnaire spécialisé d'apprentissage et les besoins des utilisateurs (Tarp 2008). Nous avons analysé les méthodes de présentation élaborées dans quatre dictionnaires d'apprentissage - généraux et spécialisés - pour élaborer  notre méthodologie. Basés sur les études de Tarp (2008) et de Fuertes-Olivera (2010), nous avons établi les fonctions et les types d'utilisateurs de notre dictionnaire pour ensuite apporter des changements selon les utilisateurs visés et les fonctions auxquelles chacun d'eux corresponde. Nous avons ensuite appliqué notre méthodologie sur un échantillon de 50 termes sélectionnés selon des critères précis dans le DiCoInfo, dictionnaire fondamental de l'informatique et de l'Internet. Les modifications proposées visent à simplifier l'accès aux informations, faciliter l'apprentissage, favoriser la compréhension et la production de textes spécialisés. Notre communication portera sur les changements apportés suivant les fonctions que nous avons établies.

Résumé
10 h 30
Pause
11 h 00 à 12 h 00
Communications orales
Traduction et rédaction
11 h 00
DITerm : projet d'un dictionnaire spécialisé orienté vers la mise en discours
Aleksandra LICZNER (Université Lyon 2)

Cette proposition de communication s'inscrit dans la phase préparatoire d'un projet de base de données terminographiques multilingue (français – espagnol – polonais) du domaine du droit de l'Internet, baptisée DITerm.
Il s'agit d'un dictionnaire spécialisé crée à partir d'un corpus de textes juridiques, universitaires et de vulgarisation et conçu comme une aide à la traduction (et à la rédaction technique) dont l'ambition est de décrire les usages observés dans la langue de spécialité donnée.
Son objectif principal est de répondre aux besoins de compréhension et d'autonomie discursive des utilisateurs en fournissant des renseignements sur le comportement du terme dans leur univers discursif, et plus précisément sur les relations qu'il entretien avec d'autres unités lexicales.
Nous présenterons ici une méthode de consignation de différentes relations lexico-sémantiques (relations dérivationnelles, actantielles, circonstancielles, collocationnelles) observées dans le corpus. La méthode de description proposée repose sur les principes de la Lexicologie Explicative et Combinatoire (Mel'cuk, Polguère) et est réalisée au moyen des foncions lexicales adoptées à la terminologie (L'Homme).
Nous considérons qu'un traitement rigoureux des relations lexicales et des phénomènes phraséologique dans une langue de spécialité permet de fournir aux traducteurs (ou auteurs techniques) une variété d'expressions précises et de formulations appropriées à un domaine de spécialité donné.

Résumé
11 h 30
Langage et langues de spécialité dans les unités phraséologiques spécialisées

Pour les traducteurs, la connaissance des concepts et des mots clés d'un domaine de spécialisation et de leurs traductions potentielles sont loin d'être suffisantes. Il leur faut en effet connaître la combinatoire de ces unités lexicales simples ou complexes dans la langue source et de leurs traductions dans la langue cible malgré les contrastes de ces combinatoires dans les deux langues. Les traducteurs doivent rendre le sens rattaché à leur combinatoire source tout en respectant les éléments contrastifs de cette combinatoire dans la langue d'arrivée. À partir de quelques mots clés élémentaires du domaine de l'économie et de la finance, nous présentons les combinatoires lexicalisées, ou unités phraséologiques, que nous avons dépouillées dans les manuels pédagogiques du domaine et les répertoires lexicographiques spécialisés. Nous proposons deux types d'unités phraséologiques spécialisées : les unités phraséologiques conceptuelles des langages de spécialité que partagent l'une et l'autre langue et dont le patron combinatoire est facilement transféré d'une langue à l'autre, et les unités phraséologiques idiomatiques dans l'une ou l'autre des langues de spécialité et que met en évidence le contraste de leurs combinatoires associées par l'opération traduisante. Nous examinons enfin les possibilités offertes par l'analyse de corpus et les limites de cette analyse dans le dépouillement et la caractérisation de ces unités phraséologiques.


Résumé
Après-midi
13 h 30 à 16 h 15
Communications orales
Indexation et représentation des connaissances
13 h 30
Projet UBIK : présentation et objectifs
Dominique BESAGNI (CNRS - Centre national de la recherche scientifique), Lyne Da Sylva (UdeM - Université de Montréal), Ivana ROCHE (CNRS - Centre national de la recherche scientifique), Nathalie ANTONOT (CNRS - Centre national de la recherche scientifique), Marianne HOERLESBERGER (Austrian Institute of Technology), Claire FRANÇOIS (CNRS - Centre national de la recherche scientifique), Edgar SHIEBEL (Austrian Institute of Technology)

L'élaboration de terminologies spécialisées est utile, autant à la traduction qu'à l'analyse documentaire. Elle prend une importance grandissante aujourd'hui avec le développement de taxinomies et d'ontologies pour la gestion documentaire et la recherche d'information : Web sémantique, portails d'entreprise, moteurs de recherche performants, tous reposent sur l'établissement et la hiérarchisation de vocabulaires.

Or, quiconque s'attaque à la tâche de définir le vocabulaire d'un domaine découvre rapidement que les frontières en sont floues : si certains termes sont certes centraux pour exprimer les concepts-clés du domaine, plusieurs autres sont davantage périphériques. Et d'autres encore, bien qu'utiles pour articuler le discours complexe du domaine, sont partagés par d'autres disciplines. Ce dernier vocabulaire, transdisciplinaire, a d'ailleurs déjà été reconnu comme utile à l'indexation.

Dans le projet UBIK, démarré en 2014, nous nous intéressons à l'identification du vocabulaire transdisciplinaire de la chimie et à son importance dans le processus de catégorisation des concepts liés au domaine. A l'aide de deux corpus, l'un spécialisé, l'autre multidisciplinaire, notre approche pour établir les caractéristiques des termes du vocabulaire, calculera les fréquences de termes extraits du corpus spécialisé, puis les comparera à celles de termes extraits du corpus multidisciplinaire. Ces corpus, extraits de Scopus, sont fournis par Elsevier dans le cadre du programme EBRP.

Résumé
14 h 00
L'opposition dénomination / désignation dans l'index
Laure amélie Guitard (UdeM - Université de Montréal), Lyne Da Sylva (UdeM - Université de Montréal)

Le but de la présentation est d'appliquer l'opposition dénomination/désignation, telle que montrée par notamment Dubois, Kleiber et Petit, à un corpus de mots à vocation particulière : les entrées d'index de fin d'ouvrages.
La dénomination est la qualité d'un terme d'évoquer non seulement son concept, son sens, mais aussi le fait que ce signe linguistique est autonome. Par opposition, la désignation est compositionnelle et dépend du contexte dans lequel elle est énoncée (exemple de dénomination : « Analyse des besoins »; désignation : « Analyse préalable à la classification »). La dénomination installe un lien référentiel stable, intersubjectivement partagé, appris et contractuel, qui permet à tout locuteur de comprendre la dénomination hors contexte ou dans un contexte aussi épuré qu'un index.
Cette opposition définit deux ensembles de mots au comportement différent dans la langue. Dans un index, cette caractéristique sémantico-référentielle a des répercussions sur la lecture de l'index. L'indexeur devrait donc la prendre en compte. Comment reconnaître une dénomination d'une désignation ? Cette distinction est-elle clairement visible dans les termes d'index ? Si oui, existe-t-il des conditions lexicales (notamment sémantiques) qui favorisent l'appartenance à l'un ou à l'autre type ? Nous essaierons de répondre à ces questions en décortiquant des index de domaines variés en français et en appliquant aux termes d'index les tests linguistiques mis au point par Kleiber et Petit.


Résumé
14 h 30
Pause
15 h 00
Terminologie et phraséologie transdisciplinaire dans les articles scientifiques en SHS
Evelyne JACQUEY (UL - Université de Lorraine), Laurence KISTER (UL - Université de Lorraine), Jean-Marc HUMBERT (UL - Université de Lorraine), Agnès TUTIN (Université Stendhal Grenoble 3)

Le travail présenté fait partie du projet TermITH dont l'objectif principal est d'aider à l'indexation automatique d'articles scientifiques en SHS en tirant parti des occurrences de termes apparaissant dans ces articles. La communication que nous proposons s'intéresse à la validation ou au rejet de chaque occurrence des candidats termes extraits automatiquement par la plateforme TTC-TermSuite relativement à leurs contextes d'apparition. Le contexte d'apparition d'une occurrence de candidat terme peut être qualifié et exploité de différentes manières (variantes terminologiques, dérivations morphologiques, patrons lexico-syntaxiques, relations de dépendances syntaxiques, exploitations
textométriques) et selon différentes finalités (acquisition terminologique, acquisition de relations entre termes, construction et structuration de terminologies ou d'ontologies, ainsi qu'annotation et désambiguïsation terminologiques). Dans le cadre de la désambiguïsation terminologique, notre proposition s'intéresse aux interactions entre des locutions adverbiales transdisciplinaires non ambiguës et les candidats proposés. Ainsi, par exemple, l'occurrence du candidat présent à l'intérieur de la locution jusqu'à présent, dans un article de linguistique, permet de définir des règles d'exclusion des occurrences de candidats dans de telles configurations. L'étude présentée a été menée sur le corpus Scientext (52 articles) avec une liste de 454 locutions.

Résumé
15 h 30
De la conceptualisation : enjeux pour la structuration des relations conceptuelles au sein d'une dissension théorique
Alicia VICO RAMÍREZ (OLST - Observatoire de linguistique Sens-Texte)

Les thésaurus et les ontologies s'avèrent des outils précieux permettant un accès rapide et formalisé aux connaissances d'un domaine spécialisé, ainsi qu'à leurs relations. La création de ce genre de systèmes de représentation de connaissances est facilitée par des outils tels que les glossaires, les dictionnaires spécialisés ou les lexiques. Cependant, aux fins de qualité, leur élaboration doit être basée sur un schème conceptuel du domaine, dont la conception peut s'avérer un défi. Dans certains cas, les dissensions au niveau théorique donnent lieu à des termes dont la définition varie en fonction de l'approche théorique. Par exemple, dans le domaine de la Terminologie, un « concept » peut être considéré comme une représentation mentale ou une entité abstraite résultat d'un consensus entre experts.
La question est : comment identifier et gérer les enjeux issus d'une dissension théorique lors de la création d'un schème de domaine? Dans le but de montrer une première caractérisation de ces enjeux, nous étudierons certains termes fondamentaux dans le domaine de la Terminologie. Nous analyserons les définitions proposées par les différentes approches théoriques pour déterminer et repérer les dissensions théoriques. Ensuite, nous proposerons des solutions afin de faciliter leur gestion et leur classification conceptuelle. Le but ultime de cette étude est de contribuer à la désambiguïsation au sein de la communication spécialisée.

Résumé