Equipe Grammaires

Responsables : Marcel Cori & Sarah Leroy

  1. Présentation générale de la problématique scientifique
  2. Liste des opérations
  3. Membres de l'équipe



1. Présentation générale de la problématique scientifique

L’équipe Grammaires recouvre un ensemble de travaux en cours et de projets à développer qui ont pour spécificité, au sein du laboratoire MoDyCo, de s’intéresser aux aspects internes de la linguistique dans une visée descriptive et modélisatrice (ce qui la situe dans le secteur Modèles) et de s’intéresser à ses objets d’étude en premier lieu en ce qu’ils forment des systèmes linguistiques.

La langue étudiée est le plus fréquemment le français, comme c’est naturel dans un laboratoire de linguistique française, mais on ne s’interdit pas pour autant d’aborder d’autres langues (anglais, allemand, basque, breton, hébreu, hongrois, inuit, kabyle, polonais), ne serait-ce que dans une visée comparative, ou pour étendre ou tester les capacités descriptives et prédictives d’un modèle donné. Les compétences multiples de l’équipe permettent de n’ignorer aucune dimension « interne » de la langue et d’en aborder la phonologie et la prosodie, la syntaxe et la morphologie, la sémantique, ainsi que, naturellement, les rapports entre ces différents niveaux d’analyse complémentaires (prosodie et syntaxe, morphologie et sémantique, etc.).

Du point de vue des méthodes, le travail de l’équipe Grammaire se caractérise par un va-et-vient permanent entre données et modèles, ainsi que par une méta-réflexion sur la nature des unes et des autres. Ainsi, les analyses s’appuient toujours sur des descriptions fines et réalistes des phénomènes linguistiques considérés, pour lesquelles on peut utiliser de grands corpus, des données rassemblées ad hoc ou des constructions et des tests fondés sur la compétence du locuteur. Ces pratiques ne vont pas sans une réflexion sur les observables (on s’interroge sur le statut à accorder aux investigations sur corpus, selon la nature des corpus) et la mise à disposition d’une partie (qui est appelée à augmenter encore) de ces observables à destination de la communauté scientifique d’une part et, d’autre part, une participation à la réalisation d’outils de traitement des corpus, ainsi qu’à l’évaluation de ces outils. Parallèlement, on développe, tout en les confrontant aux données et à leurs descriptions, des modèles, qui relèvent essentiellement du formalisme à base logico-algébrique et du cognitivisme, deux approches actuelles qui s’inscrivent pleinement dans le contexte international de la recherche dans les domaines concernés. Ces modèles se déclinent en plusieurs options théoriques non exclusives mais plutôt complémentaires, dont on trouvera le détail dans les pages qui suivent.

L’équipe Grammaires se structure en quatre opérations majeures :
L’opération Lexique, morphologie, sémantique a pour objet d’étude l’ensemble des unités lexicales, envisagées du point de vue de leurs propriétés internes, morphologiques et sémantiques. Il s’agit avant tout de décrire les opérations de construction lexicale, sur les plans formel, catégoriel et sémantique et d’établir des généralisations permettant d’aboutir à une représentation raisonnée du lexique incluant les mots simples comme les mots construits. Morphologique et sémantique allant de pair, l’opération s’enrichit d’une dimension sémantique plus marquée que précédemment, ce qui permettra d’aller plus loin dans la représentation du sens dans la construction lexicale et dans la description de la structure du lexique (avec de nouvelles catégories descriptives, issues de l’approche cognitive, pour le traitement de certains types lexicaux), de confronter des approches sémantiques diverses à des problématiques lexicales complexes (allomorphie, polysémie, lacune lexicale), mais aussi d’augmenter l’empan des réalisations considérées, en y incluant les constructions.

L’opération Modèles formels et traitement automatique se consacre d’une part à l’élaboration de modèles syntaxiques formels dans une perspective de traitement automatique, d’autre part à la question de l’utilisation d’instruments (corpus et outils) informatiques en linguistique. Ainsi, un travail de formalisation sera mené sur certains aspects purement syntaxiques (prédication verbale, ellipse) ou syntactico-sémantiques (scalarité et manière dans le domaine de la comparaison) ; la formalisation permettra également de lier intonation et syntaxe et de comprendre leurs relations. Les travaux de modélisation auront des retombées sur le plan de l’outillage (analyse linguistique multi niveaux, extraction d’informations sur le web, segmentation automatique de corpus) comme sur le plan épistémologique du rôle et de la place des corpus dans le travail du linguiste.

L’opération Phonologie de corpus et Phonologies dynamiques vise à développer, à partir de données rassemblées en corpus, les bases descriptives de l’usage phonologique et prosodique contemporain et d’établir, à partir de ces descriptions et pour ces données, les modélisations dynamiques les plus propres à en rendre compte dans toute leur diversité et toute leur variation. Ainsi, la constitution du corpus PFC sera poursuivie et exploitée pour l’analyse phonologique de la liaison et du ‘e’ muet, de la prosodie dans ses relations avec ces réalisations phonologiques et pour la modélisation de la syllabe. Cette opération est donc active dans la production, l’annotation / étiquetage (problèmes méthodologiques et épistémologiques inclus) et la mise à disposition de données orales, mais exploite aussi ces données orales pour des descriptions réalistes et des modélisations théoriques, sans oublier une réflexion historique et épistémologique faisant retour sur la discipline elle-même.

L’opération Syntaxe et sémantique grammaticale descriptives s’organise autour de la recherche des corrélations entre la forme et le sens. Elle s’appuie spécialement sur l’exploitation de grands corpus du français (emplois des verbes ou locutions prépositionnelles du français), mais également sur l’analyse comparative de langues. Ainsi, il s’agit par exemple de systématiser les propriétés observées dans un corpus de verbes français, ou d’avancer dans le recensement des locutions prépositionnelles du français, de décrire comment elles sont constituées et comment elles s’articulent pour former des constructions syntaxiques. L’objectif est notamment la traduction, et aussi la traduction automatique. Il s’agit enfin de valider (ou d’invalider) des hypothèses relatives à l’énonciation en étudiant la grammaticalisation des marques d’attitude énonciative (comme l’ironie) dans certaines langues.

Cette équipe, articulée autour des disciplines fondamentales de la linguistique synchronique, bénéficie d’un certain nombre d’atouts qui lui permettront de développer une recherche de qualité dans le champ français et international.
Harmonieusement composée de « poids lourds » de la discipline et de plus jeunes (enseignants-) chercheurs, elle échappe ainsi à la menace démographique qui plane sur la plupart des laboratoires français. Cette équipe conjugue diversité des approches et concentration des moyens dans une perspective collaborative. En raison de la complémentarité des compétences et des approches, différents types de théories sont étudiés et confrontés, de même que les différentes dimensions de la langue sont constamment considérées en parallèle. Les étapes, de la description à la modélisation, sont conçues comme complémentaires. L’équipe s’inscrit ainsi dans les tendances actuelles des recherches en linguistique, où les programmes, de longue haleine, sont nécessairement multidimensionnels et collectifs. D’un point de vue purement scientifique, l’équipe participe au renouveau des approches linguistiques, marquées par une récente réorganisation des plans théorique et descriptif, sans pour autant aborder avec naïveté les données et les approches bottom-up : si les recherches sont souvent menées sur des corpus, on n’oublie pas de bien considérer les limites de cette approche et de ne jamais les disjoindre de la modélisation visée. Bien sûr, l’insertion dans la communauté scientifique passant entre autres par la participation à la constitution de ressources et à la mise à disposition de ces ressources (pour leur utilisation à d’autres recherches ou comme garanties de la reproductibilité des observations), les membres de l’équipe s’y emploient et une augmentation sensible de ces ressources « ouvertes » est programmée.

Par ailleurs, l’équipe Grammaires est très liée à la formation. Sur le plan des cursus proposés à Paris 10, elle est impliquée dans l’enseignement et l’encadrement de plusieurs masters (masters recherche « Langue, usages, modèles » et « Traitement automatique des langues », master professionnel « Documents électroniques et flux d’informations »), dont les séminaires (au niveau du master 2) mettent en contact étudiants de master et doctorants. Bon nombre de projets et stages du master « Documents électroniques et flux d’informations » et du master « Traitement automatique des langues » se font au sein du laboratoire MoDyCo, ce qui permet d’insérer les étudiants dans un contexte de recherche scientifique et de préparer, en amont, des thèses. L’encadrement doctoral est aussi une des forces de l’équipe : relativement peu de doctorants (moins de 4 par encadrant), pour un encadrement de qualité, souvent financé (une allocation de recherche et un post-doctorat par an pour le laboratoire, actuellement plusieurs thèses financées sur contrats ANR ou européens), et sur des sujets qui s’inscrivent, et s’inscriront de plus en plus clairement, dans le projet global de l’équipe.
Enfin, l’ouverture de l’équipe sur l’extérieur se fait aussi par son insertion dans des réseaux scientifiques, qu’il s’agisse de collaborations ponctuelles ou régulières en France et dans le monde, d’implications dans des actions de recherche coordonnées (PRC, GDR, etc.) ou dans des contrats de recherche financés. La partie « bilan » de ce rapport fait apparaître la capacité de certaines opérations à répondre à des appels d’offre et à mener à bien des contrats de recherche ; cette partie plus prospective indique déjà plusieurs projets de réseaux, de programmes internationaux ou plus modestement de colloques et de publications collectives, qui montrent que cette activité va se poursuivre et se développer, contribuant ainsi à renforcer la visibilité de l’équipe et de ses membres.

 



2. Liste des opérations

  1. Lexique, morphologie, sémantique
  2. Modèles formels et traitement automatique
  3. Phonologie de corpus et phonologies dynamiques
  4. Syntaxe et sémantique grammaticale descriptives

 

Opération inter-équipes
  1. Corpus de langage oral : formats, conversion, visualisation et interrogation

 





3. Membres de l'équipe

Membres rattachés à titre principal

Chercheurs et enseignants-chercheurs

K. Baschung, D. Bottineau, A. Boucherit, C. Bracquenier, N. Chatar, M. Cori, G. Desagulier, D. T. Do-Hurinville, D. Flament, P. Gréa, A. Jacquet, S. Kahane, M. Klein, A. Lacheret, B. Laks, D. Leeman, D. Le Pesant, S. Leroy, S. Pétillon-Boucheron

ITA

A. Tchobanov, S. de Pontonx

Membres émérites ou honoraires

A. Balibar-Mrabti, A. Delaveau, F. Kerleroux

Doctorants

M. Avanzi, A. Azari Nadjaf, G. Belarbi, K. Bernardon de Oliveira, E. Bestchastnova, O. Bondeelle, J. Delahaie, C. Faivre, O. Floquet, C. Graml, Y. Kouame, M. Lureau, L. N’Kondo, C. O’Brien, M. Otman, G. P. Renello, E. Saint-Jean, M.-P. Sales, M. Salhi, C. Salinas-Kahloul, T. Savoia, C. Teissèdre, O. Taheri, P. Tomatis

Jeunes chercheurs associés

F. Delumeau, A.G. Konte, V. Muni-Toke, S. Saulnier

Membres associés

J.-C. Anscombre (CNRS),  P.-P. Haillet (Cergy-Pontoise), M. Kahloul (Gabès, Tunisie), P. Larrivée (Aston), P. Lauwers (Leuven), R.-J. Lavie, F. Villoing (Paris 8)

Collaborations extérieures

M. Amar (BPI), E. d’Andrade (Lisbonne), J. Aptekman (Paris 3), A. Auchlin (Genève), M.-J. Béguelin (Neuchâtel), G. Bergounioux (Orléans), A. Berrendonner (Fribourg), P.-M. Bertinetto (Pise), P. Blumenthal (Cologne), J. Brandao de Carvalho (Paris 8), B. Calderone (Pise), J.-P. Chevrot (Grenoble), G. Cislaru (Paris 3), J. Coleman (Oxford), L. Degand, (Louvain la Neuve), S. Detey (Rouen), A. Dister (Louvain la Neuve), J. Dubois (Paris 10), F. Dubois-Charlier (Aix-Marseille 1), J. Durand (Toulouse), J. François (Caen), K. Gerdes (Paris 3), G. Girard (Paris 3), J.-P. Goldman (Genève), J. Goldsmith (Chicago), U. Gut (Augsburg), P. Hadermann (Gand), G. Hassler (Potsdam), M. Ihadjadene (Paris 10), O. Inkova (Genève), S. Izral (Tel Aviv), H. Jacobs (Nimègue), C. Kelling (Konstanz), G. Kristofersen (Bergen), F. Lareau (Montréal et Université Paris 7), M. Lecolle (Metz), S.-H. Lee (Séoul), D. Legallois (Caen), J. Léon (CNRS), S. Loiseau (Limsi), C. Lyche (Oslo), J.-M. Marandin (CNRS), J. Meinschäfer (Konstanz), I. Mel’cuk (Montréal), J.-M. Merle (Aix-Marseille I), P. Mertens (Louvain), A. Mettouchi (Nantes), E. Nardi (Rome), N. Nguyen (Aix-Marseille 1), C. Onguene-Essono (Yaoundé), C. Pagliano (Nice), M.-G. Pak (Suwon), R. Panckhurst (Montpellier 3), P. Péroz (Metz), M. Pierrard (Bruxelles), A. Polguère (Montréal), N. Quayle (Lille), M. Silberztein (Besançon), A.-C. Simon, (Louvain la Neuve), A. Tifrit (Nantes), D. Tribout (Paris 7), D. van Raemdoncq (Bruxelles), M. von Oostendorp (Amsterdam), S. Wauquier-Gravelines (Paris 8), H.-Y. Yoo (Paris 7)


 

 Imprimer  E-mail