home

Discours et TAL : des modèles linguistiques aux applications

JAD'12, Journée d'étude organisée sous l'égide de l'ATALA et de la revue Discours




DERNIÈRES NOUVEAUTÉS



INFORMATIONS PRATIQUES



OBJECTIFS ET THÈMES


Comme le confirment des conférences ou des ateliers comme MAD, LPTS, CID, DAARC ou SIGDIAL pour n'en citer que quelques-uns, l'analyse du discours est un domaine de recherche actif, aussi bien pour les disciplines de la linguistique et de la psycho-linguistique que du Traitement Automatique des Langues (TAL). Force est néanmoins de constater que l'impact de ces travaux d'un point de vue applicatif reste globalement limité et  en tout cas, moins étendu qu'il ne pourrait l'être. Sans être exhaustif, des applications, aussi diverses que l'extraction d'information, le résumé automatique, le question-réponse, la navigation textuelle, l'aide à la rédaction, la détection de citations ou l'analyse d'opinion sont confrontées à l'objet textuel. Plus précisément, elles ont besoin de s'appuyer sur des structures intermédiaires entre le texte et la phrase pour mettre en œuvre leurs traitements, ces structures étant issues d’analyses discursives. En extraction d'information par exemple,  alors que le niveau phrastique peut souvent suffire pour extraire des relations factuelles binaires (“Franz Kafka est né à Prague, alors …” → lieu_naissance(Kafka, Prague)), il est nécessaire de faire apparaître une structuration événementielle des textes pour gérer les ambiguïtés de  rattachement des informations caractérisant un événement (date, lieu et magnitude d'un tremblement de terre par exemple). L'analyse d'opinion opère elle aussi à la fois à un niveau phrastique et à un niveau textuel mais se heurte dans ce dernier cas à l'absence de prise en compte de structures discursives intermédiaires dès lors que l'expression des opinions est complexe (différentes opinions relatives à différentes facettes de l'objet considéré). Le contexte du résumé automatique est aussi un bon exemple de l'importance applicative de l'analyse du discours : extraire les phrases représentatives d'un document ne peut se faire avec pertinence qu'en tenant compte de leur contexte textuel et en particulier de leur position dans la structure discursive de ce document.


Même si l'utilisation des résultats de l'analyse du discours dans ces différents contextes applicatifs ne constitue pas encore une tendance dominante, il existe tout un ensemble de travaux empruntant cette voie. Cette journée d'étude vise à encourager leur présentation. Plus précisément, sont attendues des contributions se focalisant globalement sur :


- l'utilisation de l'analyse discursive dans le contexte d'applications du TAL, en montrant en particulier en quoi cette prise en compte permet d'améliorer ces applications, tant sur le plan de leurs performances que sur celui de l'extension de leur couverture fonctionnelle ;

- les nouvelles questions ou les nouvelles perspectives sur le plan théorique que les problématiques applicatives permettent de mettre au jour ;

- le caractère multi-dimensionnel de l'analyse discursive (temporelle, aspectuelle, thématique, référentielle...) et la façon dont ces multiples "cohérences" peuvent être combinées d'un point de vue applicatif ;

- plus généralement, les travaux linguistiques et psycho-linguistiques sur le discours se plaçant dans la perspective de TAL et de ses applications.

 

Dans cette perspective, ces contributions pourront aborder notamment :

- les solutions apportées aux différents sous-problèmes de l'analyse du discours tels que le découpage en unités énonciatives, la construction des contextes d'énonciation, l'identification des inférences que l'on peut tirer d'un énoncé, la recherche de points d'attache d'un énoncé entrant, l'identification des topiques discursifs, la modélisation de la structure informationnelle...

- les protocoles et les outils d'annotation ou d'évaluation des différents types d'information discursive ;

- l'appréhension unifiée des différents systèmes de marqueurs du discours à des fins de traitement automatique.



CONFÉRENCIER INVITÉ


Yves Bestgen, 
Centre for English Corpus Linguistics, F.R.S-FNRS et Université catholique de Louvain

COMITÉ D'ORGANISATION

  • Olivier Ferret (CEA LIST, Palaiseau)
  • Nicolas Hernandez  (LINA, Université de Nantes)

COMITÉ DE LECTURE

  • Stergos Afantenos (IRIT, Université Paul Sabatier)

  • Florian Boudin (LINA, Université de Nantes)

  • Frédérik Bilhaut (Noopsis, chef de la direction)

  • Pascal Denis (Mostrare, INRIA Lille Nord-Europe)

  • Stéphane Ferrari (GREYC, Université de Caen)

  • Lydia-Mai Ho-Dac (ERSS)

  • Agata Jackiewicz (Université Paris Sorbonne)

  • Frédéric Landragin (Lattice)

  • Aurélien Max, (LIMSI, Université Paris 11)

  • Philippe Muller (IRIT, Université Paul Sabatier)

  • Christian Raymond (IRISA, Université de Rennes)

  • Matthieu Vernier (Dicta Nova, chef de la direction)

  • Antoine Widlöcher (GREYC, Université de Caen)  


ċ
JAD12-actes.tar.gz
(613k)
Nicolas Hernandez,
5 mai 2012 à 02:06
ċ
JAD12-presentation.tar.gz
(8639k)
Nicolas Hernandez,
25 juin 2012 à 09:03
Ċ
Nicolas Hernandez,
5 mai 2012 à 01:59
Ċ
Nicolas Hernandez,
25 juin 2012 à 08:50
Ċ
Nicolas Hernandez,
5 mai 2012 à 02:02
Ċ
Nicolas Hernandez,
25 juin 2012 à 08:50
Ċ
Nicolas Hernandez,
5 mai 2012 à 02:03
Ċ
Nicolas Hernandez,
25 juin 2012 à 08:51
Ċ
Nicolas Hernandez,
5 mai 2012 à 02:03
Ċ
Nicolas Hernandez,
25 juin 2012 à 08:51
Ċ
Nicolas Hernandez,
5 mai 2012 à 02:03
Ċ
Nicolas Hernandez,
25 juin 2012 à 08:51
Ċ
Nicolas Hernandez,
5 mai 2012 à 02:03
Ċ
Nicolas Hernandez,
25 juin 2012 à 08:51
Ċ
Nicolas Hernandez,
5 mai 2012 à 02:03
Ċ
Nicolas Hernandez,
25 juin 2012 à 08:51
Ċ
Nicolas Hernandez,
5 mai 2012 à 02:04
Ċ
Nicolas Hernandez,
25 juin 2012 à 08:52
Ċ
Nicolas Hernandez,
5 mai 2012 à 02:04
Ċ
Nicolas Hernandez,
25 juin 2012 à 08:52