1. Modalidad a) Presentar un contexto filosófico. Relacionar modalidad con hedging, evidentiality, uncertainty and factuality. Relacionar con negación. b) Describir la modalidad como un fenómeno lingüístico, y cómo interactúa con el contexto lingüístico (mood, tense, lexis) c) Describir la modalidad desde un punto de vista computacional, incluyendo la detección y desambiguación de marcas léxicas y su alcance. Presentar los principales modelos existentes d) Describir la relevancia para las aplicaciones de NLP que involucran "deep text understanding". Referencias: > The author in the Text: Hedging Scientific Writing K.Hyland [1995] http://sunzi1.lib.hku.hk/hkjo/view/4/400116.pdf > The Language of Bioscience: Facts, Speculations and Statements in Between Light et al. [2004] http://www.cs.brandeis.edu/~jamesp/biolink2004/papers/pdf/BIO003.pdf > Annotating and Recognizing Event Modality in Text Saurí et al. [2006] http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.95.3845&rep=rep1&type=pdf > Stating with Certainty or Stating with Doubt: Intercoder Reliability Results for Manual Annotation of Epistemically Modalized Statements. V. Rubin [2007] http://publish.uwo.ca/~vrubin/Publications/Rubin_2007_StatingWithCertaintyOrDoubt.pdf > Expression of Modality in Biomedical Texts . Renáta Panocová [2008] http://www.pulib.sk/skase/Volumes/JTI03/pdf_doc/Panocova.pdf > Categorising Modality in Biomedical Texts. Thompson et al. [2008] http://personalpages.manchester.ac.uk/staff/paul.thompson/papers/LREC_modality_2008_final.pdf > "Confortation": About a New Category for Analyzing Biomedical Texts D.Battistelli et al. [2009] http://halshs.archives-ouvertes.fr/halshs-00430812/ > Knowledge Claims in Scientific Literature, Uncertainty and Semantic Annotation: A Case Study in the biological Domain [2009] http://halshs.archives-ouvertes.fr/halshs-00430812/ > Factividad de los eventos referidos en textos D. Wonsever et al. [2009] http://www.fing.edu.uy/inco/pedeciba/bibliote/reptec/TR0912.pdf 2. Detección de la modalidad a) Planteo del problema de la detección de la modalidad de enunciados, incluyendo dificultades y aproximaciones existentes b) Fuentes para detectar modalidad: información léxica (marcadores de modalidad, verbos modales, adverbios, etc), sintáctica (relación entre alcance de los marcadores y roles sintácticos) y semántica (relación entre modalidad y roles semánticos). Referencias: > Weakly supervised learning for hedge classification in scientific literature B.Medlock and T. Briscoe [2007] http://acl.ldc.upenn.edu/P/P07/P07-1125.pdf > Hedge classification in biomedical texts with a weakly supervised selection of keywords György Szarvas [2008] http://www.aclweb.org/anthology-new/P/P08/P08-1033.pdf > Learning the scope of hedge cues in biomedical texts. R. Morante and W. Daelemans. [2009] http://aclweb.org/anthology-new/W/W09/W09-1304.pdf > Proceedings of the CoNLL 2010 Shared Task: Learning to detect Hedges and their Scope in Natural Language Text http://www.inf.u-szeged.hu/rgai/conll2010st/book.pdf 3. Aproximación computacional a la detección de la modalidad a) Aproximaciones basadas en reglas: reglas para detección de marcadores de modalidad y su alcance. b) Uso de técnicas de aprendizaje automático supervisado o semisupervisado para detección de marcadores de modalidad y su alcance c) Combinación de técnicas: uso de la información generada por las reglas como atributos para el aprendizaje, mecanismos de votación para combinación de resultados 4. Aplicación de técnicas para un corpus de biología molecular a) El corpus Bioscope: características, principios de anotación b) Enriquecimiento automático del corpus c) Definición de reglas para detección de marcas léxicas de modalidad d) Definición de reglas para detección de alcance de las marcas e) Uso de clasificadores secuenciales para mejorar la detección Referencias: > The BioScope corpus: biomedical texts annotated for uncertainty, negation and their scopes. Vincze et al. [2008] http://www.biomedcentral.com/1471-2105/9/S11/S9 5. Resultados 6. Conclusiones |