Lingüística de Corpus

Palabras clave: lingüística de corpus, metodología lingüística, análisis cuantitativo, análisis cualitativo

Resumen de la charla

La lingüística de corpus es un conjunto de metodologías elaboradas para estudiar el lenguaje y las lenguas a partir de colecciones informatizadas de textos. Su desarrollo en las últimas décadas, asociado primero al desarrollo de la informática y después al desarrollo de internet, es sin duda una de las facetas más destacadas de la lingüística contemporánea.

En esta presentación se ofrecerá una visión general de qué son los corpus lingüísticos, cómo pueden estar diseñados y cómo se pueden utilizar para investigar aspectos concretos de la gramática y el léxico de las lenguas. Pero prestaremos especial atención a la influencia de la lingüística de corpus en nuestra manera de aproximarnos al estudio del lenguaje.

En tanto que metodología de investigación, la lingüística de corpus es a priori compatible con y útil para cualquier modelo teórico; pero la utilización de muestras textuales producidas en contextos naturales hace que sea especialmente compatible con los modelos (funcionales y cognitivos) basados en el uso. Por otro lado, la posibilidad de explorar con ayuda de la informática ingentes cantidades de texto hace que los estudios basados en corpus consistan sobre todo en análisis cuantitativos de frecuencias de ocurrencia y patrones de co-ocurrencia de las unidades lingüísticas básicas. Sin embargo, el análisis cuantitativo puede y debe acompañarse de análisis cualitativo de los datos del corpus. Los corpus anotados contienen información que representa análisis lingüísticos particulares, potencialmente controvertidos. Por el contrario, ciertas aproximaciones [“corpus-driven” approaches] proponen dejarse guiar por el corpus y no imponerle más categorías analíticas que aquellas que emergen del propio corpus. En cualquier caso, la lingüística de corpus ha contribuido, como pocas otras metodologías, a difundir la idea de que las categorías lingüísticas tienen límites borrosos, son variables y están condicionadas por múltiples factores contextuales.

¿Cómo citar esta charla de nuestro repositorio?

García-Miguel, J. M. (2019). "Lingüística de corpus", en Psylex (org.), Zaragoza Lingüística a la Carta, Universidad de Zaragoza.

Página web de José Mª. García-Miguel