Historia En 1983, contando solamente con un Apple IIe (con solo 56Kb de RAM), iniciamos un proyecto de desarrollo de software de análisis de textos para computadores personales, utilizando el lenguaje Basic y algunas rutinas en Assembler para el procesador de esa máquina. Nació así la primera versión de "ANATEX". Poco después aparecieron los primeros Macintosh y, cuando ya pudimos contar con máquinas de 1Mb de RAM (Mac Plus), la Vice-Rectoría Académica de la Pontificia Universidad Católica de Chile respaldó el proyecto y encargó al Servicio de Computación e Informática el desarrollo de una nueva versión -Anatex 2.0- para MacOS, con la cual se llevaron a cabo varias investigaciones en la universidad, incluyendo un proyecto financiado por Fondecyt (Fondo Nacional de Desarrollo Científico y Tecnológico) (1). Esta versión siguió siendo operativa hasta llegar al MacOS7.x y lo hemos usado incluso en PowerPC con MacOS8.0, aunque con algunas limitaciones. Después de años sin poder utilizar ya Anatex 2.0 y después de realizar otros proyectos, hemos podido finalmente desarrollar la presente versión en PHP para Linux. Objetivos de Anatex El presente programa está destinado a facilitar múltiples operaciones vinculadas al análisis de textos, tanto en el campo del análisis de contenido como en lingüística y otras áreas vinculadas a las anteriores como la hermenéutica y la exégesis. Pueden igualmente beneficiarse todas aquellas disciplinas que recurren al texto como medio de investigación o desarrollo: periodismo, psicología, derecho, etc. Tipo de análisis realizado por Anatex En particular, este programa permite obtener primero estadísticas relativas a las palabras y clasificaciones de las mismas para -posteriormente y previa selección manual- poner en evidencia ciertos conjuntos de términos (que conforman "campos" con un mismo núcleo semántico), llegando así a desvelar parte de la estructura semántica del texto original. Se han, por lo tanto, de distinguir claramente estas dos partes del software: una estadística de palabras y una estadística de pares de conceptos (o más bien campos conceptuales) coocurrentes. Funciones y características de Anatex Una vez ingresado el texto original (de acuero a algunas reglas básicas que se especifican en el formulario correspondiente), Anatex divide el documento en oraciones individuales, ajustando su formato. Se puede luego optar por ver una estadística de todas las palabras existentes. Antes o después de este cálculo, será conveniente ajustar el "filtro" que ha de contener todas las palabras sin valor para el análisis (como los artículos, preposiciones, etc.). Aunque no es absolutamente obligatorio, es altamente conveniente afinar este filtro lo mejor que se pueda, ya que esto influye en la duración y la ocupación de memoria RAM para los procesos posteriores. El paso siguiente consiste en construir un "diccionario" conformado por las definiciones de "campos conceptuales" o sea los conjuntos de términos que se consideran semánticamente equivalentes. (Un mismo diccionario puede ser utilizado para varios textos, igual que el "filtro"). Para efectuar el análisis de coocurrencia, se requiere -primero que todo- contar con una lista de palabras (que conformarán el llamado "diccionario") que serán las investigadas. Es en efecto imposible, con la memoria disponible, cruzar todas las palabras existentes en el texto, muchas de las cuales, por otra parte, no aportan conceptualmente nada. La extensión máxima del diccionario que puede ser utilizado no está definida, pero se considera habitualmente que no es conveniente pasar de 100 alternativas, tanto para evitar gráficos demasiado complejos como para evitar que el tiempo requerido para el procesamiento sea exagerado (ya que crece en forma exponencial). Hablamos arriba de contar con una serie de "alternativas" más que de palabras, por el hecho de que el diccionario puede contener equivalencias de términos. Para introducir equivalencias, se ha de seleccionar o anotar la palabra-clave que se desea utilizar como base (para reconocer luego el conjunto en las listas de resultados); luego se seleccionan todos los términos que se desee tratar como equivalentes. Así, si un verbo aparece varias veces conjugado de distintas manera, podemos ordenar la equivalencia escribiendo, por ejemplo: describir, describí, describieron, describirá Lo mismo es válido para cualquier serie de palabras (tengan o no una raíz común) (p.ej. "chileno", "ciudadano" y "compatriota"). Las variaciones de género y número también deben ser incluídas aquí. Esta tarea -que debe hacerse manualmente- debe realizarse con máximo cuidado ya que la mayor o menor objetividad de la investigación depende de este paso. Por esta misma razón, es esencial adjuntar en anexo del informe del análisis una copia de este "diccionario". (Sobre el tema de la objetividad en el análisis de contenido, puede consultar al respecto nuestra Introducción al A.C..) Anatex termina entregando una tabla con las frecuencias de los pares coocurrentes de campos conceptuales definidos en el diccionario. Se requiere otra aplicación para confeccionar los gráficos. Para ello y para un eventual tratamiento posterior en planillas de cálcuilo se exportan automáticamente los resultaos en formato CSV. Interfaz ANATEX 3.1 opera con interfaz web, lo cual lo hace de muy fácil uso. Instalado en un servidor Apache, puede ser utilizado en el mismo servidor o en cualquier PC de la red asociada y con cualquier navegador. Sin embargo, en este caso, se debe tener cuidado de limitar el acceso a un sólo usuario (es mono-usuario) y sólo se puede analizar un texto a la vez. Los resultados son exportados también en un formato que permite el traspaso a hojas de cálculo. Disponibilidad del software ANATEX 3.1 está disponible sin cargo para uso académico en las siguientes condiciones:
ANATEX 3.3 está ahora disponible, agregando la capacidad de analizar diez textos con mismo diccionario y sumar los resultados. Se puede leer un ejemplo de su uso en el artículo "La temática de 'Latina' 1998-2008" en la Revista Latina de Comunicación Social. Disponibilidad del servicio de análisis Para los investigadores que no tienen acceso a servidores Linux, se ofrece el servicio de análisis en los siguientes casos y condiciones:
_____________________________________________________________________ (1) Ver: "El discurso político-electoral chileno en 1993", Fondecyt, Santiago, 1995-96. - "Prensa y moral familiar", DIUC-Pontificia Universidad Católica, Santiago, 1992-93 (Informe publicado en forma de libro). - "La visita de Juan Pablo II en la prensa de la capital", Escuela de Periodismo UC, Santiago, 1987. - "El terremoto de marzo 1985 en la prensa de la capital", Escuela de Periodismo UC, Santiago, 1985. - "La ilustración en la prensa de la capital", Esc. Periodismo UC, 1980-1987. |