Informática‎ > ‎Estadística‎ > ‎

El mejor programa de estadística se llama GNU R... adiós SPSS

El programa “secreto” de los profesionales de la estadística (no solo de quienes estudiaron en la universidad estadística, sino también ecólogos, físicos, químicos,...) se llama R. Puede que pongan a sus alumnos de un curso de introducción a la estadística a hacer las prácticas con SPSS o Statistica (como primera impresión son más bonitos visualmente y las ventanas de herramientas suelen tener una breve explicación de ayuda, de forma que pueden gastar la mínima energía posible en dar las prácticas), pero de puertas para dentro de sus despachos, usan R. Como software estadístico, es el que ofrece una mayor gama de herramientas y análisis, con gran fiabilidad y enorme potencial para mejorar y crear nuevos módulos a medida que avanzan los conocimientos estadísticos. R es uno de los mejores ejemplos de las ventajas del software libre.

La interfaz gráfica por excelencia de R se llama R-Commander, abreviado Rcmdr (aunque no es la única, p  ej. PMG / RPMG). Puede parecer de primeras un poco fea comparada con la de SPSS o Statistica, pero es fácil de usar y bastante completa en cuanto a análisis. En distros GNU/Linux basadas en Debian, para tener Rcmdr basta con instalar el paquete r-cran-rcmdr.

Si quieres que se abra Rcmdr nada más lanzar R sin necesidad de teclear nada, solo tienes que crear un nuevo documento de texto (con KWrite, GEdit, MousePad, Leafpad u otro) con el texto

library("Rcmdr")

Y guardarlo como .Rprofile (ojo al punto delante) en tu carpeta personal (tu “home”) (esto en GNU/Linux, en otros sistemas operativos ni idea).

¡Ojo! Si instalas R directamente desde los paquetes de la web oficial del proyecto y no desde los propios de Debian GNU/Linux (que es lo recomendable como norma general 1), es posible que la instalación sugiera algún paquete no libre, como ocurría hasta hace poco con mclust (pasó a ser libre en agosto de 2012). El proyecto R no debería aceptar ningún paquete no libre, la casi totalidad de los existentes son libres, y no supondría mucho esfuerzo reemplazar los pocos no libres que haya.

Cuando necesites hacer algo complejo con R, no habrá más remedio que vérselas cara a cara con las líneas de código (esto pasa igualmente con SPSS o cualquier otro programa de estadística). Para ello necesitarás un editor de código avanzado. En GNU/Linux hay varias opciones, como RGedit, RKward (que además de editor, incluye algunas opciones gráficas de análisis al estilo Rcmdr y PMG / RPMG) y RStudio (en Windows está Tinn-R). El primero de ellos es un complemento del editor GEdit, y para usarlo hay que descargar la última versión (la Gtk3 en el caso de usar GNOME-3), descomprimirlo y copiar los archivos resultantes a la carpeta ~/.gnome2/gedit/plugins (donde el ~ hace referencia a tu carpeta personal o “home”, quizás sea necesario crear las carpetas correspondientes). Luego, al abrir GEdit (de no tenerlo, se instala de la forma habitual), hay que dirigirse al menú Editar > Preferencias, y en la ventana que se abre, ir a la pestaña Complementos y ahí marcar “R integration”.

Espero con estos consejos allanar el camino a los principiantes. Buen disfrute.


Nota 1: Existen una gran cantidad de paquetes de R (p. ej. para análisis espacial véase los citados aquí y aquí, y para análisis acústico aquí), por lo que las distribuciones solo empaquetan los más usados en general.