A Linguagem R

R é um sistema de software de código-fonte aberto, atualizado por um grupo de usuários especialistas, do mercado e da academia, que participam de forma voluntária desde diferentes países. O centro de decisões quanto a alterações e características do sistema encontra-se no grupo chamado R-core, com a ativa participação de um grande grupo de colaboradores (contributors).

O sistema base proporciona uma linguagem interativa para cálculos numéricos, gestão de dados, gráficos e uma variedade de operações relacionadas. Os cálculos podem ser realizados com os programas e funções já incorporadas, ou com códigos que você mesmo pode programar para realizar suas análises. Esta última talvez seja a característica mais importante do R.

Esse sistema base proporciona também suporte para milhares de pacotes (packages) disponíveis no repositório central cran.r-project.org e em outras coleções. Pode ser instalado em Windows, Mac OS X e Linux, com uma variedade de interfases gráficas de usuário.

O R inclui alguns algoritmos para cálculos numéricos e de simulação que refletem igualmente os modernos padrões computacionais de código-fonte aberto.

R é um software escrito em um estilo funcional, que ajuda tanto a entender a intenção como a garantir que a execução corresponda a essa intenção. Os cálculos são organizados em torno de funções, que podem encapsular grande parte dos resultados computacionais específicos, com implementações possíveis de ser examinadas pela sua exatidão. Pelo seu principal estilo de programação funcional, as aplicações mais interessantes encontram-se orientadas a análise de dados, numérica e graficamente.

É um software cada vez mais popular entre aqueles orientados à análise de dados, por exemplo, os conhecidos Minitab, S-PLUS, SAS, SPSS, Stata, Statistica, Systat e outros. Uma análise comparando diferentes estatísticas e indicadores pode-se apreciar na compilação de Robert Muenchen (http://r4stats.com/popularity ). O R Teve uma importante aceitação nos diferentes ambientes profissionais, empresariais e acadêmicos, tendo como usuários os analistas estatísticos, estudantes, e diversos profissionais ao redor do mundo. Ainda nos últimos anos foi manchete no New York Times (http://www.nytimes.com/2009/01/07/technology/business-computing/07program.html ) e indicado pela Revista Forbes como uma das coisas que você deveria conhecer em 2011 (http://blogs.forbes.com/smcnally/2010/11/10/names-you-need-to-know-in-2011-r-data-analysis-software/ ).

Outra vantagem adicional é a reproducibilidade na pesquisa, ou seja, possibilidade de documentar/comentar cada procedimento/análise realizado através de arquivos de códigos (scripts) de forma que sempre se obtenha os mesmos resultados.

Atualmente é possível ir além. Por exemplo, pode-se automatizar o processamento e parte da redação de relatórios. Para isso é suficiente criar um único documento fonte (arquivos com formato rmardown < http://rmarkdown.rstudio.com/ > de extensão “*.rmd”, ou do formato sweave/knitr < http://yihui.name/knitr/ > com extensão “*.rnw”, entre outros), que logo será convertido em um formato final usual como Word, PDF, HTML e outros utilizados na editoração de livros e ebooks. Para maiores informações sobre estas últimas possibilidades consulte o software RStudio < https://www.rstudio.com/ >e o formato LATEX < https://www.latex-project.org/ >.

Boa jornada de aprendizado!

02/03/2016

Livros

  • TORGO, L. A Linguagem R - Programação para Análise de Dados. Lisboa: Escolar Editora, 2009.
  • CHAMBERS, J. M. Software for Data Analysis: Programming with R. New York: Springer, 2008.
  • JONES, O.; MAILLARDET R.; ROBINSON A. Introduction to Scientific Programming and Simulation Using R. Boca Raton, FL: Chapman & Hall/CRC, 2009.

Links de interesse:

Linguagem R <http://www.r-project.org >

An Introduction to R. Manual online,

<http://cran.r-project.org/doc/manuals/R-intro.pdf >.