A importância e aplicações da Estatística na área da Agronomia;
Os conceitos básicos de Estatística;
Os primeiros passos para organização de dados.
Podemos observar em várias situações a aplicação dos conhecimentos de Estatística na área da Agronomia: delinear um experimento no campo, avaliar o efeito da aplicação de um produto sobre a produtividade do plantio de alguma cultura, estimar a produção de uma safra, estabelecer os melhores métodos para controle de pragas etc. Em todas essas situações, a tomada de decisões é alicerçada na análise criteriosa de insumos de pesquisas, coletas de dados e análises estatísticas.
Em situações de aleatoriedade e incertezas, a Estatística configura-se como uma luz que ilumina o caminho a ser seguido e clarifica as decisões a serem tomadas, visando à redução de riscos no processo decisório. O papel da estatística na ciência pode ser melhor compreendido a partir das seguintes questões:
Em uma situação de pesquisa, são realizados estudos experimentais ou observacionais que podem levar à coleta de um rol de informações que precisam ser organizadas, resumidas e apresentadas.
O objetivo da investigação é responder uma questão científica que pode ser descrita, por exemplo, por uma hipótese de estudo.
A variação natural nos dados faz com que as respostas obtidas não sejam óbvias, tornando-se necessário o estabelecimento de padrões de resposta que auxiliam o pesquisador na compreensão dos fenômenos investigados.
A estatística refere-se a métodos para coleta e descrição dos dados, e então a verificação da força da evidência nos dados pró ou contra as hipóteses formuladas.
A partir da análise estatística de uma coleta de dados, obtemos resultados que nos permitem um olhar científico sobre os fenômenos da natureza, viabilizando o entendimento de como eles se comportam e quais são os padrões de resposta encontrados. A relevância e a importância do conhecimento das ferramentas estatísticas e de suas aplicações e interpretações torna o seu conhecimento indispensável para qualquer profissional, independentemente da sua área de atuação.
Pesquisas na área da agronomia são essenciais para a construção do conhecimento nesta área e consequentemente para o melhor entendimento dos fenômenos que estão relacionados ao trabalho do agrônomo. A compreensão de todos os aspectos relacionados a um estudo experimental é de suma importância na análise de dados.
Um dos conceitos muito importantes para que possamos contextualizar uma boa análise estatística é o da Experimentação. Para STORCK & LOPES (2004):
Experimentação é uma parte da estatística que estuda o planejamento, execução, coleta dos dados, análise e interpretação dos resultados dos experimentos. O pesquisador necessita dos conhecimentos da técnica experimental para: planejar, executar, avaliar, analisar e interpretar os resultados dos experimentos. Por outro lado, o técnico, usuário dos resultados da pesquisa, deve conhecer a experimentação para entender o experimento e avaliar a confiabilidade dos resultados bem como permitir melhorias na troca de ideias com os pesquisadores, pelo uso de uma linguagem técnica adequada. Assim, a experimentação é importante para todo o profissional, ligado direta ou indiretamente à pesquisa.
As técnicas de Experimentação oferecem suporte ao pesquisador, viabilizando o entendimento do comportamento das variáveis e permitindo, desta forma, a tomada de decisão mais assertiva e com menores riscos. Na área da Agronomia, observamos que há uma grande variedade de fatores relacionados ao manejo das culturas que são determinantes nos resultados finais obtidos. Toda e qualquer decisão acerca da condução de uma nova técnica, da utilização de um novo produtos etc., só poderá ser disseminada após ter sido submetida através da experimentação a testes estatísticos com objetivo de comprovar hipóteses de pesquisa.
Ao executar um estudo, a etapa de planejamento do experimento é muito importante para garantir bons resultados em sua execução, pois um bom planejamento depende das variáveis respostas, dos fatores experimentais e das unidades experimentais. Para isso temos os princípios básicos da experimentação que objetivam a condução de um estudo com a redução máxima do erro experimental:
Um mesmo tratamento deve ser aplicado a duas ou mais unidades de experimentação, permitindo verificar a quem é devida a variação observada. Este princípio promove o aumento da precisão do estudo.
Refere-se à aplicação dos tratamentos de forma aleatória nas unidades experimentais, permitindo a estimativa imparcial de uma média.
Em casos de pesquisas em que há uma heterogeneidade característica na unidade experimental, se faz necessária a distribuição dos tratamentos no campo de investigação em áreas homogêneas, que podem ser chamadas de blocos. Este princípio reduz o erro experimental, uma vez que divide um ambiente de natureza heterogênea em subambientes internamente homogêneos.
Na rotina diária de um Engenheiro Agrônomo é muito comum deparar-se com um grande volume de informações estatísticas: estatísticas do Ministério da Agricultura, sobre as diferentes produções agrícolas, sobre o meio ambiente, sobre os avanços tecnológicos na sua área etc., não há como fugir de tanta informação. A quantidade enorme de dados é o que caracteriza o mundo atual. Cada vez mais, necessitamos de informações e saber como obtê-las e como entendê-las é fundamental para qualquer profissional, pois ele deve ser capaz de fazer uma análise crítica dos dados, possibilitando uma tomada de decisão mais consciente.
Para qualquer profissional, além do conhecimento específico de sua área de atuação, ele precisa ter conhecimentos sobre métodos, técnicas e procedimentos que o auxiliem na compreensão de resultados provenientes de pesquisas científicas. Nesse pacote de conhecimentos também está contemplado o método estatístico através de suas ferramentas de análise que permitem estimativas, previsões e a geração de modelos estatísticos capazes de auxiliar de forma eficaz na tomada de decisões.
Para Silva (1995), a abordagem do ensino da estatística corresponde a opinar sobre as seguintes questões: o quê? Como? Onde? As respostas dessas questões devem ser antecedidas das respostas preliminares das questões: porquê? Para quê? Para quem? O autor destaca ainda que o progresso da ciência tem sido a fonte para o extraordinário desenvolvimento da estatística.
Qual é a melhor forma de manejo de pastagem para gado de corte?
Qual adubo produz melhores resultados?
Qual é o padrão de crescimento da planta de arroz?
Qual é o melhor sistema de irrigação para a lavoura?
Encontramos vários conceitos e definições para a Estatística. Alguns autores a definem como um ramo da matemática, já outros defendem a ideia de que a Estatística representa por si só uma área única da ciência, desconsiderando ser esta uma subdivisão da matemática.
Rao (1999) define estatística como:
A estatística é uma ciência que estuda e pesquisa sobre: o levantamento de dados com a máxima quantidade de informação possível para um dado custo; o processamento de dados para a quantificação da quantidade de incerteza existente na resposta para um determinado problema; a tomada de decisões sob condições de incerteza, sob o menor risco possível. Finalmente, a estatística tem sido utilizada na pesquisa científica, para a otimização de recursos econômicos, para o aumento da qualidade e produtividade, na otimização na análise de decisões.
Ao iniciar uma análise estatística, deve-se também considerar alguns elementos relacionados à metodologia do estudo realizada, como as definições de População, Amostra e variáveis de pesquisa:
Uma população (N) é conjunto de elementos de interesse em um determinado estudo, que podem ser pessoas ou resultados experimentais, com uma ou mais características comuns, que se pretendem estudar.
Uma amostra (n) é um subconjunto da população usado para obter informação acerca do todo. Obtemos uma amostra para fazer inferências de uma população. Nossas inferências são válidas somente se a amostra é representativa da população.
Para ilustrar esses conceitos através de um exemplo, considere a seguinte situação de pesquisa:
De acordo com o Conab (Companhia Nacional de Abastecimento), a cultura do milho é uma das mais importantes no contexto econômico e social no mundo, ocupando a segunda posição em termos de produção mundial. O Brasil é o terceiro produtor mundial dessa cultura, estando à sua frente apenas os Estados Unidos e a China. Nesse contexto, um estudo foi realizado com o objetivo de verificar a produção total (em toneladas) de milho de produtores brasileiros da Região Sul. Para esse estudo selecionou-se um grupo de 60 propriedades produtoras de milho e foi observada em cada propriedade a quantidade produzida de milho (em toneladas) no último ano.
Para essa situação, teremos:
População: todos os produtores de milho da Região Sul do Brasil.
Amostra: 60 produtores de milho da Região Sul do Brasil (n = 60).
Outro conceito muito importante é o da Variável, que vem a ser o evento de interesse ou, ainda, “o que o pesquisador deseja saber”. Em um estudo, podemos ter uma ou várias variáveis, dependendo dos objetivos e das hipóteses a serem testadas. Quando se termina uma coleta de dados, em um primeiro momento dispomos de um conjunto de valores ou, ainda, respostas pertinentes às nossas variáveis de pesquisa.
Uma variável (x) é uma característica dos elementos investigados que difere de um elemento para outro e do qual temos interesse em estudar. Cada unidade (elemento) da população que é escolhida como parte de uma amostra fornece uma medida de uma ou mais variáveis, também chamadas observações.
As variáveis podem ser classificadas em:
Variáveis Quantitativas: são as características que podem ser medidas em uma escala quantitativa, ou seja, apresentam valores numéricos/quantidades. Podem ser contínuas ou discretas.
Características mensuráveis que podem assumir apenas um número finito ou infinito contável de valores e, assim, somente fazem sentido valores inteiros. Exemplos: números de cavalos de uma propriedade, número de filhotes, número de propriedades que utilizam o método de irrigação por superfície etc.
Características mensuráveis que assumem valores em uma escala para as quais valores fracionais fazem sentido. Exemplos: produção de leite, tempo de gestação de uma égua, tamanho da propriedade em m2 etc.
Variáveis Qualitativas: são as características que não possuem valores quantitativos, mas, ao contrário, são definidas por várias categorias, ou seja, representam uma classificação dos elementos. Podem ser nominais ou ordinais.
Não existe ordenação dentre as categorias. Exemplos: marca de adubo, tipo de milho cultivado, tipo de solo etc.
Existe uma ordenação entre as categorias. Exemplos: escolaridade (Fundamental, Médio ou Superior), grau de importância (nenhuma, pouca, razoável, muito) etc.
No exemplo anteriormente citado referente à produção de milho de uma amostra de 60 produtores da Região Sul do Brasil, teremos:
População: todos os produtores de milho da Região Sul do Brasil.
Amostra: 60 produtores de milho da Região Sul do Brasil (n = 60).
Variável: quantidade produzida de milho (em toneladas) no último ano.
Classificação da Variável: quantitativa contínua.
Outros dois conceitos importantes são pertinentes à divisão da Estatística em duas áreas: Estatística Descritiva e Estatística Inferencial. A área descritiva é sempre o primeiro contato do pesquisador com os dados coletados. Ela contempla ferramentas de organização de dados e síntese de informação, fazem parte dela as tabelas, gráficos, medidas de tendência central e medidas de variabilidade. A partir dos insumos do resultado de uma análise estatística descritiva, o pesquisador adquire uma visão panorâmica do padrão de comportamento de suas variáveis e começa a ter um melhor entendimento do seu objeto de estudo.
A área Inferencial, por sua vez, permite ao pesquisador projetar resultados amostrais para populações, bem como testar hipóteses concernentes a parâmetros populacionais. Inferência estatística é o processo pelo qual estatísticos tiram conclusões acerca da população usando informação de uma amostra. A Estatística Inferencial está baseada em dois pilares fundamentais: a Amostragem e a Probabilidade.
Ao finalizar uma coleta de dados, o volume de informações obtidas exige uma organização e resumo para que possamos compreender os resultados e, principalmente, para que possamos identificar padrões de resposta. Sendo assim, surge a necessidade de formatar os resultados obtidos através da construção das tabelas de frequência e podemos dizer que neste momento os dados recebem o seu primeiro tratamento. Nessa etapa de análise, o pesquisador identifica as possíveis respostas a uma determinada variável e o comportamento das mesmas no que se refere a sua frequência.
A tabela de frequência tem por objetivo apresentar os resultados de cada variável de uma forma organizada e resumida. Nessa tabela encontramos o número de repetições de cada categoria de resposta de uma variável bem como o seu percentual no grupo investigado.
De acordo com as normas da ABNT (Associação Brasileira de Normas Técnicas) e do IBGE (Instituto Brasileiro de Geografia e Estatística) as tabelas de frequência devem considerar os seguintes elementos: título, cabeçalho, corpo da tabela, rodapé e fonte (Figura 1).
Considere uma pesquisa realizada com uma amostra de 20 dias do mês de dezembro, com o objetivo de investigar o valor da saca de soja (em reais). Os dados observados foram:
170 174 170 176 177 177 176 174 170 178
177 174 170 170 178 176 174 170 174 170
Para esses dados podemos destacar as seguintes informações:
Variável de pesquisa (x): valor da saca de soja (em reais)
Amostra investigada (n): 20 dias
Valores da variável que surgiram: correspondem aos valores da saca de soja observados. Nesse caso encontramos 170, 174, 176, 177 e 178 reais.
Frequência (f) de cada valor da variável: corresponde ao número de vezes que cada valor se repetiu.
Para o exemplo, podemos observar que 170 reais se repetiu em 7 dias:
Na sequência, 174 reais se repetiu em 5 dias:
Já 176 reais se repetiu em 3 dias:
Para 177 reais observamos uma ocorrência em 3 dias:
Por fim, para 178 reais observamos uma ocorrência em 2 dias:
Agora, organizamos essa informação através da estrutura de uma tabela de frequência, considerando todos os seus elementos:
De acordo com as normas, as tabelas de frequência não podem ser fechadas dos lados e nem ter linhas dividindo as categorias da variável. As únicas linhas permitidas são as que delimitam o cabeçalho e as que delimitam o total e no centro da tabela é opcional colocar ou não o traço divisório das colunas.
Ferramentas gráficas são geralmente utilizadas em vez de tabelas para descrever um conjunto de dados através de um "desenho". Um gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de reproduzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo (CRESPO, 2009).
A representação gráfica deve ser utilizada levando-se em conta algumas qualidades essenciais básicas para a construção deles, conforme nos mostra a Figura 2.
Em uma apresentação dos resultados de uma pesquisa ou, ainda, na divulgação de uma informação na mídia, podemos observar que algumas pessoas parecem não dar tanta atenção às informações estatísticas em forma de tabelas, porém elas podem aumentar a sua atenção e o seu interesse com as mesmas informações apresentadas em forma gráfica.
Vejamos agora alguns dos gráficos estatísticos mais utilizados.
O gráfico de setores, também conhecido como gráfico pizza, torta, queijo ou bolacha é um dos mais simples recursos gráficos. Sua construção é baseada no fato de que o círculo possui 360º, sendo que este círculo é dividido em fatias de acordo com o percentual em cada categoria. É um gráfico útil para representar variáveis nominais ou apresentadas em categorias de respostas.
É recomendável a utilização desse gráfico para representar variáveis qualitativas e que tenham poucas categorias de resposta distintas, pois para uma variável com muitas opções de resposta ele ficará visualmente “poluído”.
O gráfico de colunas é um dos gráficos mais utilizados para representar um conjunto de dados, sendo a representação de uma série de dados através de retângulos dispostos verticalmente. A altura desses retângulos é proporcional às suas respectivas frequências ou porcentagens. Esse gráfico pode ser utilizado para representar qualquer tipo de variável em qualquer nível de mensuração, por isso é um recurso extremamente utilizado em pesquisas.
O gráfico de colunas é um gráfico que não possui restrições, pode ser utilizado para representar variáveis qualitativas e quantitativas. Quando o número de categorias for muito extenso, podemos utilizar legendas com cores distintas para a identificação das categorias.
O gráfico de barras é uma representação de uma série de dados através de retângulos dispostos horizontalmente. O comprimento desses retângulos é proporcional às suas respectivas frequências. Esse gráfico é semelhante ao gráfico de colunas, contudo, a posição da escala e da frequência é trocada, ou seja, na linha horizontal temos a frequência ou percentual de casos observados e na linha vertical temos os valores ou as categorias da variável de estudo.
Figura 5: Exemplo de gráfico de barras.
O gráfico de barras é um gráfico que não possui restrições, pode ser utilizado para representar variáveis qualitativas e quantitativas. Quando o número de categorias for muito extenso podemos utilizar legendas com cores distintas para a identificação das categorias. É um excelente gráfico para os casos em que as categorias das variáveis são expressas através de frases ou palavras muito extensas.
Este gráfico utiliza-se de uma linha para representar uma série estatística. Seu principal objetivo é evidenciar a tendência ou a forma como o fenômeno está crescendo ou decrescendo através de um período de tempo. Seu traçado deve ser realizado considerando o eixo "x" (horizontal) a escala de tempo e o eixo "y" (vertical) a frequência observada dos valores.
O gráfico de linhas é o gráfico mais específico de todos, ou seja, sua utilização é limitada para situações em que a variável a ser representada for quantitativa, e os seus valores estão registrados ao longo de um período de tempo.
Existem ainda outros tipos de gráficos que podemos encontrar em exposições de resultados na área da Agronomia, porém os que foram aqui apresentados são os mais utilizados, sendo importantes ferramentas estatísticas que auxiliam na compreensão do objeto de estudo.
CRESPO, Antônio Arnot. Estatística fácil. 19.ed. atual. ed. São Paulo: Saraiva S.A. - Livreiros Editores, 2009
FONTELLES, Mauro José. Bioestatística aplicada à pesquisa experimental. São Paulo: Livraria da Física, v.1, 2012.
RAO, C. R. Statistics: a technology for the millennium Internal. J. Math. & Statist. Sci, v.8, n.1, 1999
SILVA, J.G.C. O ensino da estatística no Sistema Nacional de Pesquisa Agropecuária. In: Encontro Nacional de Métodos Quantitativos, III, Anais. Brasília, 20-22 junho, 1995. Acesso em: 27 dez. 2022. Disponível em: https://www.researchgate.net/publication/281974746_O_ensino_da_Estatistica_no_Sistema_Nacional_de_Pesquisa_Agro pecuaria#fullTextFileContent.
STORCK, Lindolfo; LOPES, Sidinei J. Experimentação ii. Santa Maria: UFSM, CCR, Departamento de Fitotecnia, v.205, 2004. Acesso em: 27 dez. 2022. Disponível em: https://www.researchgate.net/profile/Lindolfo-Storck/publication/283076647_Experimentacao_II/links/5628d83f08aef25a243d23a9/Experimentacao-II.pdf
Coordenação e Revisão Pedagógica: Claudiane Ramos Furtado
Design Instrucional: Gabriela Rossa
Diagramação: Marcelo Ferreira
Ilustrações: Rogério Lopes
Revisão ortográfica: Ane Arduim