INTRODUÇÃO À BIOESTATÍSTICA
Prof. Simone Echeveste
Prof. Simone Echeveste
Os principais conceitos da Estatística/Bioestatística;
Como construir tabelas de frequências;
Quais são os tipos de gráficos estatísticos mais importantes.
A Estatística hoje se configura como uma das ciências que mais vem crescendo em termos de utilização e importância. Diariamente, somos “soterrados” por informações estatísticas: são estatísticas da saúde, estatísticas da segurança, estatísticas da educação etc., não há como qualquer cidadão fugir de tanta informação.
A quantidade enorme de dados é o que caracteriza o mundo atual, cada vez mais necessitamos de informações, e saber como obtê-las e como entendê-las é fundamental para qualquer indivíduo, pois ele deve ser capaz de fazer uma análise crítica dos dados possibilitando uma tomada de decisões mais consciente.
Atualmente, a estatística é entendida como uma ciência que estuda e pesquisa sobre: o levantamento de dados com a máxima quantidade de informação possível para um dado custo; o processamento de dados para a quantificação de incertezas; e tomada de decisões sob condições incertas, utilizando o menor risco possível. Tem tem sido utilizada para a pesquisa científica, para otimização de recursos econômicos, para a melhoria na qualidade de vida, melhoria da produtividade, otimização de tomada e análise de decisões e para previsões nas mais diversas áreas de conhecimento.
A relevância e as justificativas para o estudo da estatística são inúmeras: desenvolver a competência estatística se refere ao conhecimento básico do raciocínio e do propósito da estatística. Um cidadão "estatisticamente competente" seria aquele que possui a habilidade para interagir como uma pessoa "educada" na atual era da informação.
Esta competência estatística pode também ser definida como a habilidade para compreender e avaliar criticamente resultados estatísticos que permeiam nossas vidas diárias – junto à habilidade para reconhecer a contribuição que o pensamento estatístico pode trazer para as decisões públicas e privadas, profissionais e pessoais.
Neste capítulo, iremos conhecer as diversas utilidades das ferramentas estatísticas na área da saúde. Por se tratarem de aplicações no campo da Biologia, o termo Estatística ganha aqui a denominação de Bioestatística.
Para avaliar resultados de pesquisas na área da saúde disponibilizados em artigos e livros;
Para aplicar os resultados dos estudos e os conhecimentos adquiridos na tomada de decisão referente aos cuidados de pacientes;
Para a compreensão de problemas epidemiológicos;
Para interpretar informações sobre drogas e equipamentos;
Para o bom uso de ferramentas de diagnóstico na tomada de decisão;
Para ficar informado;
Para participar ou coordenar estudos na área da saúde.
Estimulada pelos desafios das ciências da saúde, a estatística respondeu tão vigorosamente que uma nova disciplina, a Bioestatística, emergiu em seu meio, organizando um referencial teórico próprio e gerando uma grande variedade de conceitos, métodos e técnicas de análise. (PAES,1998)
Bioestatística é o estudo aplicado da Estatística na área da Biologia. Compreende o planejamento, a coleta, a avaliação e a análise de todos os dados obtidos nas pesquisas.
Sendo assim, a Estatística/Bioestatística auxilia na resposta às hipóteses, participa na construção de um projeto de pesquisa na determinação da amostra a ser investigada, ajuda no controle da qualidade dos resultados que se almeja obter e transforma grandes volumes de dados em informação, esta última, de suma importância no processo de tomada de decisão de qualquer área do conhecimento.
Na área da saúde suas aplicações são inúmeras. O desenvolvimento de estudos que possibilitem a criação de novos remédios e a compreensão de doenças crônicas, como a AIDS e o câncer, são alguns exemplos de situações em que os conhecimentos sobre as ferramentas estatísticas tornam-se indispensáveis em uma pesquisa. Na área da saúde pública, sua presença é constante em estudos epidemiológicos, saúde ambiental, nutrição e saneamento, genética populacional, medicina, ecologia e bioensaios.
Existe um consenso por parte dos estudiosos de várias áreas de que há uma grande demanda na sociedade atual por um cidadão que compreenda estatística, que seja capaz de consumir e pensar criticamente sobre as informações diárias que recebe, exercendo boas decisões baseadas nessas informações.
Nesse contexto, o estudo de estatística merece atenção devido à relevância para a sociedade contemporânea de atividades de coletar, representar e processar dados. Esse fato pode ser considerado como uma consequência do crescimento do uso de métodos estatísticos na realização de predições.
Sempre que falamos em Estatística, estamos inseridos no contexto de uma pesquisa. As pesquisas podem ser classificadas em duas grandes abordagens: qualitativa e quantitativa. Ferramentas estatística de análise de dados são pertinentes em pesquisas quantitativas.
Proetti (2018) define:
a pesquisa qualitativa não visa à quantificação, mas sim ao direcionamento para o desenvolvimento de estudos que buscam respostas que permitem a compreensão, descrição e interpretação de fatos. Já a pesquisa quantitativa possui variáveis previamente definidas pelo investigador, tem por objetivo mensurar eventos de forma objetiva e precisa.
Na pesquisa quantitativa, a análise dos resultados obtidos com ela tem como suporte as ferramentas estatísticas.
Uma pesquisa é composta por quatro etapas distintas (Figura 3). Em suas três últimas etapas (planejamento, execução e análise dos resultados), a estatística surge como uma importante ferramenta de suporte para o pesquisador.
Na etapa Planejamento da pesquisa, a estatística tem importante participação na determinação do tamanho da amostra a ser estudada, na escolha do procedimento/processo de amostragem que deve ser utilizado para a coleta de dados, bem como na elaboração do instrumento de coleta e no estabelecimento do tipo de variáveis a serem pesquisadas.
No momento da Execução da pesquisa, a estatística é imprescindível, pois fornece as ferramentas necessárias para a análise dos dados e para a obtenção de conclusões sobre o objeto de estudo.
Na Análise dos resultados, a estatística, através de suas ferramentas, auxilia na testagem das hipóteses, na comparação, associação e correlação entre as variáveis do estudo. Para a comunicação dos resultados, dispõe ainda de tabelas e gráficos que facilitam a apresentação e discussão dos principais resultados obtidos.
Todas essas etapas são importantes de serem realizadas e fazem parte da elaboração de uma pesquisa científica que procure ser a mais fidedigna possível. O conhecimento dessas etapas também é importante para o julgamento da adequação de pesquisas realizadas por terceiros, ou seja, quando resultados de uma pesquisa nos são apresentado oralmente ou através de artigos, precisamos ter um conhecimento mínimo do processo científico para que sejamos capazes de criticar e entender os resultados obtidos.
A importância da estatística na evolução do conhecimento nas mais diferentes áreas científicas pode ser ressaltado considerando os seguintes aspectos:
Na condução de uma pesquisa, são delineados estudos experimentais ou observacionais, que resultam em uma série de dados numéricos que necessitam de organização e análise para se transformarem em INFORMAÇÃO que possa ser utilizada na TOMADA DE DECISÃO;
O padrão de VARIAÇÃO nos dados obtidos faz com que as respostas das variáveis investigadas não seja previsível ou óbvia;
Para a comprovação ou não das hipóteses estabelecidas, é necessária a ocorrência de evidências nos dados obtidos, a variação contida nas respostas deve ser considerada na discussão e conclusão dos estudos - a SUBJETIVIDADE aqui não pode estar presente. Todos os achados devem ser considerados “à luz dos dados”, ou seja, devem ser estatisticamente VALIDADOS considerando questões como, por exemplo: tamanho da amostra, margem de erro e variabilidade.
A Estatística pode ser dividida em duas áreas: Descritiva e Inferencial. A área descritiva é mais simples, contemplando ferramentas de organização de dados e síntese de informação. A área Inferencial, por sua vez, permite ao pesquisador projetar resultados amostrais para populações, bem como testar hipóteses concernentes a parâmetros populacionais. Inferência estatística é o processo pelo qual estatísticos tiram conclusões acerca da população usando informação de uma amostra. A Estatística Inferencial está baseada em dois pilares fundamentais: a Amostragem e a Probabilidade.
Uma análise estatística, em seus primeiros passos, deve sempre iniciar utilizando-se as ferramentas descritivas - que serão os primeiros resultados obtidos pelo pesquisador. Com isso, ele poderá ter uma visão mais “abrangente” de suas variáveis investigadas, bem como poderá realizar um “controle de qualidade” dos dados obtidos, uma vez que erros podem aqui ser identificados (erro de digitação no banco de dados, inconsistências nas respostas etc.).
Uma POPULAÇÃO é o conjunto de elementos de interesse em um determinado estudo, que podem ser pessoas ou resultados experimentais, com uma ou mais características comuns.
Uma AMOSTRA é um subconjunto da população, usada para obter informação acerca do todo. Obtemos uma amostra para fazer inferências de uma população, no entanto, as inferências só são válidas quando a amostra representa a população.
Uma variável é uma característica de uma população que difere de um indivíduo para o outro e do qual temos interesse em estudar. Cada unidade (membro) da população que é escolhido como parte de uma amostra fornece uma medida de uma ou mais variáveis, chamadas observações.
As variáveis podem ser classificadas como quantitativas e qualitativas.
São aquelas que podem ser medidas em uma escala quantitativa, ou seja, apresentam valores numéricos/quantidades. Podem ser contínuas ou discretas.
São aquelas que não possuem valores quantitativos, mas, ao contrário, são definidas por várias categorias, ou seja, representam uma classificação dos indivíduos. Podem ser nominais ou ordinais.
Exemplo:
Uma pesquisa foi realizada com um grupo selecionado de 30 pacientes de uma clínica de reabilitação para usuários de drogas. O objetivo do estudo foi traçar o perfil dos pacientes em relação à idade, escolaridade, estado civil e número de reinternações.
A partir dessas informações, podemos destacar:
População alvo: todos os pacientes internados na clínica de reabilitação.
Amostra: 30 pacientes selecionados dessa clínica.
Variáveis de estudo:
Idade: quantitativa contínua.
Escolaridade: qualitativa ordinal.
Estado Civil: qualitativa nominal.
Número de reinternações: quantitativa discreta.
Tabelas de frequência e gráficos estatísticos são encontrados em jornais, relatórios técnicos, monografias, dissertações, teses e revistas científicas. As tabelas de frequência simples apresentam de forma concisa o número de ocorrências (absoluta e relativa) dos valores de uma variável.
A tabela de frequência é uma forma de representação de frequência de cada valor distinto da variável. Elas resumem a informação contida na amostra, ordenando os seus valores e agrupando-os em classes de valores repetidos ou valores distribuídos por intervalos.
As distribuições de frequências têm por objetivo apresentar os resultados de cada variável de uma forma organizada e resumida. Nessa tabela, encontramos o número de repetições de cada categoria de resposta de uma variável bem como o seu percentual no grupo investigado. Esta forma de apresentação é muito utilizada e extremamente útil ao pesquisador, uma vez que apresenta de forma RESUMIDA, ORGANIZADA os resultados de uma variável.
De acordo com as normas da ABNT (Associação Brasileira de Normas Técnicas) e do IBGE (Instituto Brasileiro de Geografia e Estatística), as tabelas de frequência devem considerar os seguintes elementos:
Título: deve conter as informações necessárias para que se compreenda “o que” está sendo apresentado na tabela, “onde” os dados foram obtidos e “quando” esses dados foram coletados.
Cabeçalho: indica a natureza do conteúdo de cada coluna da tabela.
Corpo da Tabela: é a parte composta por linhas e colunas com as informações observadas.
Rodapé: espaço logo abaixo da tabela que pode ser utilizado para a apresentação de notas ou observações de natureza informativa.
Fonte: refere-se à entidade que organizou ou forneceu os dados apresentados na tabela.
A utilização de gráficos como forma de apresentação de dados pode ser justificada através do ditado popular "uma imagem vale mais que 1000 palavras", que poderíamos adaptar para: “uma imagem vale mais do que 1000 números”.
Técnicas gráficas são geralmente utilizadas, em vez de tabelas, para descrever um conjunto de dados através de um "desenho". Um gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de reproduzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo. (CRESPO, 1996).
A representação gráfica deve ser utilizada levando-se em conta algumas qualidades essenciais básicas para sua construção:
Simplicidade: as informações contidas em um gráfico devem ser diretas e detalhes secundários devem ser omitidos. Às vezes, na construção de um gráfico, o ideal é a forma mais simples e direta de apresentação;
Clareza: as informações devem ser claras, possibilitando uma interpretação correta sem dúvidas sobre os resultados;
Veracidade: o gráfico deve expressar a verdade sobre os dados estudados.
De acordo com Levin (1987), enquanto algumas pessoas parecem "desligar-se" ao serem expostas a informações estatísticas em forma de tabelas, elas também podem prestar bastante atenção às mesmas informações apresentadas em forma gráfica. Esse fato justifica a grande utilização por parte dos pesquisadores e da mídia escrita e impressa dos gráficos em substituição das tabelas.
Vejamos agora os principais gráficos estatísticos:
O gráfico de colunas é um dos gráficos mais utilizados para representar um conjunto de dados, sendo a representação de uma série de dados através de retângulos dispostos verticalmente. A altura desses retângulos é proporcional às suas respectivas frequências. Esse gráfico pode ser utilizado para representar qualquer tipo de variável em qualquer nível de mensuração e, por isso, é um recurso extremamente utilizado em pesquisas.
O gráfico de barras é uma representação de uma série de dados através de retângulos dispostos horizontalmente. Os comprimentos dos retângulos são proporcionais às suas respectivas frequências. Esse gráfico é semelhante ao gráfico de colunas, contudo, a posição da escala e da frequência é trocada, ou seja, na linha horizontal temos a frequência de casos observados e na linha vertical temos a variável de estudo.
Este gráfico utiliza-se de uma linha para representar uma série estatística. Seu principal objetivo é evidenciar a tendência ou a forma como o fenômeno está crescendo ou decrescendo através de um período de tempo. Seu traçado deve ser realizado considerando o eixo "x" (horizontal) a escala de tempo, e o eixo "y" (vertical) frequência observada dos valores.
O gráfico de linhas deve ser utilizado exclusivamente para representar variáveis QUANTITATIVAS que estão sendo acompanhadas ao longo de um PERÍODO DE TEMPO.
O gráfico de setores, também conhecido como gráfico pizza, torta, queijo ou bolacha é um dos mais simples recursos gráficos. Sua construção é baseada no fato de que o círculo possui 360º, sendo que esse círculo é dividido em fatias de acordo com o percentual em cada categoria. É um gráfico útil para representar variáveis nominais ou apresentadas em categorias de respostas.
O gráfico de setores deve ser utilizado preferencialmente para representar variáveis QUALITATIVAS que apresentam poucas categorias de resposta distintas.
CRESPO, Antônio Arnot. Estatística fácil. 13. ed. São Paulo: Saraiva, 1995.
LEVIN, J. Estatística aplicada a ciências humanas. 2. ed. São Paulo: Harbra, 1987.
PAES, Ângela Tavares. Itens essenciais em bioestatística. Arq. Bras. Cardiol., São Paulo , v. 71, n. 4, p. 575-580, Oct. 1998 . Disponível em: <http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0066-782X1998001000003&lng=en&nrm=iso>. Acesso 29 fev. 2020.
PROETTI, Sidney. As pesquisas qualitativa e quantitativa como métodos de investigação científica: um estudo comparativo e objetivo. Revista Lumen-ISSN: 2447-8717, v. 2, n. 4, 2018. Disponível em <http://www.periodicos.unifai.edu.br/index.php/lumen/article/view/60> Acesso 29 fev. 2020.
Coordenação e Revisão Pedagógica: Claudiane Ramos Furtado
Design Instrucional: Luiz Specht
Diagramação: Marcelo Ferreira
Ilustrações: Marcelo Germano
Revisão ortográfica: Ane Arduim