Olá, aluno(a), espero que esteja tudo bem contigo. Nas lições que estudamos até este momento, falamos sobre arquivos, as capacidades de armazenamento e, algumas vezes, sobre troca de informações entre os dispositivos do computador. Nessa lição, compreenderemos melhor o que pode conter nestes arquivos quando são dados, informação e/ou conhecimento. O interessante é que esta categorização de evidências, apesar de mais próxima da área computacional, não são de exclusividade delas. Podemos dizer que são aplicadas amplamente no mundo dos negócios e, às vezes, sem ao menos perceber, em nosso dia a dia.
Para você ter uma noção da importância sobre a distinção e ao mesmo tempo integração sobre, dado, informação e conhecimento, imagine a seguinte situação. Ao ler a palavra dado, pode ser que uma imagem se forme em sua cabeça, com base em alguma experiência com este objeto. Algumas pessoas vão imaginar um objeto com seis lados, se estiverem pensando em uma versão tridimensional. Mas de que tamanho? Quais cores estão envolvidas? Qual o tipo de material (madeira, acrílico, metal, plástico, resina) de sua construção? Seria uma projeção mental estática ou em movimento? Que tipo de movimento? Apesar de ser uma palavra (dado) sem conexões com maiores detalhes, é como se fosse uma informação quantitativa, ou seja, numérica. E quando envolve números, as coisas ficam mais interessantes. Agora, imagine a palavra: cinco. Ou poderia ser, ainda, representada pelo numeral “5”. Cinco por si só não representa nada, ou que tudo que pode ser contado em nosso universo conhecido ocorrer, ou possuir a capacidade de existir nesta quantidade.
Você deve estar imaginando: se combinarmos dado e cinco, agora, conhecemos algo, temos uma informação. Afinal de contas, estamos afirmando que temos cinco dados. Não ainda. Olhando para as possibilidades, não houve ainda nenhuma afirmação ou evidência relatando tratar-se da quantidade de dados, ou de que estamos falando de um dado de cinco lados, ou de lançar o dado cinco vezes, ou de que o dado custa R$5,00, ou de 5 possibilidades de cores para o dado, ou de 5 materiais de construção. Enfim, não tem significado algum ainda.
Não vou me alongar para você perceber a relevância desses aspectos. Mas lhe provocarei mais um pouco. Já temos a evidência, ou seja, nada de subjetividade ou achismo, é o seguinte: dado e cinco. Quer ver como as coisas podem ficar mais interessantes? Vamos inserir no contexto a palavra: banco. Banco por si só se parece com a palavra dado? Até certo ponto, tamanho, cor, materiais empregados, quando falamos de um banco onde as pessoas se sentam. Mas se for de uma Instituição Financeira, onde abrimos uma conta, investimos dinheiro, pegamos empréstimos etc.?
E se juntarmos dado, cinco e banco, saímos totalmente do tangível para o intangível, ou seja, de algo material, sólido para algo abstrato, que existe apenas como algo lógico. Nesse sentido, estamos falando, então, de um banco de dados? Cinco banco de dados? Um banco de dados com cinco tabelas? Ou um banco de dados com suporte a cinco usuários? Um banco de dados com cinco GB?
Saber como organizar as evidências para que elas sejam úteis, seja atualmente ou no seu futuro, de forma a confirmar algo que já vem fazendo ou ainda mudar sua concepção e assim mudar como faz as coisas, é algo extremamente importante. Por isso, relembraremos, brevemente, de uma situação em que foi retratado: Diariamente, em um sítio ou fazenda, é introduzido, por meio de código de barras, ou digitando, ou recebendo informações de uma balança de peso que se conecta com o computador, o quanto de alimento foi disponibilizado para algum tipo de animal.
Se pensarmos, agora, na organização desse relato para que ele gere algo que faça sentido, a primeira coisa que precisa ser efetuada é a organização das evidências coletadas.
Uma das dimensões muito apreciadas pela humanidade é o tempo. A nossa vida e a das coisas que nos envolvem parecem ocorrer em ciclos temporais, por exemplo:
Fases da vida humana: infância, adolescência, fase adulta e velhice.
Estações do ano: verão, outono, inverno e primavera.
Safras: milho, soja, algodão, cana, café.
Lucro ou prejuízo do empreendimento: no mês, trimestre, semestre, ano etc.
Educação: Educação Infantil, Ensino Fundamental 1 e Ensino Fundamental 2, Universidade, Mestrado, Doutorado.
Atualmente, com a expansão das capacidades computacionais e de armazenamento de arquivos, quanto menor o intervalo de tempo em se medir algo, mais rapidamente podemos observar mudanças naquilo que estamos monitorando. E, neste exemplo, foi dito: “Diariamente, em um sítio ou fazenda...”, ou seja, todos os dias. Se formos pensar na organização das evidências coletadas, uma das que teremos que registrar é a data (dia, mês e ano), e essa evidência, ou registro, sozinha não tem mais importância do que um calendário. Mas, em cada data, podemos registrar várias outras coisas. Peso dos animais e a fonte da informação: código de barras, ou digitando, ou recebendo informações de uma balança de peso. Então, podemos dizer que iniciamos uma cadeia de evidências.
<data; tipo de entrada; peso>
Depois, conforme descrito sobre o sítio ou a fazenda, mais evidências: “de quais e quantos animais se alimentaram, o peso dos animais, o valor pago no alimento, o intervalo de tempo, a composição nutricional entre outros”. Então, esta cadeia de evidências começa a ficar maior.
<data, tipo de entrada, peso, quantidade, valor do alimento, composição nutricional>
E se for mais de um tipo de animal? Podemos ter mais de um registro por data? Certamente. E veja que isso não foi mencionado, ou seja, não foi percebido como uma possibilidade do mundo real onde se poderia coletar evidências para, futuramente, ser gerada uma informação que resultaria em alguma decisão humana. Podemos dizer que houve uma falha inicial em não se pensar nisso.
Nosso objetivo, neste momento, não é de lhe ensinar a definir parâmetros de um banco de dados para receber informações, mas de mostrar-lhe como um dado quando consistente pode gerar informações e produzir conhecimento com base em evidências sólidas. Então, vamos entender primeiro cada um destes conceitos.
Está na hora de sabermos um pouco mais sobre dado, informação e conhecimento, passando por um termo que utilizei também, evidência.
Mensah e Goderre (2014) definem "dados" como fatos brutos, estatísticas, números livres de contexto. Dammann (2019) sugere que os dados são símbolos recuperados, coletados ou simulados: números resultantes de medições ou mineração de texto, imagens, gravações de som, resultados de pesquisas, simulações e assim por diante. Os dados são entendidos de forma diferente em vários setores. Em sua forma básica, os dados são um conjunto de diferentes símbolos e caracteres cujo significado só fica claro quando se conectam com o contexto. Coletar e medir observações geram dados. Normalmente, as máquinas enviam, recebem e processam dados. Lembra do dado, cinco e banco? Quando separados, sem contexto, não têm contexto, relações, por isso, em relação à lógica, e não apenas computacional, mas de registro, são dados.
Cabe lembrar que a maioria dos dados não são apenas números, por isso, eles podem ser categorizados:
Quantitativamente: representam estritamente números. Sem relação se é algum tipo de moeda, idade, peso, Gigabytes etc.
Qualitativamente: representam o que é subjetivo, ou seja, não mostra números concretos. Pode mostrar Cores, (azul, verde, amarelo, vermelho), dimensões (alto, médio baixo, metros, quilômetros), condição (novo, semi-novo, usado, velho, depreciado etc.
Importante!
Essa característica dos dados: isolada, sem contexto, algo recuperado, registrado etc., pode dar a impressão de que é algo não tão importante. No entanto, é o mais importante para o que virá, suas relações comparações, processamento e tomada de decisão com base em informações e conhecimento. Dado registrado errado, incorretamente, com ruído = informação errada = decisão errada. Fica a dica!
Segundo Mensah e Goderre (2014), informação é a coleta, agregação, análise e apresentação de dados que proporcionam compreensão. Para Dammann (2019) embora esta definição descreva como chegamos à informação, ou seja, com base em dados, ela não nos diz o que é informação. Podemos afirmar que informação é um dado no contexto.
Informação são dados que foram processados, ou de forma mais simples, relacionados a um contexto para que fique claro do que se trata. Uma vez coletados e contextualizados, os dados são informações.
Estamos falando, aqui, de informação, que pode, ou não, servir para decisões. Por exemplo:
a)
Dado: data, exemplo: 15/05/2012
Contexto: Nascimento
Informação: Data de nascimento 15/05/2012
b)
Dado: data, exemplo: 15/05/2012
Contexto: Falecimento
Informação: Data de falecimento 15/05/2012
c)
Dado: data, exemplo: 15/05/2012
Contexto: Vacina sarampo
Informação: Data da vacina contra o sarampo 15/05/2012
Veja que estamos exemplificando uma forma bem básica de contextualização e, logicamente, uma informação bem básica não tendo muita utilidade para alguma ação, sem relacionar mais contextos, por exemplo:
Nome
RG
CPF
Gênero
Nacionalidade
Estado Civil
Escolaridade
Profissão
Endereço (estado, cidade, rua, nº CEP) etc.
Perceba que quanto mais contextos podemos ligar entre os dados, mais possibilidades de relações, processamentos e geração de informações podemos ter. Isso, consequentemente, nos leva a ter informações mais precisas e mais relevantes. E esta precisão e relevância nos leva a ter mais segurança, ou mais possibilidades para tomar alguma decisão.
Segundo Dammann (2019), evidência é informação comparada, que tem a ver com a verdade de uma proposição comparada a um padrão. De acordo com esta definição, a informação torna-se evidência apenas se ela estiver relacionada à verdade ou à falsidade da proposição. Proposição é uma proposta, que pode ser, ou não, verdade. Se comparada e for genuína, a evidência proposta é verdadeira. Se for infundada, a proposta retorna com uma evidência falsa.
Exemplo:
O céu, em dias sem nuvens, é azul. Comparada com aqui já sabido e considerado, universalmente, aceito, é uma proposição verdadeira. Se afirmarmos que ele é roxo, a posição seria falsa. Logo, teríamos uma evidência verdadeira em relação ao céu azul e outra falsa em relação ao céu roxo.
De acordo com Dammann (2019), enquanto um registro, isoladamente, quantitativo ou qualitativo, é armazenado, ele é considerado um dado. Esse dado, quando relacionado a um contexto, gera informações. Essas informações a partir da relação e processamento de dados, podem ser mais ou menos complexas. E a partir das informações, pode-se gerar evidências, que podem ser verdadeiras ou falsas. Ou ainda nem branco nem preto, mas cinza, podem sugerir uma tendência sobre algum fenômeno estudado. Não precisam de algo do tipo sim, ou não. E com base nessas evidências é que o conhecimento é gerado. O conhecimento gera no ser humano uma ou várias crenças.
Entre tais elementos, é possível perceber que o conhecimento é algo mais complexo, relaciona várias informações, cadeias temporais de aprendizado e por tais características, são mais difíceis de serem categorizadas e armazenadas.
Voltando ao exemplo do sítio ou da fazenda, é introduzido, por meio de código de barras, ou digitando, ou recebendo informações de uma balança de peso que se conecta com o computador o quanto de alimento foi disponibilizado para algum tipo de animal. Ou seja, vários registros isolados são efetuados no computador. Sem relacionamento, são considerados dados. Também é introduzido no computador, e essa inserção pode ocorrer de muitas formas, digitando, importando os dados, por meio de uma rotina em que o computador acessa uma rede ou outro local/pasta/arquivo do próprio computador, mais dados, como: de quais e quantos animais se alimentaram, o peso dos animais, o valor pago no alimento, o intervalo de tempo, a composição nutricional entre outros. Ou seja, mais dados que, também de forma isolada, não fazem muito sentido.
Quando iniciamos o relacionamento, em certa data, certos animais consumiram uma certa quantidade de alimentos, já temos uma informação e, ao efetuarmos mais relacionamentos, como o valor pago nos alimentos, marca do alimento, sua composição nutricional, o quanto de peso os animais ganharam em certo intervalo de tempo e comparar com outros tipos de animais, temos evidências que gerarão conhecimento.
Por meio de relatórios, ou seja, as saídas de dados, que agora viraram informações, fazer comparações com outros tipos de alimentos com composição nutricional diferente, ou variedade de animais para gerar evidências e, assim, determinar qual o conjunto entre alimentação e produção são mais eficientes e gerar o melhor resultado econômico para o empreendimento. Logo, temos a geração de conhecimento.
Olha que bacana, agora, quando for pensar em gerar algum conhecimento e, certamente, independentemente da área, isso passará por um computador, você já sabe como gerar conhecimento para tomada de decisões e ainda tomar o cuidado de construir uma estrutura que possibilite isso de forma confiável.
DAMMANN, O. Data, Information, Evidence, and Knowledge: A Proposal for Health Informatics and Data Science. J Public Health Inform., v. 10, n. 3, p. 24, 5 mar. 2019.
MENSAH, E.; GODERRE, J. L. Data sources and data tools. In: MAGNUSON, J. A.; FU, P. C. (ed.). Public health informatics and information systems. London: Springer, 2014.