A Gestão do Conhecimento é considerada como um processo que envolve a geração, coleta, assimilação e aproveitamento do conhecimento, para a criação de estratégica de negocio e aumentar a inteligência competitiva.
Murray define como uma estratégia que tem a capacidade de transformar os bens intelectuais da organização, informações registradas e o talento dos seus membros, em maior produtividade, novos valores e aumento de competitividade. Na gestão do conhecimento o cerne é o conhecimento.
Sabe-se que os conjuntos de dados geram informações e os conjuntos de informações geram conhecimentos, estes dados podem ser advindos de dados estruturados (Exemplos: Banco de Dados e Data Warehouse) e não estruturado (Exemplo: Redes Sociais). Na literatura o conhecimento é classificado como tácito e explícito (NONAKA e TAKEUCHI).
O conhecimento tácito é mais complexo, oriundo da experiência pessoal é interiorizado pelo seu conhecedor já o conhecimento explicito é teorizado, abstrato e baseado na racionalidade. Ambas são unidades estruturais básicas que se complementam, sendo a interação entre as duas que ocorre a dinâmica na criação do conhecimento.
A figura 1 ilustra os processos da gestão do conhecimento, na fase de criação e aquisição, nexte contexto além do conhecimento criado existe a possibilidade de inserção de dados brutos, que possibilita a descoberta de conhecimento em banco de dados, na sequencia o conhecimento é organizado, armazenado e distribuído, permitindo logo em seguinda a sua aplicação que perminte uma retro-alimentação na aquisição e criação de conhecimento, que podem interferir nas etapas da descoberta de conhecimento em Banco de dados.
Figura 1 – Processo de gestão do conhecimento – Fonte: Adaptado – (BARTHÈS, 1998)
Atualmente o aumento no volume de dados analisados ultrapassou a barreira dos processos internos transacionais das empresas, o interesse também esta nos dados advindos das atividades online (redes sociais), telecomunicação (tecnologia móvel) e cientificas (simuladores, sensores e experimentos).
Neste contexto O KDD se torna uma importante área estratégica no mundo dos negócios, governo, organizações e instituições de pesquisas, no entanto é necessário que a organização aplique práticas tecnológicas para o gerenciamento e analise dos dados.
KDD foi formalizado em 1989 para atender os processos referentes à busca de conhecimento a partir de bases de dados. Uma das definições mais populares foi proposta em 1996 por um grupo de pesquisadores:
"KDD é um processo, de várias etapas, não trivial, interativo e iterativo, para identificação de padrões compreensíveis, válidos, novos e potencialmente úteis a partir de grandes conjuntos de dados"
Interativo indica a atuação do Homem para a realização dos processos, sendo ele o responsável por utilizar as ferramentas computacionais para análise e interpretação dos dados.
Para obter um resultado satisfatório, é necessário muitas vezes repetir o processo de forma integral ou parcial, ou seja, o processo é iterativo, porém, o fato do processo ser repetitivo não o torna automático, pois exige a necessidade da interferência humana que engloba a psicologia cognitiva e sistemas de memorização, analise e aprendizado.
A descoberta de conhecimento em base de dados é o processo de extração de conhecimento por meio da manipulação de dados. Seguem as etapas para KDD:
1. Pré-processamento:
Atividades que visam gerar uma representação conveniente para os algoritmos de mineração, a partir da base de dados. Inclui a seleção (automática e/ou manual de atributos relevantes), amostragem, transformações de representação, etc.
Esta etapa possui fundamental relevância no processo KKD, e apresenta as seguintes funcionalidades para esta etapa: seleção de dados, limpeza dos dados, codificação dos dados, normalização dos dados, construção de novos atributos e correção de prevalência.
2. Mineração de dados (MD):
Aplicação de algoritmos de mineração aos dados pré-processados, ou seja, busca efetiva por conhecimentos úteis a partir dos dados.
Conforme já citado a mineração de dados pode ser considerada como uma parte do processo de KDD, esta é a principal etapa.
Estima-se que a MD represente de 15% a 25% do processo de KDD. Nessa etapa que compreende a aplicação de algoritmo para extrair e ser capaz de identificar padrões, estruturas, tendências e revelar novidades que sejam úteis e de interesse do usuário, vários métodos podem ser usados em função da natureza dos dados e das informações que se desejam alcançar.
Mineração de dados também pode ser definida como a descoberta de informações úteis a partir de um conjunto de dados. Para a obtenção dessas informações, é necessária a utilização de técnicas e tarefas de busca por relacionamentos e padrões existentes entre os dados .
3. Pós-processamento:
Seleção e ordenação das descobertas interessantes, mapeamentos de representação de conhecimento e geração de relatórios. É nesta etapa que o especialista em KDD e o especialista no domínio de aplicação avaliam os resultados obtidos e criam novas alternativas para novas investigações de dados.
O KDD tem várias etapas que não são triviais, estas etapas que são do tipo iterativas e interativas para identificação de padrões. Neste caso é interessante ressaltar que cada etapa tem suas particularidades e complexidades que envolvem ferramentas tecnológicas, a Figura 2 ilustra bem a interdisciplinaridade existente no processo KDD (ciência da computação, estatísticas, visualização e o domínio da área ) e as etapas de pré-processamento (dados), mineração de dados (ferramentas de análise) e pós-processamento (entendimento do domínio).
Figura 2 – Elementos do processo de descoberta de conhecimento
(BEGOLI e HOREY, 2012).
A presença humana na escolha e combinação das opções de cada etapa do processo KDD é essencial devido, principalmente, a sua intuição, e experiência anterior e conhecimentos para analisar, interpretar, direcionar e combinar estratégias a serem realizadas. O especialista no domínio de aplicação é um dos principais componentes necessários para melhor compreensão do processo KDD. Os fatores humanos são necessários a cada etapa do processo KDD.
Eles são classificados como: (1) especialista em mineração de dados, em KDD, (2) no domínio da aplicação e (3) usuários finais (engenheiros, gerentes, administradores, etc.). Obviamente a existência de profissionais diferentes nestes estágios exige demandas diferentes e trazem pré-requisitos diferentes.
Geralmente, os usuários finais não têm capacidade de efetuar uma análise complexa nos dados, mas natural mente eles têm um grande conhecimento do domínio da aplicação. De forma geral, é o ser humano que executa a difícil tarefa de orientar e executar o processo KDD, conforme ilustrado na Figura 3.
Figura 3 - Ser humano como elemento central do processo de KDD.
Fonte: Adaptado de (GOLDSCHMIDT; PASSOS, 2005, p. 22).
O especialista em KDD é uma pessoa ou um grupo de pessoas experientes para direcionar a execução do processo, que define o que, como e quando deve ser realizada cada ação. O especialista em KDD interage com o especialista no domínio de aplicação.
Mesmo que o processo KDD seja automatizado, o fator humano é essencial para o sucesso de sua realização, porque é ele que tem a compreensão do domínio dos dados (natureza, forma econteúdo), sendo pré-requisito indispensável na abstração de qualquer conhecimento útil. Na etapa de pré-processamento, por exemplo, é necessário o conhecimento sobre o domínioda aplicação e domínio de dados para facilitar a organização, limpeza e seleção do conjunto de dados.
http://www.revistaespacios.com/a16v37n12/16371210.html
Emerson RABELO; Fernando Celso CAMPOS