AlyscI

Priscyla Patrício de França

Especialista pela Fundação Getúlio Vargas – FGV

Protótipo AlyscI

Resumo: o presente artigo tem por objetivo apresentar o protótipo de uma aplicação de inteligência artificial, computação cognitiva e aprendizagem de máquina, de baixo custo e implementação a curto prazo, à soluções de bibliotecas digitais, repositórios ou observatórios de informação, desde que, possuam Sistema de Recuperação da Informação – SRI.

Concepção

Os negócios que envolvem dados e informação estão, cada vez mais, sendo gerenciados por sistemas legados para concepção do Big Data e pela utilização de diversas arquiteturas da informação, de sistemas e hardware, dado o crescimento exponencial da informação. Tudo está conectado, as Tecnologias da Informação e da Comunicação (TIC’s), permitiram ampla democratização do acesso ao conhecimento. E isto a custo acessível.

A internet permite acesso às ferramentas importantes de ontologia e websemântica. Essa estratégia de sistemas legados está relacionada a um conceito antigo, a inteligência artificial. Portanto, um novo paradigma nasce para a Ciência da Informação, na linha de pesquisa SRI, que está relacionada à competência de ligar muitos dados em diversas interfaces e proporcionando o aprendizado da máquina – a computação cognitiva.

Os algoritmos que eram herméticos e tinham uma estrutura de banco de dados proprietários, nesta nova interface, aderem novas capacidades de aprendizagem, na medida em que enriquecem suas redes neurais, através de lógica Bayesiana, fuzzy e estatística diferencial, na recuperação de informações para os seus Big Data. E, evidentemente, estes novos sistemas cognitivos estão conectados pela WEB 2.0 e utilizam uma Websemântica.

Em 2018, será popularizada pelo ©Google uma aplicação de Assistente Pessoal Android que se conectará ao Wi-Fi das residências ou empresas e buscará de tudo na WEB. Outra ferramenta robusta é a nuvem que poderá abarcar customizações e integração para aplicações de SRI em repositórios, bibliotecas digitais e observatórios de informação.

Figura 1: Google Home

A computação cognitiva vem trazer um alívio para a gestão de informações. Hoje, existe um caos informacional. Não se pode manipular dados precisamente para apoiar a decisão sem lançar mão de ferramentas como Big Data ou inteligência artificial.

Este protótipo não é um sistema de inteligência artificial, e sim uma solução utilizando inteligência artificial existente para dinamização do uso de bibliotecas digitais, repositórios, observatórios de informações e até Big Data.

Camadas da aplicação

1a Camada - Dados

As soluções de tecnologia são suficientemente maduras para o gerenciamento de dados relativos a conteúdos; Existem padrões de metadados para diversos formatos: MARC 21, Dublin Core, FRBR, E-Arq etc. Bem como, interoperabilidade por meio de protocolos; Alguns repositórios como o DSPACE permitem modelagem de metadados, interoperabilidade e integração customizadas; Todas essas soluções contém um SRI desenvolvido.

2a Camada - Integração

Os observatórios de informação já estão ‘enfrentando’ as dificuldades de integração de dados; Fala-se de aplicações tais como ‘metabuscadores’; portanto mesmo que se deseje desenvolver repositórios com curadoria de dados, existem aplicações disponíveis e amplamente discutidas pela Ciência da Informação; Quando se diz aplicações de Big Data, ainda existe uma jornada de sedimentação epistemológica de manipulação de dados que são externos, algo sobre, novamente, curadoria de dados; Seria como, por exemplo, integrar uma medição meteorológica por meio de relatórios, a uma base de dados de pesquisa ou um observatório; Mas os metabuscadores e as integrações de bases de dados respondem parcialmente essa dificuldade.

3a Camada - Aprendizado

Aprendizado significa adquirir contexto semântico; as aplicações de inteligência artificial aprendem com a Websemântica porque os dados estão na WEB 2.0 ou em algoritmos com aplicações para WEB, tais como Java, PHP ou Python; Nessa camada, é interessante o desenvolvimento de um WIKI, tal como o TWIKI, por exemplo, que será o vocabulário semântico para o aprendizado da máquina; Quanto mais buscas forem feitas no metabuscador, mais palavras ‘não-autorizadas’ surgem; Basta criar um algoritmo para criação automática de WIKI para termos não recuperados na Base de Dados e, ainda, ‘importação’ de WIKI da WEB; Desta forma, o bibliotecário poderá ‘alimentar’ e enriquecer o WIKI com ontologias aos objetos de conhecimento disponíveis no repositório, biblioteca digital ou observatório de informação.

Figura 2: aprendizado semântico para inteligência artificial do Google

4a Camada - Interação

Nesta camada, a máquina precisará conversar com o usuário. A forma de apresentação semântica é o WIKI com os textos, links e ontologias preparados/revisados pelo bibliotecário; Outras interações entre o usuário e a máquina ficam por conta do ©Google assistente, configurando a prioridade de pesquisa ao metabuscador do repositório, biblioteca digital ou observatório de informação; Possivelmente com a utilização da nuvem; O assistente é importante para conversas eventuais que não poderiam ser ‘suportadas’ pelo WIKI, ou seja, jogar conversa fora, amenidades ou outros interesses.

Desenho conceitual

Figura 3: desenho conceitual

Parceria

Atualmente, a empresa Prima Informática, possui Now-How para integrar a base de dados do módulo WEB ao metabuscador do ©Google, elaboração de repositórios customizados e padrão de metadados RDA.

Bibliografia

DAVENPORT, T. Big Data. Harvard Business Review. Out. 2012.

GOTTSCHALG-DUQUE, C. [Tese de Doutorado] SiRILiCO: uma proposta para um Sistema de Recuperação de Informação baseado em teorias da linguística computacional e ontologia. Belo Horizonte: UFMG, 2005.

HASTIE, T.; TIBSHIRANI, R.; FRIEDMAN, J. The elements of statistical learning: data mining, inference, and prediction. 2nd. Stanford: springer, 2008. 764 p.

IBM: pense, conheça, explore, reflita, 2013. 44 p.

MAGGIONI, M.; MINSKER, S.; STRAWN, N. Multiscale dictionary learning: non-asymptotic bounds and robustness. Journal of Machine Learning Research 17 (2016) 1-51.

OPEN knowledge Brasil. Disponível em: https://br.okfn.org/

PYTHON Brasil. Disponível em: http://python.org.br/

SOUZA, R. R. A Web Semântica e suas contribuições para a ciência da informação. Ci. Inf., Brasília, v. 33, n. 1, p. 132-141, jan./abril 2004.

W3C Brasil. Disponível em: http://www.w3c.br/Padroes/WebSemantica.