A web semântica


A web semântica é uma nova forma de tecnologia para fazer a web entender os significados dos documentos, ficando assim mais inteligente. A WEB semântica parece um conceito complexo ainda, e pretende relacionar bases de dados e documentos, da mesma maneira que os documentos são "linkados" na rede.

http://www.webart.com.br/artnamic/conv/12c492580e.jpg






















web semântica

A Web Semântica é nada mais nada menos, que uma web com toda sua informação organizada de forma que não somente seres humanos possam entendê-la, mas principalmente máquinas. Disse principalmente máquinas, porque elas nos ajudarão, de fato, em tarefas que hoje, invariávelmente temos que fazer manualmente.
A web semântica
traz tecnologias que permitem o cruzamento dessas informações com facilidade, independentemente do tipo de programa em que elas estejam guardadas. Um exemplo: vamos supor que um cientista esteja trabalhando no desenvolvimento de uma nova droga. Ele sabe que efeitos a substância provoca no corpo. Outro entende por que isso acontece. Muitos outros técnicos podem ter informações sobre o que ocorreu no passado, quando se tentou usar esse mesmo medicamento. Mas nenhum deles, e principalmente nenhum programa ou aplicação, é capaz de reunir e cruzar todas essas informações. A web semântica pode conectá-los e reunir esses dados. No mundo da medicina, já estamos fazendo algumas experiências com a web semântica, reunindo um vasto volume de informações. E muitos programas poderão surgir para aproveitar esse tipo de base de dados, não só serviços de busca ou navegadores.

http://semanticwiki-en.saltlux.com/images/c/c5/Semantic_technology_02_1_1.jpg

A Web Semântica é uma evolução da nossa web atual.
Com as informações devidamente organizadas, fica fácil de criar sistemas e robôs de busca mais inteligentes e ágeis.
A nossa web de hoje, é uma web que apenas humanos entendem as informações disponíveis. Com a Web Semântica, as máquinas compreenderão essas informações e assim, poderão nos auxiliar em tarefas corriqueiras, que antes eram feitas manualmente.
Atualmente é extremamente complexo fazer um sistema que leia e entenda de maneira sensata qualquer informação que a web provê.

A Web Semântica incorpora significado às informações da web. Isso proporciona um ambiente onde máquinas e usuários trabalhem em conjunto. Tendo cada tipo de informação devidamente identificada, fica fácil para os sistemas encontrarem informações mais precisas sobre um determinado assunto.

Então, o ambiente de que estamos falando, terá informações devidamente identificáveis, que sistemas personalisados possam manipular, compartilhar e reusar de forma prática, as informações providas pela Web.

Tente imaginar como o Google seria mais preciso em suas buscas se toda a informação da web estivesse organizada de uma maneira sensata.
Ou o que os calendários como do Yahoo! poderiam fazer se você agendasse uma viagem: 2 dias antes – ou no momento que desejar – ele te avisaria que as passagens da companhia aérea que você usa freqüentemente já foram compradas e sua reserva já foi efetuada no hotel que você costuma ficar quando visita aquele determinado local.


A web semantica tem-se associado a Web 3.0, como um próximo movimento da web depois do Web 2.0 que ja está em plena fase de expansão.
As aplicações mais imediatas para Web Semântica visam categorizar informação e aumentar a qualidade do resultado das ferramentas de busca através de resolução de ambigüidade e contextualização da informação.


Web semântica: Exemplos para entender melhor

O objetivo das as aplicações com características semânticas é determinar o significados de textos ou dados, criando conexões para os usuários. As informações e sites passam a ter sentido quando estão conectados a partir de uma semântica. Para conseguir tais conexões, os especialistas apontam a portabilidade de dados e conectividade das aplicações como fatores de sucesso para o desenvolvimento da web semântica, quando as aplicações falam uma "língua" em comum fica mais fácil de desenvolver os links entre esses dados.
Segundo Alex Iskold, a maneira como está sendo desenvolvida a web semântica pode ser dividida em duas abordagens:A arquitetura de uma aplicação para a web semântica pode seguir tanto a abordagem bottom-up quanto top-down


Existem dificuldades para ambas abordagens, a abordagem Bottom up necessita que sejam colocadas tags nos textos e dados, isso necessita de um grande esforço até que a maioria dos dados na Internet estejam com essas tags e informações, também chamadas de meta dados. A abordagem Top down também necessita de um grande esforço para processar os dados já existentes e criar conexões e significado entre esses dados, a quantidade de dados e informações existentes na web é imensa.

Nada melhor do que exemplos para entender melhor como funciona e o que existe em relação a web semântica:




Freebase: Uma base de dados aberta, onde as pessoas criam dados e conectam esses dados entre si, onde são classificados por temas e sessões. Tem como objetivo ser um grande repositório de conhecimento humano, seguindo o estilo da wikipedia.

Powerset: Adquirida recentemente pela Microsoft, é um engenho de busca de linguagem natural. Pode processar perguntas por exemplo, porém ainda está em estado inicial e funciona bem para inglês apenas pelo que pude perceber.

Twine: Aprende sobre voce e os seus interesses a partir do conteúdo que você cria e compartilha e faz um grafo desse conteúdo. Ainda está em beta fechado mas pode ser visto um screenshot aqui.

AdaptiveBlue
: Um plug-in que oferece links de acordo com o contexto da página que se está navegando. Trazendo informações relevantes sobre livros, música, filmes, vinhos, receitas e ações por exemplo.

Hakia: Apontado com um dos mais promissores engenhos de busca em alternativa ao Google, faz a análise de sentenças na hora de fazer uma busca. Disponível em português também, trouxe resultados relevantes em algumas buscas que fiz.

Talis: Diferente dos outros exemplos da lista, Talis é uma plataforma para criação de aplicações semânticas na web. Os desenvolvedores podem criar, compartilhar e reutilizar informações nessa plataforma, que tem como objetivo facilitar o desenvolvimento das aplicações semânticas.

TrueKnowledge
: Tenta responder as suas perguntas a partir de uma base de dados com conhecimentos e conexões. Funciona parecido com o Powerset e está em beta privado por enquanto. O vídeo mostrado na página principal é bastante explicativo.

TripIt: Organize suas viagens, você poderá criar suas viagens e receber informações do flickr e wikipedia. Você também pode coletar informações na web e adicionar as suas viagens utilizando um plug-in, além de poder colocar seu calendário de viagens no Google Calendar por exemplo. Ainda é possível procurar por hotéis, vôos e aluguel de carros.

ClearForest: Uma companhia que aposta na abordagem top-down. Possui um plug-in chamado Gnosis que permite identificar pessoas, países, tecnologias, companhias, organizações, produtos e dados geográficos no texto que você está visualizando, o texto é marcado com uma cor de acordo com a categoria que pertence.

Spock: Você pode buscar por pessoas e obter informações associadas a essas pessoas, pelo que notei funciona melhor para pessoas famosas por enquanto, também é possível buscar pelo email, porém é necessário ser cadastrado.

Conclusões
Existem várias aplicações que estão sendo desenvolvidas, essas são apenas algumas delas. É uma área que irá ajudar bastante nessa fase da web que passa por um momento de grande criação de conteúdo, é necessário organizar tal conteúdo dar sentido e conexões. Apesar da visão do Google de organizar as informações do mundo inteiro, o engenho de busca do Google deixa a desejar no aspecto semântico como é mostrado no vídeo do TrueKnowledge. A Microsoft que anda querendo desbancar o Google no setor da internet aposta nessa brecha comprando Powerset recentemente.
A tecnolgia ainda está em desenvolvimento e levará um certo tempo até que possa ser usada em larga escala. São grandes os esforços científicos e de orgãos para tentar criar padrões, alguns acham que a tecnologia nunca irá decolar pois precisa de um grande esforço no caso da abordagem bottom up, já outros apostam na idéia de web como plataforma para criar novas aplicações e serviços que se comunicam para gerar conhecimento.


A Web Semântica ou Inteligente, vem se apresentando como solução para ordenar o caos informacional existente na web.
Segundo Berners-Lee em (2001), a web semântica será uma extensão da web atual porém apresentará estrutura que possibilitará a compreensão e o gerenciamento dos conteúdos armazenados na web independente da forma em que estes se apresentem, seja texto, som, imagem e gráficos à partir da valoração semântica desses conteúdos, e através de agentes que serão programas coletores de conteúdo advindos de fontes diversas capazes de processar as informações e permutar resultados com outros programas
A web semântica, a exemplo da web atual, será tão descentralizada quanto possível e deverá manter a responsabilidade exigida por esta descentralização, procurando alcançar o ideal de consistência de interconexões, porém permitindo seu crescimento exponencial.
O fantasma de perda de informação ou mensagens do tipo “Error 404: Not Found” deverão inexistir, ou estar, sob controle, ainda segundo os autores.
Para a implementação ou reorganização da web semântica há um contigente de pesquisadores trabalhando no W3C- World Wide Web Consortium, hospedado no Massachusetts Institute of Tecnhology, Laboratory for Computer Science, nos Estados Unidos, no Institut National de Rechurche in Informatique et em Automatique, na França, e no Japão, a Keio University Shanam Fujisawa. O W3C é um fórum aberto de indústrias e organizações com a missão de alavancar a web ao seu potencial máximo (www.w3.org www.w3.org./People ).


Basicamente, a web semântica se compõe de três elementos: (a) Representação do
conhecimento (Knowledge representation); (b) Ontologias (Ontologies) e (c) Agentes
(Agents).

(a) Representação do conhecimento
A web semântica trará estrutura ao conteúdo significativo (valoração semântica) de
páginas web criando um ambiente onde programas-agentes ou agentes inteligentes
buscando de uma página à outra poderá, imediatamente, executar tarefas sofisticadas para
os usuários.

(b) Ontologias
Designa a faceta semântica da representação dos seres, dos entes, aquilo que se
convenciona chamar de assuntos , conteúdos temáticos dos registros sobre a realidade.
A ontologia seria então, como uma especificação de uma conceituação. A Ontologia, na
web semântica estabelece uma ligação terminológica entre membros de uma comunidade
podendo ser estes membros, agentes humanos ou máquinas. No jargão dos pesquisadores
em inteligência artificial, uma ontologia é um documento ou arquivo que define
formalmente a relação entre termos.
Cabe neste contexto de formalidade relacional apresentar os metadados .
Etmologicamente, metadado significa “dado sobre dado”; dado que descreve a essência,
atributos e contexto de emergência de um recurso e caracteriza suas relações, visando o
seu acesso e uso potencial (FERREIRA, 1986).
Segundo Ikematu (2001), definir metadados tem sido uma tarefa difícil pois as várias
interpretações sobre o assunto estão relacionadas ao estágio da organização dentro da
hierarquia evolucionária de gestão do conhecimento.
São apresentados alguns conceitos sobre metadados. Dados que descrevem atributos de
um recurso, suportando um número de funções, como: localização, descoberta,
documentação, avaliação e seleção. Ou ainda, “Metadado é dado associado com objetos
que auxilia seus usuários potenciais a ter vantagem completa do conhecimento da sua
existência ou características”.


O autor salienta ainda que se há necessidade de integração e de uniformidade de
linguagem e significado dos dados através da organização, os metadados devem ser o
núcleo dos esforços de forma centralizada. Para que isto ocorra, a instituição deve ter
pleno conhecimento das vantagens da organização e da documentação dos dados. A
informação baseada em metadados enriquece documentos com informações semânticas
acrescentando explicitamente metadados aos recursos informacionais.
Existem várias linguagens de metadado que podem ser utilizadas para marcar ou anotar
estes recursos informacionais, como o XML e RDF (STAAB et alli, 2000, p.148).
As linguagens de marcação (markup languages) evoluiram desde o SGML (Standard
Generalized Markup Language), para o HTML (Hypertext Markup Language) em 1980 e
XML (Extensible Markup Language) em 1996.
Ao contrário da HTML que através das marcas pré-definidas gerenciam os textos marcados
e controlam sua representação estabelecendo ligações entre os documentos, a linguagem
XML marca semânticamente um documento. XML consiste em padrão utilizado para
marcação de documentos que contém informações estruturadas, ou seja, documentos que
contém uma estrutura clara e precisa da informação armazenada e obtida com XML. Esta
estruturação define e separa claramente conteúdo, significado e apresentação. Assim os
documentos em XML podem ser indexados com maior precisão que as páginas planas
escritas em HTML.
O padrão XML permite troca de informações entre diversas plataformas e possibilita a
descrição de dados em arquivos texto. A linguagem XML torna-se poderosa ferramenta
para a publicação de informações na web (OLIVEIRA, 2002).
O padrão XML pode ser utilizado de modo geral, no armazenamento de bases de dados
e documentos estruturados e as aplicações de XML criam novos padrões e linguagens
(www.xml.com.br).
A sintaxe de um documento XML é armazenada em tabelas DTD - Document Type
Definition que determinam as regras, hierarquias e marcações criadas para caracterizar as
informações do documento.


Enquanto a função principal do metadado é descrever um documento através de atributos
conferidos a um objeto, retratando as suas características como dimensão, formato,
autoria, localização e outros com o objetivo de intercambiar dados, o RDF – Resource
Description Framework é um grafo para descrever e intercambiar metadado.
Segundo Tim Bray (www.xml.com/ltp/a/2001/01/24/rdf.htm) as regras para construção de
RDF são: Fonte (Resource), qualquer coisa que possa ter uma identificação na rede – URI
(Uniform Resource Identifier); ou um elemento individual de um documento XML; -
Propriedade, é uma fonte que possui um nome e pode ser usado como uma propriedade e –
Afirmação (statement) que consiste na combinação de uma fonte, uma propriedade e um
valor, partes estas conhecidas como “assunto”, “predicado” e “objeto” de uma Afirmação
(statement). Para um objeto 0 existe um atributo A cujo valor é V, sendo que objetos e
valores são intercâmbiados em RDF, onde um objeto pode ser um valor. Em grafos RDF
pode-se identificar de que tipo é o objeto e estabelecer relações à sua definição.

Várias implementações podem ser desenvolvidas utilizando RDF nível simples ou Schema
RDF e aplicações XML.
O modelo a ser adotado para a web semântica parte do modelo RDF geral. Este modelo
básico contém apenas conceito sobre asserção (assertion) e de “quotation” – criando
asserções sobre asserções, portanto necessita, segundo Berners-Lee (2001), em artigo
“Semantic Web Road Map” implementações e aplicações como conversão de linguagem,
leis da lógica, com o objetivo de imprimir lógica aos documentos; predicado lógico
(not, and, or) e leis de quantificação (para todo x y (x)). Neste estágio, o autor ainda cita
a introdução da linguagem de provas e de busca e índices de termos evoluindo para
vocabulário.
A arquitetura da web semântica é processo em construção por grupos de trabalho da
W3C (www.xml.com/pub/r/1246; www.w3.org) com o objetivo de mapear as complexas
relações semânticas, lógicas, de sintaxe e de apresentação dos documentos no novo espaço


(c) Agentes
A função dos programas agentes ou agentes inteligentes é coletar conteúdos na web a
partir de fontes diversas, processar a informação e permutar os resultados com outros
programas permitindo através de linguagem que expressa inferências lógicas resultantes do
uso de regras e informação como aquelas especificadas pelas ontologias. O principio está,
não no entendimento, pela máquina, daquilo que está escrito e sim no reconhecimento de
provas escritas na linguagem estabelecida pela ontologia, onde os programas-agente, pela
inferência lógica retornam respostas ao que foi requerido, ou agente e consumidor
podem alcançar entendimento compartilhado permutando as ontologias, que oferecem o
vocabulário necessário para a discussão.

O novo espaço digital e o bibliotecário

Após estas breves considerações sobre o cenário da web semântica, cabe transpor para o
ambiente do fazer biblioteconômico, respondendo algumas questões como:- O
profissional bibliotecário está preparado para interagir com este novo ambiente, ou
observa-se uma desabilitação profissional? Os currículos em Ciência da Informação/
Biblioteconomia necessitam de mudanças? Quais são as novas habilidades necessárias do
profissional bibliotecário?
Vários estudos sobre perfil profissional do bibliotecário (Pinheiro, 1996; Kobashi, 1997;
Tarapanoff, 1997; Beraquet 1997; Marchiori, 1997; Barbosa, 1998) do bibliotecário
apontam as transformações do cenário da informação pela inserção de novas tecnologias
de comunicação.
Estudos mais recentes (Arruda et alii, 2000) indicam a presença de novos profissionais,
advindos de outros campos de atuação causando insegurança no meio bibliotecário.
Não é raro encontrar o termo “novo profissional” como se a essência do trabalho
biblioteconômico tivesse sido alterada. Não se trata de novo profissional mas de
profissional com maior qualificação, incorporando sim, novas habilidades e com
competência, entendida aqui, como forma de repensar as interações com as pessoas, seus
saberes e capacidades.

Segundo Ruas (1999), citado por Oderich & Lopes (2001)
“... a competência não se reduz ao saber, nem tampouco ao saber-fazer , mas
sim à sua capacidade de mobilizar e aplicar esses conhecimentos e
capacidades numa condição particular, aonde se colocam recursos e
restrições próprias à situação específica. Alguém pode conhecer métodos
modernos de resolução de problemas e até mesmo ter desenvolvido
habilidades relacionadas à sua aplicação, mas pode não perceber o momento
e o local adequados para aplicá-los na sua atividade . (...) A competência,
portanto, não se coloca no âmbito dos recursos (conhecimentos, habilidades),
mas na mobilização destes recursos e, portanto, não pode ser separada das
condições de aplicação.”
Portanto, a questão reside não nas mudanças curriculares pois estas vem correndo há pelo
menos cinco ou seis anos e ainda estamos aguardando pelo novo profissional? A
formação acadêmica em nossa área não foge da estruturação curricular disposta em
disciplinas, não mais apenas de caráter disciplinar (seria uma redundância) mas com
caráter multidisciplinar e interdisciplinar. O conteúdo programático ministrado no bojo
de cada uma dessas disciplinas pode diferir de instituição para instituição, não naquilo
considerado como currículum mínimo, e apoiado ou deferido nas diretrizes curriculares do
MEC/CNE (parecer CNE/CES 492/2001 de 03/04/2001).
A agregação de novos conteúdos de formação especifica constante do Parecer pode se dar
através de parceria com outros cursos o que pode garantir a ampliação do núcleo de
formação básica, complementar conhecimentos anferídos em outras áreas e promover
ênfases específicas em determinados aspectos da carreira.
As habilidades e competências dos profissionais bibliotecários citadas pelo documento são
também citadas na literatura apontando que o profissional da informação deve rever sua
atuação com convergência para mudança no modelo de gerenciamento de informações
com altíssimo grau de utilização de tecnologias (Marchiori, 1997). O espaço para criação
de bibliotecas digitais propicia ambiente ideal para o exercício profissional do
bibliotecário. A web inteligente está alavancando (diria até “atropelando”) esta nova
forma de trabalho.

Como se dará então, o fazer nessa nova forma?

Partindo da afirmação de que a biblioteconomia possui núcleos de conteúdos tradicionais
como teoria da classificação e catalogação, construção de vocabulário tesauro, indexação e
outras, caracterizados como núcleo conceitual da área e que são aplicados tanto em
ambientes de biblioteca quanto em outros ambientes e ainda que, a Biblioteconomia
Ciência da Informação possui conteúdos ou disciplinas oriundos de outras áreas como
administração e informática que são, igualmente, aplicáveis a outras áreas pode-se
constatar que as “importações” de conhecimentos gerados em outras áreas e “exportação”
de conhecimentos gerados na Biblioteconomia Ciência da Informação, citados por
Barbosa (1998) tendem, com a devida e correta exploração pelos nossos profissionais abrir
nichos importantes de mercado. Portanto há oportunidade, há nicho de mercado, há
cursos na área com comprometimento e competência para formar profissionais aptos e
atuantes sob uma nova perspectiva econômica, social e tecnológica.
A desabilitação profissional parece ocorrer em nossa área, pois a qualificação profissional
do bibliotecário, assim como em todas as outras ligadas à informação, sofreu impacto e
mudança de paradigma e é preciso assimilar que ninguém pode reunir todas as
habilidades, conhecimentos e competências para resolver todos os problemas numa área
em ebulição. As saídas são várias, educação continuada à distância (a curto prazo);
formação de mestre e doutores (médio prazo), estabelecimento de parcerias/ consórcios
institucionais e acompanhamento da evolução do estágio de conhecimento sobre web
semântica.

Oportunidades no espaço digital

O assunto poderia ser abordado em centenas de páginas pois o assunto web semântica
deve estar ocupando gigabytes em servidores espalhados pelo mundo.
Para melhor entender ou situar a participação dos bibliotecários e outros profissionais da
área da informação, cabe citar o clássico artigo de Vickery (1986) sobre as mudanças no
cenário da biblioteca, em especial na estrutura e representação dos dados e informação
quais sejam: - estruturas semânticas e sintáticas da linguagem natural;
- representação do conhecimento na inteligência artificial e
-
- modelos de memória humana.

Comparando-se com os elementos da web semântica, há uma total conformidade ao
preconizado, cerca de vinte anos atrás.
Alvarenga (2001), em excelente artigo sobre o contexto das bibliotecas tradicionais e
digitais, a teoria do conceito em conexão com ontologias e metadados, nos traz os pontos
comuns e problemas sobre tratamento da informação, em especial a classificação, onde
afirma que:

“Assim sendo, ao se tentar classificar objetos, seres ou ideais, não é
suficiente que se observa um objeto captando sua essência e característica,
ou se considere, apenas, o nível lexial que define que define essas realidades.
É absolutamente necessário que se aprofunde no conhecimento das relações
entre as similitudes e diferenças entre esses objetos, extrapolando uma visão
individual daquele objeto e a partir dos termos que o simbolizam, fazendo o
mesmo aprofundamento nos seus conteúdos semânticos ou conceituais...”
A representação do conhecimento na web semântica é um processo ainda em construção e
onde reside um dos pontos necessários de trabalho de pesquisa assim como, o
desenvolvimento de vocabulários a partir das ontologias de áreas específicas que
alimentarão os agentes inteligentes tornando possível o processo de obtenção de
informação dotado de extrema eficiência, simplicidade e rapidez.
Dessa forma, a web semântica virá a se configurar, nas palavras de seus idealizadores,
numa biblioteca universal e como tal os saberes e conhecimentos acumulados e
solidificados deverão ser absorvidos e incrementados recebendo nova roupagem (do velho
para o novo)

Pode-se inferir que áreas de representação de conteúdos demandará grandes esforços e
investimentos em pesquisa para geração de linguagens e mecanismos que possibilitam a
conceituação semântica aos documentos presentes na web.
Nos conteúdos já disponíveis na web e que utilizam diversos padrões e formatos, estes
deverão ser alvo de implementações, como no caso dos catálogos online em MARC que
deverão receber marcação XML e geração de Schemata para que haja interoperabilidade
entre os dados.
No Brasil, a ação do IBICT-Instituto Brasileiro de Informação em Ciência e Tecnologia
que gerencia desenvolvimento e implantação da Biblioteca Digital Brasileira merece
destaque, pois pretende reunir, em consórcio, as Universidades produtoras de
conhecimento através de suas Bibliotecas, que deverão trabalhar cooperativamente na
construção da Biblioteca Digital de Dissertação e Teses – BDB. (www.ibict.br/bdtd/).
O CNPq, dentro de Projetos Cooperativos, através de Chamada 011/2001 para o Programa
RDC-T IC (Rede de Desenvolvimento de Competências na área de Tecnologia de
Informação e Comunicação) deu oportunidade para o surgimento do Projeto Conteúdos
Digitais na Internet no Brasil, eContents.br, com a participação de universidades e
institutos de pesquisa e setor produtivo. Os objetivos gerais do Projeto são traduzidos pela
promoção de novo modelo de P&D e empreendedorismo em TICs no Brasil, baseado em
“demand pull” do mercado de Internet e telecomunicações, promoção de revisões
curriculares sistemáticas e abrangentes nos currículos de nível médio e de graduação em
cursos de TICs no Brasil. Os resultados advindos deste megaprojeto, certamente irão
beneficiar, à médio prazo, a formação/treinamento de pessoal envolvido em TCIs.
A atuação dos órgãos de fomento como CAPES – (Coordenação de Aperfeiçoamento de
Pessoal de Nível Superior) e o CNPq/MCT – (Conselho Nacional de Desenvolvimento
Científico e Tecnológico do Ministério de Ciência e Tecnologia) muito tem contribuído
para o fortalecimento e registro da produção cientifica no país. A Plataforma Lattes do
CNPq é exemplo de serviço e pesquisa. Serviço pois, gera banco de dados sobre cientistas
brasileiros disponível à sociedade, e pesquisa, com o objetivo de integrar bases de
informação e conhecimento sobre a ciência e tecnologia e criar ontologia comum a esse
Pode-se inferir que áreas de representação de conteúdos demandará grandes esforços e
investimentos em pesquisa para geração de linguagens e mecanismos que possibilitam a
conceituação semântica aos documentos presentes na web.
Nos conteúdos já disponíveis na web e que utilizam diversos padrões e formatos, estes
deverão ser alvo de implementações, como no caso dos catálogos online em MARC que
deverão receber marcação XML e geração de Schemata para que haja interoperabilidade
entre os dados.

No Brasil, a ação do IBICT-Instituto Brasileiro de Informação em Ciência e Tecnologia
que gerencia desenvolvimento e implantação da Biblioteca Digital Brasileira merece
destaque, pois pretende reunir, em consórcio, as Universidades produtoras de
conhecimento através de suas Bibliotecas, que deverão trabalhar cooperativamente na
construção da Biblioteca Digital de Dissertação e Teses – BDB. (www.ibict.br/bdtd/).
O CNPq, dentro de Projetos Cooperativos, através de Chamada 011/2001 para o Programa
RDC-T IC (Rede de Desenvolvimento de Competências na área de Tecnologia de
Informação e Comunicação) deu oportunidade para o surgimento do Projeto Conteúdos
Digitais na Internet no Brasil, eContents.br, com a participação de universidades e
institutos de pesquisa e setor produtivo. Os objetivos gerais do Projeto são traduzidos pela
promoção de novo modelo de P&D e empreendedorismo em TICs no Brasil, baseado em
“demand pull” do mercado de Internet e telecomunicações, promoção de revisões
curriculares sistemáticas e abrangentes nos currículos de nível médio e de graduação em
cursos de TICs no Brasil. Os resultados advindos deste megaprojeto, certamente irão
beneficiar, à médio prazo, a formação/treinamento de pessoal envolvido em TCIs.
A atuação dos órgãos de fomento como CAPES – (Coordenação de Aperfeiçoamento de
Pessoal de Nível Superior) e o CNPq/MCT – (Conselho Nacional de Desenvolvimento
Científico e Tecnológico do Ministério de Ciência e Tecnologia) muito tem contribuído
para o fortalecimento e registro da produção cientifica no país. A Plataforma Lattes do
CNPq é exemplo de serviço e pesquisa. Serviço pois, gera banco de dados sobre cientistas
brasileiros disponível à sociedade, e pesquisa, com o objetivo de integrar bases de
informação e conhecimento sobre a ciência e tecnologia e criar ontologia comum a essetipo de informação, foi desenvolvida a linguagem LMPL – Linguagem de Marcação da
Plataforma Lattes (PACHECO & KERN, 2001).
Não há como não evidenciar o papel da Bireme- (Centro Latinoamericano e do Caribe de
Informação em Ciências da Saúde) da OPAS – (Organização Mundial da Saúde), na
criação da Biblioteca Virtual em Saúde (www.bireme.br), integrando produtos já
consolidados como a Base de dados LILACS- Literatura Latinoamericana e do Caribe em
Ciências da Saúde e SciELO – Scientific Eletrônic Library Online, parceria BIREME e
FAPESP – (Fundação de Amparo à Pesquisa no Estado de São Paulo).As metodologias
geradas para construção de bibliotecas virtuais estão disponíveis, mediante termo de
compromisso entre instituições de ensino e pesquisa e a Bireme.
Fruto de parceria entre Bireme e CNPq, foi apresentado à comunidade cientifica brasileira
metodologia para desenvolvimento de servidor de enlaces que operem na integração das
fontes, atualmente com servidores disponíveis, mas com possibilidade de aplicação em
servidor de servidores de enlaces, no espaço nacional como propoem seus autores (Santana
et alii, 2001).
Para fornecer serviços de infra-estrutura de redes de protocolo Internet avançadas, a
prospecção, implantação e avaliação de novas tecnologias de rede, a RNP (Rede Nacional
de Ensino e Pesquisa) vem atuando desde 1989. Atualmente, a RNP fornece às
comunidades usuárias (Universidades, Instituições de pesquisa e sociedade) não apenas
ambiente tecnológico de comunicação de dados, mas constitui-se em espaço de
disseminação dessas tecnologias e capacitação de recursos humanos
Apresenta-se portanto, o cenário completo para o desenvolvimento da área de
biblioteconomia e ciência da informação em nosso país, porém, é preciso que o
profissional atue de forma coesa, cooperativa, com esforços centralizados para promover
conhecimentos e alavancar tecnologias.

Conclusão

Procura-se elencar alguns pontos-chaves para vencer os desafios de inserção na web
semântica dos profissionais da informação-bibliotecários:

- apreensão ou re-aprendizado de disciplinas como representação descritiva e temática de
documentos através de cursos / treinamentos;
- interagir no processo de apreensão de novas tecnologias, surjam estas em qualquer área
do conhecimento;
- buscar competência no próprio ambiente de trabalho ou fora dele;
- libertar todo e qualquer preconceito diante do “novo”;
- incentivar, no ambiente de trabalho, formação de equipes multi-disciplinares;
- participar pro-ativamente de associações/instituições de classe para provocar mudanças
no processo ensino-aprendizagem





Web semântica

Tecnologia Co-Link: links multidirecionais são a nova onda


Web semântica: o que é e pra que serve


Organização da informação na web: das tags à web semântica


Para facilitar a vida de quem deseja estudar a Web Semântica mais detidamente, compilei uma lista com alguns artigos interessantes que consegui reunir.

Geração automática de metadados: uma contribuição para a Web semântica

A Web Semântica e suas contribuições para a ciência da informação


Geração automática de interfaces web para sistemas de informação: metamorphosis

Web semântica e ontologias no processamento de informação documental

Educação a distância e a WEB Semântica: modelagem ontológica de materiais e objetos de aprendizagem para a plataforma COL

Perspectivas na web semântica para a Ciência da Informação

Web semántica: un nuevo enfoque para la organización y recuperación de información en el web

Um modelo de navegação exploratória para a infra-estrutura da web semântica

Autoria de documentos para a web semântica: um ambiente de produção de conhecimento baseado em ontologias

Navegação semântica sobre uma base de metadados RDF implementada no projecto OmniPaper

Populando ontologias através de informações em HTML - o caso do currículo lattes

Método semi-automático de construção de ontologias parciais de domínio com base em textos

Metadados no Contexto da Web Semântica

Web Semântica: Conceitos Básicos e Tecnologias Associadas

Anotações colaborativas como hiperdocumentos de primeira classe na Web Semântica

Metadados, Web Semântica, Categorização

Automática: combinando esforços humanos e computacionais para a descoberta e uso dos recursos da web

Permitindo o Desenvolvimento de Aplicações baseadas em Agentes na Web Semântica

Construindo uma ontologia para pesquisa de Materiais e Objetos de Aprendizagem baseada na Web Semântica

Ontologias e ambientes de desenvolvimento de software semânticos

Reengenharia e ontologias: análise e aplicação

Recuperação de informação: análise sobre a contribuição da ciência da computação para a ciência da informação

Mineração na WebModelagem semântica de aplicações na WWW

Metadados: descrição e recuperação de informações na web

Da web romântica para a web semântica: novos conceitos e pontos para reflexão

Web Semântica e Serviços Web: Automatizando a Integração de Recursos na Web

Extração de Informação para Busca Semântica na Web Baseada em Ontologias

Uso de ontologias para gerenciamento e acesso a documentos na web

Inteligência Artificial para Descoberta de Conhecimento na Web

O ciberespaço e os mecanismos de busca: novas máquinas semióticas

A ambigüidade na recuperação da informaçãoWeb Semântica: ontologias como ferramentas de representação do conhecimento

Web Semântica: novo desafio para os profissionais da informaçãoOntologia e web semântica

A semântica dos adjetivos: como e por que incluí-la em uma ontologia de domínio jurídico

Comments

Home

Videos

SItemap

Navegação

Ueba

Atividade recente no site