Raitéqui – O que é a web semântica?

Semântica é uma palavra que vem do grego semantiké, e pode ser traduzida por “arte da significação”. A web semântica será uma web inteligente?


Semântica é uma palavra que vem do
grego semantiké, e pode ser traduzida por “arte da significação”. A web
semântica será uma web inteligente?
  Sergio Amadeu da Silveira

Você conhece Ferdinand de Saussure? Foi um dos grandes mestres da
Universidade de Genebra e considerado o fundador da Linguística
moderna. No início do século XX, deu o Curso de Linguística Geral que
abriu caminho para uma ciência autônoma que tivesse a língua como
objeto específico. Você conhece Tim Berners-Lee? É um inglês que
trabalhava no Laboratório de Física de partículas, também em Genebra,
quando criou a web, no final do século XX. Em maio de 1990, Berners-Lee
liberou na rede mundial de computadores os principais elementos para a
constituição da world wide web, ou seja, seus principais protocolos e padrões, tais como o HTTP (HyperText Transfer Protocol), mas também da URL (Uniform Resource Locator), e da linguagem HTML (Hypertext Markup Language),
que permitiram o modo gráfico na internet. Logo depois, o mesmo
laboratório de Genebra (conhecido como CERN) liberou a primeira versão
de um software para interpretar os ícones e desenhos que foram escritos em HTML. Assim sugiu o primeiro browser (navegador), o Mosaic.

A web foi a grande responsável pela popularização da internet. A
linguagem HTML, aberta e não-proprietária, foi assimilada rapidamente e
permitiu a construção de milhares de sites, que logo se
tornaram milhões. Sem dúvida, a web nasceu no mundo das tecnologias
abertas e pode ser considerada uma revolução dentro da revolução
informacional. Tim Berners-Lee continuou seu esforço colaborativo e,
atualmente, dirige o consórcio W3C (World Wide Web Consortium)
que garante o desenvolvimento aberto e interoperável de tecnologias
desenhadas para a web. Berners-Lee concentra-se, agora, em viabilizar a
web semântica.

A Linguística criada por Saussure, atualmente, é uma ciência que
possibilita analisar as linguagens sob quatro pontos de partida: a
fonologia estuda suas unidades sonoras; a sintaxe nos dá a
possibilidade de observar a estrutura das frases; a morfologia nos leva
a avaliar as formas das palavras, e a semântica nos coloca diante do
estudo dos significados. E o que isso tem a ver com a web? Com a internet? Muito.

Para Saussure, a língua é um “sistema de signos” e o signo é uma
associação entre o significante (a imagem sonora ou visual do signo) e
o significado (o conceito do signo). Essa relação não é estática, ou
seja, os significados mudam diante de seus significantes. A semântica,
de acordo com o “Dicionário Aurélio”, pode ser entendida como
semasiologia, que “estuda as relações entre sinais e símbolos e aquilo
que eles representam”. Pode também ser definida como “o estudo do
sentido das palavras”. Agora, pare e pense em uma busca pela web. Imagine que seu amigo chama-se Aurélio (nome próprio). Você está procurando o blog
dele, e o mecanismo de busca não sabe que você está atrás do Aurélio
“nome próprio”, em vez do Aurélio “dicionário”. A linguagem em que os sites foram escritos não permite que as máquinas entendam o significado dos dados que estão na rede.

Na wikipédia em português (www.wikipedia.org), lê-se: “uma rede
semântica é uma rede que serve para interligar significados de
palavras. (…) Neste âmbito, tem como finalidade conseguir atribuir um
significado aos conteúdos publicados na internet, de modo que seja
perceptível tanto pelo humano como pelo computador.” A linguagem HTML é
limitada para descrever os dados, ela serve para dizer como a página
deve ser visualizada pelos browsers. O projeto da web
semântica quer construir categorias e linguagens que permitam aos
computadores obter o sentido dos dados. Assim, os computadores poderão
distinguir uma busca pelo blog da procura por um dicionário ou pela loja de livros do Aurélio.

Para isso, o projeto da web semântica precisa usar uma outra linguagem
que separe o conteúdo da forma em que é exposto. A linguagem básica
para isto é o XML (eXtensible Markup Language), que nos permite inserir categorias semânticas nos dados que irão para a web.
Poderemos, por exemplo, definir que um determinado conjunto de dados é
um preço, e outro é o nome de um livro, e assim por diante. Para
explicar isso melhor, segue um trecho de um excelente tutorial sobre
XML (www.gta.ufrj.br/grad/00_1/miguel/), escrito por Miguel Furtado
Junior ( Centro de Tecnologia em Engenharia Eletrônica da UFRJ).

Forma e conteúdo

“A mais importante característica do XML se resume em separar a
interface com o usuário (apresentação) dos dados estruturados. O HTML
especifica como o documento deve ser apresentado na tela por um
navegador. Já o XML define o conteúdo do documento. Por exemplo, em
HTML são utilizadas tags [marcadores] para definir tamanho e
cor de fonte, assim como formatação de parágrafo. No XML, você utiliza
as tags para descrever os dados, como exemplo, tags de assunto,
título, autor, conteúdo, referências, datas, etc. (…) O XML conta,
ainda, com recursos tais como folhas de estilo definidas com Extensible Style Language (XSL) e Cascading Style Sheets(CSS)
para a apresentação de dados em um navegador. O XML separa os dados da

apresentação e processo, o que permite visualizar e processar o dado
como se queira, utilizando diferentes folhas de estilo e aplicações.
(…) Essa separação dos dados da apresentação permite a integração dos
dados de diversas fontes. (…) Dessa forma, os dados em XML podem ser
distribuídos através da rede para os clientes que desejarem.”

Para Tim Berners-Lee*, a web
semântica irá permitir mais do que a simples melhoria da indexação de
informações na rede mundial de computadores. Ele acredita que a
completa interoperabilidade dos dados, libertos de formatos e
plataformas, permitirá o surgimento de aplicações que melhorem a
educação, os serviços de saúde e as atividades das pessoas no
ciberespaço. Certamente, haverá uma disputa pelo seu uso. As grandes
corporações terão maior facilidade para cruzar dados dos seus alvos ou
consumidores. Por outro lado, teremos maiores possibilidades de
compartilhamento do conhecimento humano. Nossa história mal começou.

www.w3.org/Designlssues/Semantic – O Mapa da Web Semântica, em inglês.

www.comciencia.br/reportagens/internet/net08.htm – Excelente artigo sobre a web semântica, publicado na Revista Eletrônica Conciência, intitulado "Qual o sentido da WEB?"
*www.sciam.com/2001/0501issue/0501berners-lee.html