Com um enorme poder e influência, o Google e os mecanismos de busca na
internet ordenam informações de acordo com hierarquias que não
conhecemos, e nem sempre são considerados com espírito crítico.
Sérgio Amadeu da Silveira
Imagine você ter que encontrar uma rua na cidade de São Paulo chamada
Solidônio Leite? Não! Ela não é uma pequena rua, nem uma viela. É uma
rua com mais de 2 mil metros. Mesmo assim, esta seria uma tarefa muito
difícil. Por isso, fora criados os localizadores ou guias de
localização e de pesquisa de vias públicas.
Na Rua Solidônio Leite existe uma escola chamada Stefan Zweig. Alguém
poderia perguntar: quem foi Stefan Zweig? Os incluídos digitais
responderiam esta questão com uma palavra: Google. Recorreriam ao mais
famoso e talvez mais veloz mecanismo de busca de informações na
internet. Pronto: em 0,49 segundos você terá acesso a 872 mil páginas
que tenham alguma relação com a junção das palavras “Stefan” e “ Zweig”.
A internet não é uma cidade com milhares de ruas e avenidas. É mais
semelhante a um oceano, com uma topografia e profundidade muito variada
e uma extensão planetária. Diferente dos sete mares e sua capacidade de
armazenar água, a internet permite incorporar novos sites e páginas de
modo infinito. É muito difícil dizer com precisão, mas alguns
especialistas estimam existir atualmente bilhões de páginas na web.
Segundo a Metamend, empresa de otimização de buscas na rede, são
criadas 10 milhões de novas páginas estáticas por dia na web. Nesse
contexto, que já foi chamado de dilúvio informacional, como encontrar
uma informação? Um endereço eletrônico? Um nome de um filme? Um texto?
Para isso foram criados os chamados sites de busca, que trabalham com
programas especializados em encontrar informações na internet. Estes
programas são chamados de mecanismos ou motores de busca. No início,
esses sites eram praticamente catálogos de informações reunidas por
especialistas ou enviadas pelos internautas. Mas era fundamental criar
uma forma de cobrir toda a internet e acompanhar sua expansão.
Matthew Gray, do MIT, em 1993 desenvolveu um mecanismo denominado web
crawler (rastejador, em português literal) ou web spider (aranha). Essa
solução copiava as páginas que o mecanismo visitava, para serem
posteriormente analisadas e catalogadas de acordo com determinados
critérios de indexação (organização da informação). O site web Crawler
só iniciou sua operação em 1994. Isso dá ao site Aliweb o título de
pioneiro. Esse site permitia que os usuários enviassem a descrição e os
links de suas páginas. É possível afirmar que, mais do que um mecanismo
de busca, era um mecanismo de coleta de informações.
Em 1994, nasce na Carnegie Mellon University o famoso Lycos. Em 1995,
surgem o Alta Vista e o Excite. Em 1996, é lançado o Inktomi e o Ask
Jeeves. Em 1997, surge o Northern Light e, somente em 1998, o Google. O
Alta Vista planejou um método de armazenar cada palavra das páginas
html que permitia uma pesquisa muito rápida, sendo a primeira base de
dados de textos integrais disponíveis diretamente na web. Seu sucesso
foi arrasador até o surgimento do Google.
O que faz o Google ser o mecanismo de busca preferido? A melhor
resposta pode ser encontrada no seu próprio site: “ Google roda sobre
uma combinação única de avançados hardware e software. A velocidade que
você nota pode ser atribuída em parte à eficiência de nosso algoritmo
de busca e parcialmente a milhares de PC’s de baixo custo que nós
reunimos em rede para criar um mecanismo de busca super-rápido. (…) O
coração do nosso software é o PangeRank(TM), um sistema para dar notas
para páginas na web, desenvolvido pelos nossos fundadores Larry Page e
Sergey Brin na Universidade de Stanford.”
Conta a lenda que o Google já ultrapassou a marca de 150 mil servidores
(computadores interligados). O outro segredo que o torna leve é o
sistema operacional Linux, o banco de dados aberto MySQL e o algoritmo
de busca (que define as rotinas para se armazenar e depois encontrar
uma informação) feito sobre o sistema operacional. Em meados de 2004, o
Google informou à revista “Super Interessante” que recebia uma média de
82 milhões de visitantes por mês e respondia 300 mil pesquisas por
segundo. Conseguia buscar informações em 4,28 bilhões de páginas de
texto e 880 milhões de imagens. Traduzido para 97 línguas, o Google
possuía 150 mil clientes que colocavam uma média de um anúncio por mês.
Alerta aos educadores
De textos, produtos (www.froogle.com), imagens, fotos, perguntas
(answers.google.com), notícias, o Google saltou para mapas e para a
busca de trechos em livros, o que gerou uma enorme reação dos
defensores de direitos autorais. Sem dúvida, o Google é fundamental
para a internet. Ele nos permite navegar e encontrar o que queremos.
Espere aí. Este é o problema. Será que encontramos, de fato, o que
estamos procurando?
Se uma informação está indexada na décima página da busca do Google,
ela praticamente não existirá. Os dirigentes do Google afirmam
categoricamente que não interferem nas buscas e que seu algoritmo é
extremamente técnico. Declaram que classificam uma informação de acordo
com a estrutura de links na qual ela está envolvida. Segundo o Google,
seu sistema “confia na natureza excepcionalmente democrática da web”.
Para o Google, o valor de cada página é definido pela própria web.
Uma série de questões começam a ser levantadas sobre o Google e todos
os mecanismos de busca. Em uma sociedade cada vez mais dependente das
redes, os mecanismos de busca podem ser entendidos como serviços de
utilidade pública. Por classificar e hierarquizar informações, podem
adquirir enorme poder e influência sobre a conduta e a avaliação das
pessoas. E, por serem velozes e cômodos, podem gerar dependência e
falta de espírito crítico. Por concentrar cada vez mais a preferência
das buscas, podem manipular consultas. E que estão mais importante:
colocam em risco outras formas de classificação que não sejam baseadas
no cruzamento de links e na “democracia da web”.
Qual a solução? Saber dos riscos já é um passo. Como disse Willian
Irwin, ao comentar o filme Matrix, “a única coisa pior que uma prisão
para a sua mente é uma prisão para a sua mente que você nem sabe
existir; uma prisão de onde você nem tenta escapar.” Outra coisa
importante é exigir que todos os códigos e algoritmos desses mecanismos
sejam abertos e auditáveis. Assim, poderemos saber como as informações
estão sendo tratadas. Também é preciso incentivar várias formas de
indexação das informações. E discutir isso nas escolas: em vez de
reclamar que os alunos “copiam e colam”, é melhor orientá-los sobre
como pesquisar, o que copiar e como devemos citar o que copiamos.