Está aqui

Tsunami de dados

« A observação do bosão de Higgs foi considerada a descoberta do ano de 2012 para a revista Science. Sabia que, para a descoberta do bosão de Higgs, o acelerador de partículas do CERN, quando em funcionamento, produz um enorme volume de dados que daria para encher cem mil CD a cada segundo? E que esses dados têm que ser distribuídos por investigadores localizados em todo o mundo, para poderem ser tratados em sofisticados computadores?

Este é um dos vários exemplos daquilo que, no mundo da ciência, se designa por tsunami de dados.

Com efeito, nos últimos anos e para todas as áreas científicas, começaram a ser produzidas enormes quantidades de dados. E espera-se que nos próximos anos esta tendência se venha a acentuar. Um exemplo do que virá a acontecer, dentro de uma década, é o que se relaciona com o Projecto SKA (Square Kilometer Array). O SKA vai ser o maior e mais sensível radiotelescópio do mundo, ficando instalado na região Sul de África e na Austrália. Quando entrar em funcionamento, irá produzir volumes de dados extremamente elevados, muito maiores do que os actualmente produzidos no CERN, e obrigará a que as redes de investigação e ensino, que foram sendo criadas em meados da década de 80 do séc. XX, suportem essas transferências de dados para os cientistas em todo o mundo.

É sobre estas redes de investigação e ensino (NREN - National Research and Education Networks), que já hoje fluem enormes quantidades de dados científicos. Desde o início da década de 80 do séc. XX que têm vindo a ser criadas estas redes, caracterizadas por terem capacidades e tecnologias específicas para quem trabalha em investigação. Estas redes começaram por ser criadas na América do Norte e na Europa e foram a plataforma que está na génese da Internet comercial que hoje conhecemos. Estas NREN foram depois sendo criadas em todos os países e abrangem, hoje, os cinco continentes. E isto porque a ciência está globalizada e os dados científicos, quer sejam do acelerador do CERN, de telescópios, de radiotelescópios ou de bases de dados de vários tipos de genomas precisam de ser trocados a alta velocidade desde a fonte onde são produzidos até aos investigadores espalhados pelo Mundo. Estas NREN contribuem para o trabalho científico mundial e para dar novas fronteiras ao trabalho científico e são, pela sua natureza e na grande maioria dos casos, geridas por associações criadas para o efeito.

Em Portugal, a FCCN - Fundação para a Computação Científica Nacional - gere a rede RCTS, a rede que liga as nossas instituições de investigação e ensino superior à rede pan-europeia GÉANT e às outras redes mundiais congéneres. A maioria das nossas universidades e politécnicos já está ligada com capacidade de múltiplos acessos a 10 Gbit/seg. Um destes acessos é usado para o tráfego Internet normal. Os outros acessos são usados para projectos específicos do universo académico, como seja a ligação de centros de computação GRID para o tratamento dos dados recolhidos no acelerador do CERN.

A rede criada pela FCCN é uma poderosa rede de comunicações para a comunidade científica nacional, baseada em 1000km de fibra óptica e que chega a cerca de 83% dos utilizadores. Para os restantes são alugados circuitos aos operadores de telecomunicações. Esta fibra óptica está ligada à NREN espanhola nas fronteiras de Valença e Elvas e, através desta, liga-nos à infra-estrutura europeia e mundial de redes de investigação. Trata-se de uma infra-estrutura científica electrónica - hoje em dia designada por e-Infrastructure, em terminologia inglesa - que é reconhecida como um dos sustentáculos tecnológicos do próximo programa de investigação e desenvolvimento da União Europeia, o Horizon 2020. A capacidade de inovar exige um acesso rápido e permanente aos instrumentos científicos, às fontes de informação e aos dados científicos produzidos em qualquer universidade ou laboratório de investigação.

A NREN portuguesa - a RCTS - já disponibiliza à nossa comunidade científica os instrumentos de comunicação que contribuem para que os nossos investigadores e os nossos alunos do ensino superior já estejam integrados no mundo do Conhecimento Sem Fronteiras. Apesar da nossa posição geográfica na periferia da Europa, em termos de capacidade de ter acesso às redes científicas estamos perto de todo o mundo científico. A rede RCTS, a base da e-Infra-estrutura de investigação portuguesa, já está preparada para o tsunami de dados e para os desafios que este traz aos nossos investigadores.

Pedro Veiga
Professor da Universidade de Lisboa e presidente demissionário da FCCN»

Artigo de opinião, reproduzido com autorização do autor, originalmente publicado em:
http://www.publico.pt/opiniao/jornal/tsunami-de-dados-25861551