A criação de catálogos específicos para análise científica é automatizada através de uma infraestrutura composta for 18 pipelines para instalação, preparação dos dados e criação dos catálogos. A falta de homogeneidade dos dados devido às diferentes condições observacionais ao longo do tempo deve ser levada em conta bem como diferentes métodos para a classificação dos objetos detectados como estrelas ou galáxias e estimativas de redshift fotométricos obtidas por distintos algoritmos (Figura 1).
Dada a complexidade do sistema, o monitoramento da execução dos pipelines e controle da proveniência dos resultados é fundamental, isso é feito através de um Dashboard integrado ao portal (Figura 2).
Esta infraestrutura será instalada no National Center for Supercomputing Applications (NCSA) como previsto no acordo entre o LIneA e o NCSA e beneficiará um número ainda maior de usuários.[1]
Este projeto é composto por workflows científicos que permitem analisar:
Este sistema é usado não só para analisar dados reais, mas também dados simulados, para avaliar o desempenho de diferentes algoritmos, e os efeitos de critérios de seleção e de erros sistemáticos.
Embora o desenvolvimento do Portal Científico tenha sido motivado pelas necessidades do DES a infraestrutura é genérica e adaptável a outros projetos e o conhecimento acumulado pela equipe de TI do LIneA permite alavancar o desenvolvimento de soluções para outros projetos.[2][3][4]
O sucesso de projetos como o Quick Reduce levou o projeto Dark Energy Spectroscopic Instrument (DESI) a adotar esta arquitetura para avaliar a qualidade dos 15,000 espectros que serão obtidos em cada exposição. Um acordo entre o LIneA e o projeto DESI foi recentemente assinado para que o LIneA desenvolva este sistema a ser entregue em 2018.
O LIneA assumiu compromisso com o NCSA para a instalação do Portal Científico no NCSA e prevê a integração com o banco de dados do DES para agilizar a etapa de validação dos dados liberados pelo DES que deve ocorrer de forma regular nos próximos 6 anos.[1]
O portal também terá um papel fundamental para o Brazilian Participation Group do LSST já que servirá para o desenvolvimento de algoritmos científicos que permitam a eficiente exploração científica do grande volume de dados que serão gerados continuamente pelo projeto ao longo de 10 anos. O uso de simulações e a experiência sendo adquirida com os dados do DES serão fundamentais para garantir a participação pró-ativa da equipe brasileira.[5][6]