Com Google Cloud, Cria quer expandir uso de dados sobre biodiversidade
Migração de sistemas e dados do Centro de Referência em Informação Ambiental para a nuvem abre perspectivas para além da academia
O Centro de Referência em Informação Ambiental, ou simplesmente Cria, é um dos maiores repositórios de dados acadêmicos sobre a biodiversidade brasileira. Trata-se de um acervo com 16 milhões de registros de espécies da fauna e da flora brasileiras e sul-americanas, com 5 milhões de imagens – tudo isso coletado por 200 instituições ao longo de 20 anos.
Essa grande coleção, que ocupa cerca de 40 terabytes de dados, está disponível ao público por meio de um sistema, o speciesLink, que integra dados de coleções construídas por uma rede de pesquisadores do Brasil e do exterior. Agora, em parte graças a um projeto de cooperação com o Google Cloud, o centro quer alavancar projetos maiores de democratização, se tornando acessível a qualquer pessoa ou organização interessada e fomentando projetos de pesquisa e educação, além de políticas públicas.
O projeto faz parte de uma série de iniciativas anunciadas pelo Google na semana passada, durante o evento Google for Brasil, realizado em São Paulo. A meta, segundo a empresa, é apoiar organizações que trabalham pela preservação do meio ambiente e do desenvolvimento sustentável, seja disseminando conhecimento científico sobre a biodiversidade e as mudanças climáticas, ou promovendo o uso inteligente de recursos naturais.
Segundo Dora Canhos, diretora de projetos do Cria, em entrevista exclusiva ao IT Forum, dados e sistemas do centro estavam armazenados em um data center próprio, montado a partir de doações e operadora pela Rede Nacional de Pesquisa, a RNP. Com sua descontinuidade, a instituição se deparou com um prazo de seis meses para transferir dados e sistemas para um novo ambiente.
Leia também: Google expande iniciativas de capacitação inclusiva no Brasil
“É um acervo de 20 anos, um legado bastante grande”, explicou Sidnei de Souza, diretor de informática do Cria. “Foi incrível [a migração]. Saímos do nosso CPD montado há muito tempo para começar a trabalhar em nuvem em um ambiente completamente diferente, com novos recursos. Foi um desafio enorme.”
Na parceria, o Google cede gratuitamente créditos para a instituição utilize sua nuvem, tanto para armazenar dados como para rodar o sistema de acesso. O projeto contou com consultoria e capacitação do próprio Google, uma vez que os técnicos do Cria não detinham conhecimento sobre a plataforma.
Também porque os sistemas legados, principalmente de tratamento de imagens, eram proprietários e precisaram ser migrados para padrões abertos – o que exigiu inclusive a escrita de novos códigos. Segundo Sidnei, foi um enorme desafio, mas fundamental, porque o acervo do Centro é fundamental tanto na identificação de novas espécies como pela preservação de biomas.
Ampliação de acesso
“Agora estamos trabalhando na disponibilização disso [do acervo] de forma totalmente pública, externa aos nossos sistemas. Com a possibilidade de ir para o Google Datasets, disponível para quem quiser”, diz o diretor de informática.
Segundo Dora Canhos, apesar de livre e aberto a qualquer pessoa interessada, atualmente os dados disponíveis via speciesLink são mais acessados principalmente por membros da academia e formuladores de políticas públicas. Mas a ideia é possibilitar que outras pessoas utilizem os dados para novas aplicações, principalmente em educação – mas também na indústria.
“[A migração] Está mexendo com a nossa cabeça”, diz Dora, empolgada com as possibilidades de aplicação. Isso inclui possíveis usos por parte da iniciativa privada, muito embora ainda não se saiba “que perguntas eles têm e se temos as respostas”. “Como estávamos muito enfurnados no meio acadêmico, agora que está abrindo.”
Segundo Sidnei, há uma série de ideias que o Centro nunca teve recursos para desenvolver, e agora podem ser pensados de forma mais séria.
Preservação de dados
Segundo Marco Bravo, líder para o Brasil do Google Cloud, o projeto chamou a atenção da empresa por uma série de fatores. O primeiro deles é a riqueza do mapeamento digital de grande parte do bioma brasileiro e o risco de se perder tudo isso em uma estrutura obsoleta.
“Isso era preocupante”, ressaltou o executivo durante conversa com as lideranças do Cria. Segundo ele, está na missão do próprio Google organizar os dados e torná-los públicos e acessíveis. “Nos enxergamos valor nisso. Se você cruza essas informações pode tirar mais valor. Essa é mais uma fonte que vai gerar valor.”
“Também é a questão de trazer informação, educação, fazer mais pessoas refletirem sobre a biodiversidade que existe”, ponderou Maia Mau, head de marketing de produtos do Google para a América Latina e colíder do comitê de sustentabilidade da empresa. “A gente também quer não só ter um amplo e profundo estudo desse material, mas também divulgar e fazer as pessoas refletirem.”
Outras iniciativas
O Google também anunciou, durante o Google for Brasil, uma doação de R$ 2,4 milhões para a The Nature Conservancy (TNC).
A doação será dividida em duas partes: R$ 1,2 milhão em recursos financeiros destinados à pesquisa e desenvolvimento de soluções de proteção da biodiversidade na Amazônia e combate às mudanças climáticas. O projeto terá participação de engenheiros do Google e de tecnologias de computação avançada.
A outra metade será oferecida como crédito de anúncios (ad grants) para campanhas relacionadas às ações da TNC.
Além disso, o Google lançou uma experiência de topo do buscador para quando as pessoas buscam termos como “mudanças climáticas” e “aquecimento global”. Um painel no topo dos resultados passa a mostrar informações sobre causas e efeitos do aquecimento global com imagens e links para fontes confiáveis, incluindo notícias, vídeos e ações recomendadas por especialistas e pela Organização das Nações Unidas (ONU).