Encontre a forma correta de arquivar os dados

Author Photo
8:09 am - 12 de dezembro de 2012

Em quase todos os estudos que fiz e vi, um fato permanece consistente: pelo menos 75% dos dados que são arquivados no armazenamento primário não foram acessados por mais de um ano. Esses dados realmente devem ser arquivado. Produtos que movem esses dados de forma transparente para um arquivo têm melhorado drasticamente nos últimos anos, e por isso essa pode ser a hora de reconsiderar o arquivamento de dados.

Backup como arquivo

Embora não seja o local ideal, o backup é o arquivo para muitas empresas. Os puritanos do armazenamento não vão concordar comigo, mas acredito que os produtos de backup podem, em alguns casos, resolver a necessidade de arquivamento, especialmente para empresas que não precisam cumprir regulamentações governamentais ou outros requisitos de retenção de dados. O backup também pode ser a forma mais realista de arquivar dados, já que a maioria das empresas já está fazendo isso. Como já discutido neste artigo, muitas organizações contam com apoios de longo prazo de retenção de dados em vez de usar um produto para arquivo separado.

Uma razão para que o arquivamento em backup tenha ganhado legitimidade é que os softwares de backup podem agora criar maiores tabelas de metadados (dados sobre os dados no backup) e podem pesquisar melhor os dados. Alguns produtos oferecer recursos de pesquisa de conteúdo. As melhorias na escalabilidade dos produtos de backup são outra razão para adotar a abordagem de backup como arquivo, pois se tornou mais prático do que tem sido.

O fator limitante para produtos de backup de disco não tem sido quantos discos eles podem adicionar à plataforma, mas até onde vão a sua escala de desduplicação de tabelas. Esta é outra questão de metadados. Uma abordagem que tenho observado de alguns fabricantes tomando é segmentar suas mesas de desduplicação em várias tabelas com ?as idades? dos dados. Isso diminui a eficácia do processo de remover as cópias, mas permite um armazenamento mais longo, sem afetar o desempenho do backup atual. Eventualmente, porém, os motores de desduplicação terão de ser melhorados a fim de escalar.

Uma coisa que normalmente não vemos no método de backup como arquivo é o problema citado acima: remoção de dados de armazenamento primário. Backup-como-arquivo é melhor para as empresas que estão menos preocupados com a quantidade de dados que estão armazenando no storage primário e, principalmente, que necessitam de uma forma de reter informações para o caso de precisar deles mais tarde.

?Arquivamento como arquivamento?

Devido ao backup de longo prazo ter se tornado cada vez mais viável, soluções de arquivamento passaram a adotar uma abordagem diferente. Assim como soluções que movem dados do armazenamento principal para armazenamento de arquivos estão melhorando, a habilidade para navegar o arquivo independentemente de um aplicativo específico também está.
A chave para o sucesso do arquivamento é movê-lo como montante, onde pode desempenhar um papel mais ativo no armazenamento primário. Por causa do alto nível de transparência e do tempo de recuperação rápida, o arquivamento de dados após 90 dias de inatividade provavelmente não têm impacto sobre a produtividade – e máximo impacto na redução de custos.

Há muito que ganhar na remoção de 75% ou mais de seus dados de armazenamento primário: backups ficarão mais rápidos e os investimentos em maior velocidade de armazenamento (SSD) para os dados restantes podem ser justificados. A integridade dos dados também irá melhorar já que a maioria das soluções de arquivo em curso realizam verificações de integridade de dados, protegendo-os da corrupção silenciosa (bit rot).

Newsletter de tecnologia para você

Os melhores conteúdos do IT Forum na sua caixa de entrada.