All Rights ReservedView Non-AMP Version
IT Forum
  • Homepage
  • Notícias
Categories: Notícias

Desduplicação no storage esconde riscos

Eu frequentemente sou solicitado para rankear capacidades de desduplicação de fabricantes de storage primário. Este é um ambiente perigoso e, claramente, subjetivo. Mas eu posso fornecer algumas ideias de como medir as habilidades de cada fornecedor , de forma que você possa pesar essas ideias em ordem de importância para o seu data center. Primeiro, no entanto, precisamos  discutir os riscos de desduplicação.

Assine a Newsletter do IT Web

As melhores notícias de tecnologia B2B
Acompanhe todas as novidades diretamente na sua caixa de entrada

Siga o IT Web no Twitter

Curta, no Facebook, a Fan Page do IT Web

 

Toda a desduplicação de dados traz algum risco. A tecnologia trabalha por segmentação de entrada de dados e criando uma ID para cada segmento. Essas IDs são, então, comparadas com outras IDs. Se há uma redundância, esse dado sobreposto não é armazenado – no entanto, é estabelecido uma ligação entre o segmento original, o que resulta na economia de capacidade.

Todas as IDs são armazenadas em uma tabela de metadados. Essa tabela é essencialmente um roadmap, mostrando quais segmentos pertencem a cada dado e podem ser reorganizados quando solicitados. Se esta tabela está, de alguma forma, corrompida, você praticamente perde o mapa de seus dados. Apesar de o mapa ainda estar lá, você não consegue acessá-lo – pelo menos não tão facilmente.

O tamanho das tabelas de metadados é uma preocupação dos sistemas de desduplicação. Cada novo segmento representa a entrada de uma nova tabela, e cada segmento redundante representa como o ramo de uma árvore. O tamanho da tabela pode causar problemas, especificamente quando você considera acelerar o acesso ou sua atualização.

Pense na tabela de metadados como uma base de dados relativamente simples que precisa estar apta a ser atualizada e pesquisada de forma rápida. Isso é especialmente importante em armazenamento primário porque você não quer que o desempenho seja impactado enquanto a tabela está sendo pesquisada para encontrar redundância. Para evitar esse problema, a maior parte dos fabricantes insere as tabelas em RAM.

No entanto, no caso de um grande sistema de storage primário que embarca dúzias  – ou até mesmo centenas – de terabytes de informação, a tabela inteira simplesmente não cabe na memória. Para evitar esse problema, a tabela é dividida entre RAM e disco.

O problema é que um processo de desduplicação não é amigável ao sistema de cache, onde um método first-in first-out de usar RAM iria gerar taxas viáveis de acerto. Para solucionar isso, alguns fabricantes desenvolvem suas tabelas em flash, outros processam a desduplicação como parte de um processo não realizado em tempo real, em vez de performar a função em tempo real.

Next Justin Bieber e as lições de big data da Universal Music »
Previous « Para especialista em usabilidade, interface do Windows 8 decepciona
Share
Published by
Editorial IT Forum 365
14 anos ago

    Related Post

  • Lula defende regulação da IA no G7 e destaca posição do Brasil
  • China pressiona por regras globais de segurança em IA durante reunião do G7
  • SpaceX supera Amazon em valor de mercado após disparada das ações pós-IPO

Recent Posts

  • Notícias

HPE firma aliança com 8 empresas para avançar em computação quântica híbrida

A computação quântica ainda não tem aplicação comercial em escala. A Hewlett Packard Enterprise (HPE)…

9 horas ago
  • Notícias

China pressiona por regras globais de segurança em IA durante reunião do G7

A China voltou a defender a criação de mecanismos internacionais de governança para inteligência artificial…

11 horas ago
  • Notícias

SpaceX supera Amazon em valor de mercado após disparada das ações pós-IPO

A SpaceX alcançou um marco importante e histórico poucos dias após sua estreia na bolsa…

12 horas ago
  • Notícias

IA é estratégica para 99% das empresas, mas avanço ainda esbarra em maturidade e orçamento

A inteligência artificial já entrou no radar estratégico das empresas brasileiras, mas sua adoção ainda…

13 horas ago
  • Notícias

Para Domingos Bruno, o CIO do futuro deve priorizar comunicação e gestão de pessoas antes mesmo de falar de tecnologia

Na visão de Domingos Bruno, especialista do IT Forum Inteligência, o CIO do futuro não…

13 horas ago
  • Notícias

Lula defende regulação da IA no G7 e destaca posição do Brasil

O presidente Luiz Inácio Lula da Silva apresentou a posição brasileira sobre governança digital e inteligência…

13 horas ago
All Rights ReservedView Non-AMP Version
  • L