Fitas cassetes ajudam a reduzir custo do Big Data

Author Photo
10:04 am - 26 de outubro de 2012

Uma nova tecnologia está a caminho para resgatar o armazenamento privado de Big Data, assim que conseguir se libertar dos rádios gravadores dos anos 70 e dos walkmans Sony. As fitas cassetes, que estão sendo produzidas como protótipos para a instalação com o maior telescópio do mundo, são capazes de armazenar até 35 terabytes em um único cartucho, segundo uma reportagem da revista New Scientist deste mês.

Assine a Newsletter do IT Web

Siga o IT Web no Twitter

Curta, no Facebook, a Fan Page do IT Web

Os cassetes, na verdade, são adaptações da tecnologia desenvolvida em 2010 como um avanço das fitas de armazenamento magnético Linear Tape-Open (LTO), da IBM, que é a base média para o sistema de armazenamento System Storage Tape Library. As versões de última geração do sistema são capazes de armazenar apenas 4TB por cartucho, ou 12TB no maior nível de compressão de dados.

O segredo está na fita e no revestimento projetado para protegê-la, produzido pela Fuji Film, como parte de um projeto de desenvolvimento com a IBM em 2010. A fita de alta capacidade é revestida com nanopartículas de ferrita de bário, que estabiliza os meios de armazenamento magnético ao evitar que a umidade e a oxidação (ferrugem) danifiquem a superfície da fita.

As duas empresas anunciaram a fita em 2010,juntamente com a alegação de que poderia armazenar 44 vezes mais dados por polegada quadrada do que as de armazenamento magnético padrão de terceira geração LTO. A IBM está adaptando a fita e os cartuchos para o Square Kilometre Array (SKA), que será o maior telescópio do mundo, quando começar a funcionar, em 2024. Os diretores do SKA esperam que a matriz recolha dados cósmicos suficientes para chegar a um petabyte completo por dia após os dados serem compactados. Sem compactação, os dados podem chegar a dez exabytes de armazenamento por dia.

Utilizando o lançamento mais comum, as fitas LTO de quinta geração de 3 TB, isso encheria 330 cartuchos por dia, 120 mil por ano, segundo a New Scientist. Até chegar o momento que o SKA realmente precisar da fita, a IBM terá elevado a capacidade de cada cartucho para 100 TB por meio do estreitamento das faixas no qual seu sistema coloca os dados na fita, e construindo controles superprecisos para os cabeçotes que escrevem os dados.

Os cartuchos de alta capacidade estão sendo desenvolvidos no laboratório da IBM em Zurique, que também trabalha com tecnologias de armazenamento menos retrôs, como chips de memória tridimensionais que empilham componentes um sobre os outros para reduzir o tempo que leva para os dados viajarem através deles.

Facilidade e preço

É muito mais fácil ? e barato ? adaptar a tecnologia existente de fitas para aumentar radicalmente sua capacidade do que investir em algo completamente novo, afirmou  Evangelos Eleftheriou, gerente de desenvolvimento de armazenamento do laboratório, que dirige o projeto de fita do SKA. A grande desvantagem da abordagem é que elas são lineares, forçando as unidades de controle de armazenamento a escanear por todo o seu comprimento, para achar um bit específico de dado, declarou Eleftheriou. É possível evitar essa latência com sistemas que são agressivos sobre a previsão dos dados que serão necessários e movê-los de uma fita para um disco ou memória de sistema antes da entrega das informações.

Ainda assim, na faixa de capacidade esperada do SKA ? ou, em menor grau, como os projetos de análise corporativa de Big Data ? a densidade de dados ultra-alta sozinha não será o suficiente para evitar que a empresa se afogue em suas próprias informações. Para evitar que o SKA armazene os dez petabytes de dados que gerará a cada segundo de suas operações, poderosas ferramentas de análise e processadores terão que filtrar os dados inúteis, eliminar aqueles nos quais a qualidade não esteja boa, e compactar o resultado ao ponto que as fitas contenham algo em torno de metade ou um sexto das informações coletadas pelo telescópio, explicou Eleftheriou para o ComputerWeekly.

É improvável que mesmo os maiores usuários e mais entusiastas de Big Data abordarão o tipo de capacidade que a equipe de TI do SKA terá que lidar no dia a dia. Mas é provável que toda empresa que armazena Big Data on-premise, procurará alternativas de alta capacidade e baixo custo, afirmou Dan Woods, ex- CTO da TheStreet.com e CapitalThinking, e um analista da CITOResearch.com. ?Uma solução madura para armazenamento Big Data permitirá que os dados residam em camadas e que graciosamente migrem de uma a outra, conforme exigido?, escreveu Wood para a Forbes.

A fita são bem conhecidas pelo baixo custo em relação à capacidade que têm, e estáveis para o armazenamento de longo prazo que ainda são uma opção para alguns tipos de armazenamento, explicou Elefthriou. Mas aqueles interessados na nova abordagem da IBM para o armazenamento de alta capacidade dos cassetes revestidos terão de esperar. Ainda demora para ser um produto SKA, e demorará mais ainda para chegar ao resto da indústria.

Tradução: Alba Milena, especial para o IT Web | Revisão: Adriele Marchesini

Saiba mais:

IBM produzirá telescópio espacial SKA

Big Data x Relevant Data: explosão de dados migra para filtro de relevâncias

Newsletter de tecnologia para você

Os melhores conteúdos do IT Forum na sua caixa de entrada.