O mundo está, cada vez mais, inundado de dados não estruturados, em formatos diversos como mensagens instantâneas,
e-mails, publicações em redes sociais documentos, planilhas, gráficos, imagens e vídeos.
Para os
gerentes de TI, o crescimento da quantidade de dados não estruturados vem se tornando um desafio. Manter os
dados prontamente disponíveis para atender as necessidades das áreas de negócio e os requisitos de conformidade e governança pode ser trabalhoso e caro. Os sistemas tradicionais de
gerenciamento de armazenamento de arquivos, como armazenamento de
conexão com a rede ou NAS, têm se revelado inadequados. A
previsão é que o crescimento de dados desestruturados continue
aumentando – estima-se que a taxa de crescimento anual composta exceda
os 60% – e, por essa razão, os gerentes de armazenamento estão
buscando novas maneiras de lidar com a questão. Uma alternativa é, sem dúvida, o armazenamento de objetos, que surgiu como uma alternativa aos bancos de dados relacionais.
Em 2012, 1.300.000 milhões de objetos foram armazenados no serviço Amazon Simple Storage Service (Amazon S3), o maior sistema de armazenamento de objetos do mundo.
Na época, esse número crescia rápido, mais de 1 bilhão de objetos
por dia. Por isso, a marca de 2 trilhões de objetos está bem próxima.
O sistema de armazenamento de objetos é muito mais escalável do que os tradicionais sistemas de armazenamento de arquivos, porque é muito mais simples.
Em vez de organizar os arquivos em uma hierarquia de diretórios, os
sistemas de armazenamento de objetos armazenam arquivos em uma
organização plana de recipientes (chamados de “baldes” no Amazon S3) e
utilizam IDs exclusivas (chamados de “chaves” no S3) para recuperá-los.
O resultado é que os sistemas de armazenamento de objetos exigem menos
metadados que os sistemas de arquivos para armazenar e acessar os dados, e
reduzem a sobrecarga de gerenciamento de arquivos de metadados , armazenando os metadados com o objeto.
A confiabilidade é alcançada em hardware comum e a replicação de objetos em unidades de disco de várias máquinas locais e servidores. Se você configurar sua própria solução, como o Swift OpenStack , você pode configurar o número de zonas de armazenamento e réplicas para atender às suas necessidades.
Finalmente, a interface HTTP
permite o acesso rápido e fácil a arquivos por usuários de qualquer
lugar do mundo.
(Por exemplo, todos os arquivos no Amazon S3 tem uma URL única com base
na localização da Amazon, o nome do balde, e o nome do arquivo: https://s3-us-west-1.amazonaws.com/objectstorage1/ object_storage.rtf .) Você pode esperar mais tempo do que no acesso a um arquivo NAS, é claro, mas vai ganhar em conveniência.
Apesar da taxa de transferência significativamente mais lenta, comparada a de um sistema tradicional de arquivos, outra
grande desvantagem do armazenamento de objetos é que a consistência dos dados é
conseguida apenas eventualmente.
Sempre que você atualizar um arquivo, você pode ter que esperar até que
a mudança seja propagada para todas as réplicas antes de solicitações retornarem a versão mais recente. Isso faz com que armazenamento de objetos inadequado para dados que mudam frequentemente.
Mas é uma grande solução para todos os dados que não mudam muito, como
backups, arquivos de vídeos e arquivos de áudio e imagens de máquinas
virtuais.
SpaceX, Anthropic e OpenAI estão no radar de Wall Street para possíveis aberturas de capital…
por Eduardo Honorato Falar sobre infraestruturas críticas na Era Digital tem sua própria complexidade dentro…
A adoção de inteligência artificial (IA) nas empresas não depende apenas da disponibilidade de ferramentas.…
A Cohesity anunciou a concessão da Patente Nº 12.619.501 pelo Escritório de Patentes e Marcas…
Diogo Cortiz, professor da PUC-SP e doutor em Tecnologias da Inteligência e Design Digital, tem…
DJ Sampath chegou aos Estados Unidos há 30 anos com oito dólares no bolso e…