Edge computing pode ser um cache de dados para nuvens públicas
Melhor desempenho e confiabilidade, custos mais baixos e maior segurança fazem com que valha a pena manter essa arquitetura na caixa de ferramentas
Um cache de dados (ou banco de dados) é uma camada de armazenamento de dados de alto desempenho que armazena um subconjunto de dados temporários para que as solicitações futuras desses dados sejam fornecidas mais rapidamente do que acessando o local de armazenamento primário dos dados. No mundo da edge computing, os “dados primários” residem na nuvem pública e o dispositivo de borda é de alguma forma um intermediário desses dados, às vezes fornecendo processamento de dados desacoplado.
Já entendemos o uso de dispositivos de borda como pontos de processamento de dados que estão mais próximos do produtor dos dados. A principal vantagem aqui é o desempenho.
Se os dados não precisam ser enviados para sistemas de processamento de back-end, como em nuvens públicas, eles podem ser processados imediatamente no dispositivo de borda. Isso é útil quando o desempenho pode ser crítico, como desligar um motor a jato que está superaquecendo drasticamente. Você não quer verificar com um sistema de nuvem centralizado para determinar um curso de ação para isso.
Claro, essa é apenas uma arquitetura, que eu chamo de particionamento de borda ou camadas. É quando você divide o processamento e alguns dados são executados entre o dispositivo de borda, um sistema centralizado e armazenamento de dados que normalmente são executados em uma nuvem pública.
Outra abordagem para a arquitetura de borda vem da noção de que um dispositivo de borda também pode servir como um cache de dados remoto. Isso é um pouco diferente do particionamento; uma partição tem seu próprio banco de dados ou armazenamento de dados independente, bem como processamento desacoplado que ocorre nesses dados. Um cache de dados é simplesmente um armazenamento intermediário para dados normalmente armazenados centralmente. O único propósito do cache de dados é fornecer melhor desempenho e confiabilidade.
Por exemplo, digamos que você tenha um dispositivo de borda que controla um robô de fábrica. Ele está conectado a um mecanismo de processamento e dados centralizado hospedado em uma nuvem pública. Nesse caso, o dispositivo de borda conta com o sistema centralizado para a produção e consumo de dados, bem como para prover o processamento desses dados.
Embora o dispositivo de borda que controla seu robô de fábrica não tenha um banco de dados ou armazenamento de dados independente, ele hospeda um cache de dados. Os dados mais acessados são armazenados localmente e podem ser acessados diretamente pelo dispositivo de borda com quase nenhuma latência.
Isso é útil quando a rede na fábrica não é confiável. No entanto, não há um requisito básico de bancos de dados completos existentes nos dispositivos de borda para este caso de uso específico.
A vantagem aqui é o menor custo de operações e armazenamento de borda. Ao decidir não colocar um banco de dados desacoplado no dispositivo de borda, você não precisa manter esse banco de dados ou se preocupar com problemas de sincronização com o banco de dados centralizado. Além disso, os dispositivos de borda podem ser muito menores e mais baratos – algo para se pensar se você estiver implantando milhares deles.
A segurança também é muito mais fácil. Se você estiver armazenando dados centralmente, pode se concentrar na segurança lá. Isso não significa que o sistema de cache deva ser exposto, mas é muito mais fácil de lidar do que um banco de dados completo com mais vetores de ataque.
A ideia principal aqui é a otimização. Usar a borda de maneira diferente, como aproveitar caches de dados nesses dispositivos de borda, faz sentido quando você pode economizar dinheiro e tempo, além de reduzir riscos. Nem sempre é a arquitetura certa, mas é outra ferramenta para garantir que você está fazendo o melhor para atender aos negócios.