Reduzir custos com cloud pela deduplicação de dados

Share on facebook
Share on google
Share on twitter
Share on linkedin

Tempo estimado para a leitura: 12 minuto(s)

Deduplicacao de Dados em Cloud Computing

Reduzir custos com cloud pela deduplicação de dados é uma estratégia assertiva já que a maioria dos serviços de cloud relacionados a armazenamento cobram pelo espaço ocupado ou provisionado.

Eliminação de dados?

A deduplicação, ou eliminação de duplicação, de dados é uma funcionalidade para a eliminação de dados duplicados que permite a economia no uso de espaço de armazenamento e também no tráfego de rede. Como será visto adiante, não se trata de eliminar arquivos duplicados e sim a remoção de informações que se repetem muitas vezes entre os dados.

O recurso está disponível em sistemas de storages, apliances de rede, sistemas de backup, aplicativos ou em sistemas operacionais como o Windows Server e Linux.

O post de hoje do blog da Computer vai apenas apresentar a deduplicação em cargas de trabalho na nuvem baseadas em sistemas Windows e Linux.

Dá para reduzir custos com cloud pela deduplicação de dados?

Pode ser estratégico utilizar a deduplicação de dados em cargas de trabalho em cloud pela economia de custos que pode proporcionar, principalmente quando há grandes conjuntos de dados porque estes tendem a apresentar elevada duplicação.

Pense no seguinte: se possui uma carga de trabalho onde paga por cada gigabyte armazenado uma economia típica de 50 a 60% seguramente vai ser significativo. E se já paga por um espaço provisionado, uma economia semelhante pode ser obtida na medida em que consegue armazenar mais informações no mesmo espaço provisionado.

Observe que é possível obter economia de espaço não apenas com dados duplicados mas também com dados apenas semelhantes. Basta que compartilhem muitos padrões comuns. Além disso padrões que se repetem dentro de um mesmo arquivo também são critérios para otimização de espaço.

Portanto, o objetivo não é eliminar arquivos duplicados e, sim, remover os padrões repetidos.

Deduplicação de dados em cargas de trabalho Windows

Em cargas de trabalho baseadas em Windows Server como instâncias de máquinas virtuais do Google Cloud, EC2 da Amazon, da Azure e etc, é possível, dependendo do tipo de informação armazenada, uma redução de espaço que pode chegar a 80% ou até mais permitindo significativa redução de custos com cloud pela deduplicação de dados.

A funcionalidade está disponível a partir do Windows 2012R2 e consiste em:

Analisar cada arquivo e dividi-lo em partes com tamanhos variáveis.

Identificar os padrões comuns entre os dados e eliminar a duplicação desses padrões.

Guardar as partes exclusivas num repositório de partes;

Permitir o acesso aos dados através de um filtro numa camada sobre o sistema de arquivos.

Além disso utiliza a estratégia de pós-processamento, ou seja, todos os dados são gravados sem a otimização que ocorrerá posteriormente garantindo, com isso, que o desempenho do sistema de arquivos não seja influenciado.

Todo o trabalho de eliminação de duplicações nos dados é realizado de modo transparente para o cliente (usuário ou aplicação) que acessa seus dados.

A deduplicação de dados em cargas de trabalho Windows pode beneficiar várias modalidades de serviços entre elas Servidores de Aplicação, servidores de arquivos e sistemas de backup.

Deduplicação de dados em cargas de trabalho Linux

Diversas implementações de deduplicação de dados em cargas de trabalho Linux estão disponível atualmente. As mais conhecidas, como LessFS, Opendedup SDFS e Redhat VDO, utilizam a deduplicação de dados in-line que ocorre no momento da gravação dos dados com um sistema de arquivos especializado ou numa camada abaixo do sistema de arquivos.

A deduplicação de dados em cargas de trabalho Linux de modo in-line pode afetar o desempenho da carga de trabalho, mas de forma mínima, enquanto a economia de espeço pode ser muito expressiva.

A implementação da deduplicação de dados em cargas de trabalho Linux em produção não é tão simples. Por outro lado, como estamos falamos de cargas de trabalho na nuvem, a dificuldade pode ser mitigada e as janelas de down time muito menores.

Assim como ocorre com o Windows Server, a deduplicação de dados em cargas de trabalho Linux pode ser grande aliada para reduzir os custos com cloud para servidores de aplicação, servidores de arquivos compartilhados, contêineres, sistemas de backup, entre outros.

Conclusão

A redução nos custos recorrentes com a nuvem pode ser significativa com otimizações no armazenamento.

Portanto, vale a pena avaliar como reduzir os custos com cloud pela deduplicação de dados em suas cargas de trabalho.

A Computer Consulting é uma empresa com mais de 20 anos no mercado. Consultoria AWS parceira especializada em Cloud Computing, Linux e Cibersegurança.

Deixe seu comentário

Computer Consulting

Hoje em dia temos o orgulho de ter ajudado várias empresas a tirar da frente entraves de TI para melhorar sua produtividade.

Posts recentes

Contate-nos