Cópia de segurança ou backup
A cópia de segurança, também chamada de backup, refere-se à cópia dos arquivos físicos ou virtuais ou base de dados para um local secundário para usa preservação em caso de falha do equipamento ou outra catástrofe. O processo de backup é essencial para um plano de recuperação de desastre (DRP) bem-sucedido.
O que são backup e recuperação?
As empresas fazem uma cópia de segurança (backup) dos dados que consideram vulneráveis em caso de defeito de software, dados corrompidos, falha do hardware, pirataria maliciosa (hacking), erros dos usuários ou outros eventos imprevistos. As cópias de segurança capturam e sincronizam um instantâneo point-in-time que, em seguida, é usado para retomar os dados ao seu estado anterior.
Os testes de cópia de segurança e recuperação examinam as práticas e tecnologias de uma organização para segurança e replicação de dados. O objetivo é garantir uma recuperação de dados rápida e confiável em caso de necessidade. O processo de recuperação de arquivos de dados de backup é conhecido como restauração de arquivos.
Os termos cópia de segurança de dados e proteção de dados são, muitas vezes, usados indistintamente, embora a proteção englobe objetivos mais amplos de continuidade empresarial, segurança dos dados, administração do ciclo de vida da informação e prevenção a malwares e vírus.
Que dados devem ser copiados e com que frequência?
Um processo de cópia de segurança é aplicado às bases de dados críticos ou aplicativos de linha de negócios relacionados. O processo é regido por políticas pré-definidas de backup que especificam a frequência com que as cópias de segurança devem ser realizadas e a quantidade de cópias duplicadas (conhecidas como réplicas), assim como os acordos de nível de serviço (SLAs) que estipulam a velocidade com a qual os dados devem ser restaurados.
As melhores práticas sugerem que se deve programar uma cópia de segurança completa dos dados pelo menos uma vez por semana, geralmente aos finais de semana ou fora do horário de trabalho. Para complementar as cópias de segurança completas semanais, as empresas normalmente programam uma série de tarefas de backup de dados incrementais ou diferenciais que só fazem a cópia daqueles que foram alterados desde o último backup completo.
Meios de armazenamento de cópias de segurança
As empresas costumam fazer cópias de dados importantes em dispositivos de backup dedicados ou sistemas de fita magnética. Os sistemas de desduplicação de dados contêm unidades de disco rígido (HDD) e são equipados com software para estabelecer políticas de backup.
Os sistemas de backup de disco para disco apareceram inicialmente como uma alternativa às bibliotecas de unidades de fita magnética. Tanto o disco quanto a fita ainda são usados hoje, e muitas vezes em conjunto.
Conforme o tamanho dos arquivos aumenta, alguns fornecedores de backup lançam dispositivos integrados de proteção de dados para simplificar o processo de cópia de segurança. Um dispositivo de dados embutido é essencialmente um servidor de arquivos equipado com HDD e software de backup desenvolvido pelo fornecedor. Esses dispositivos de armazenamento de dados plug-and-play geralmente incluem funções automatizadas para monitorar a capacidade do disco, armazenamento expansível e bibliotecas de fitas pré-configuradas.
A maioria dos dispositivos de backup baseados em disco permite que as cópias sejam movidas da mídia giratória para fitas magnéticas para uma retenção de longo prazo. Os sistemas de fita magnética ainda são usados como mídia de backup devido ao aumento da densidade da fita e ao aumento dos sistemas de arquivamento de fita linear.
Uma biblioteca de fitas virtuais (VTL, da sigla em inglês) oferece uma opção menos dispendiosa para uma matriz de desduplicação. Uma VTL é um sistema baseado em disco cujo comportamento imita o de uma biblioteca de fita física.
As unidades de estado sólido (SSDs) geralmente não são usados para backup de dados devido a problemas de tecnologia de rede. Alguns provedores de armazenamento incluem SSD como uma ferramenta de armazenamento em cache ou camadas para gerenciar gravações com matrizes (arrays) baseadas em disco. Os dados são inicialmente armazenados em cache no armazenamento flash e, em seguida, gravados no disco.
Backup local vs. backup offline para armazenamento primário
Os sistemas de armazenamento primário modernos evoluíram para oferecer recursos nativos mais fortes para backup de dados. Esses recursos incluem esquemas avançados de proteção RAID, instantâneos ilimitados e ferramentas para replicar instantâneos em uma cópia de segurança secundária ou até mesmo um backup terciário externo. Apesar desses avanços, o backup baseado em armazenamento primário tende a ser mais caro e não tem os recursos de indexação encontrados em produtos de backup tradicionais. A desduplicação de dados, por exemplo, apareceu pela primeira vez nos dispositivos de backup EMC Data Domain, mas está gradualmente se tornando um recurso de referência dos arrays de armazenamento primário de marca.
Os backups locais colocam cópias dos dados em discos rígidos externos ou sistemas de fita magnética, que normalmente estão localizados em ou perto de um data center local. Os dados são transmitidos por uma conexão de rede de banda larga segura ou uma intranet corporativa.
Um dos benefícios do backup local é a capacidade de fazer cópias dos dados através de um firewall de rede. O backup local também é muito mais rápido e oferece maior controle sobre quem pode acessar os dados.
O backup frio ou offline é semelhante ao backup local, embora seja frequentemente associado à cópia de segurança de uma base de dados. Um backup offline gera tempo de inatividade quando se realiza o processo de cópia de segurança enquanto a base de dados está desconectada da sua rede.
Backup e armazenamento em nuvem
Por outro lado, o backup externo transmite cópias de dados para um local remoto, que pode incluir um data center secundário da empresa ou uma instalação de colocation (housing). Cada vez mais, o backup de dados fora da empresa equivale ao armazenamento em nuvem baseado em assinatura como um serviço, fornecendo baixo custo, capacidade escalonável e eliminando a necessidade do cliente de comprar e manter hardwares de backup. Apesar de sua popularidade crescente, a escolha do backup como serviço exige que os usuários criptografem os dados e tomem outras medidas para salvaguardar a integridade das informações.
O backup na nuvem é dividido em:
- Armazenamento em nuvem pública: os usuários enviam dados a um provedor de serviços em nuvem, que cobra uma taxa de assinatura mensal com base no armazenamento consumido. Existem taxas adicionais para entrada e saída de dados. Amazon Web Services (AWS), Google Compute Engine e Microsoft Azure são atualmente os maiores provedores de nuvem pública.
- Armazenamento em nuvem privada: os dados são copiados em servidores diferentes dentro do firewall da empresa, geralmente entre um data center local e um espaço secundário de recuperação de desastres. Por esse motivo, o armazenamento em nuvem privada às vezes é chamado de armazenamento em nuvem interna.
- Armazenamento em nuvem híbrida: quando a empresa usa armazenamento local e externo. As companhias costumam usar o armazenamento em nuvem pública seletivamente para arquivamento de dados e retenção de longo prazo. Já o armazenamento privado é normalmente usado para acesso local e cópia de segurança para um acesso mais rápido aos dados mais críticos.
A maioria dos provedores de backup permite a cópia de segurança das aplicações locais em uma nuvem privada dedicada, tratando de maneira efetiva o backup de dados baseado em nuvem como uma extensão do data center físico do cliente. Também conhecido como recuperação de desastre como serviço (DRaaS), esse campo permite que uma organização alugue espaço em servidores de armazenamento de um provedor de serviços para backup centralizado e gerenciamento da linha de vida dos dados.
O backup de dados de nuvem para nuvem é uma abordagem alternativa que vem ganhando força. Com esse método, os dados de um cliente são copiados de uma plataforma de backup em nuvem para outra nuvem. Também se refere às cópias de segurança baseadas em nuvem de dados armazenados em plataformas de software como serviço (SaaS).
Armazenamento de backup para PCs e dispositivos móveis
Os usuários de PCs podem considerar tanto o backup a partir do disco rígido interno do computador para um disco rígido externo conectado ou mídia removível, quanto uma unidade de disco USB. Outra alternativa para os consumidores é fazer backup de dados em smartphones e tablets para armazenamento em nuvem pessoal, que estão disponíveis em fornecedores como Box, Carbonite, Dropbox, Google Drive, Microsoft OneDrive e outros. Esses serviços são comumente usados para fornecer alguma capacidade gratuita, dando aos consumidores a opção de adquirir armazenamento adicional conforme necessário. Ao contrário do armazenamento em nuvem empresarial, como um serviço, essas ofertas de nuvem baseadas no consumidor geralmente não fornecem o nível de segurança de dados que as empresas exigem.
Fornecedores de software e hardware de backup
Os fornecedores que vendem plataformas de hardware de backup incluem Barracuda Networks, Dell, Drobo, EMC (Data Domain), ExaGrid Systems, Hewlett Packard Enterprise (HPE), Hitachi Vantara (incluindo Sepaton), IBM, NEC Corp., NetApp, Oracle Storage Tek (bibliotecas de fitas), Quantum Corp., Spectra Logic, Unitrends e Veritas NetBackup (anteriormente Symantec NetBackup).
Os principais fornecedores de softwares de backup corporativo incluem Acronis, Arcserve, Asigra, Commvault, Datto, Druva, EMC Data Protection Suite (Avamar, Data Protection Advisor, Mozy, NetWorker e SourceOne), EMC RecoverPoint Replication Manager, Nakivo e Veeam Software.
O sistema operacional Microsoft Windows Server possui, de forma inerente, o Microsoft Resilient File System (Microsoft ReFS) para detectar e reparar automaticamente os dados corrompidos. Embora não seja tecnicamente uma cópia de segurança de dados, o Microsoft ReFS foi projetado para ser uma medida preventiva para proteger os dados do sistema de arquivos de serem corrompidos.
O VMware vSphere fornece um conjunto de ferramentas de backup para proteção de dados, alta disponibilidade e replicação. As APIs VMware vStorage para proteção de dados (VADP) permitem que o VMware ou software de backup de terceiros compatível execute backups completos e incrementais de máquinas virtuais (VMs). O VADP implementa backups por meio de instantâneos baseados em hipervisor. Como um complemento ao backup de dados, o VMware vSphere Live Migration permite que as VMs se movam entre diferentes plataformas para minimizar o impacto de um evento de recuperação de desastre (DR). O VMware Virtual Volumes também ajuda a fazer backup de VMs.
Robôs de backup
Um robô de backup é um dispositivo de armazenamento externo USB 2.0 automatizado que oferece suporte a vários discos rígidos Serial ATA removíveis. A primeira instância de um robô de backup digital foi introduzida por Drobo e, mais tarde, operada como Data Robotics. Em vez de usar um braço robótico para manipular o hardware, o robô de backup formata e distribui automaticamente os dados entre os vários discos rígidos dentro dele, usando a tecnologia de virtualização de armazenamento para fazer backup de cada uma das unidades nos outros discos.
Os recursos de software substituíram, em grande parte, a robótica mecânica nos sistemas de cópia de segurança e arquivos de fita.
Tipos de backup
O backup completo captura uma cópia de um conjunto de dados completo. Embora seja considerado o método de backup mais confiável, executar um backup completo é demorado e requer uma grande quantidade de discos e/ou fitas. A maioria das organizações executa backups completos apenas periodicamente.
O backup incremental é uma alternativa ao backup completo, fazendo cópia de segurança dos dados que foram alterados desde o último backup completo. A desvantagem é que uma restauração completa leva mais tempo se um backup de dados baseado em incremento for usado para recuperação.
O backup diferencial copia os dados que foram alterados desde o último backup completo. Isso permite que uma restauração completa ocorra mais rapidamente, exigindo apenas o último backup completo e o último backup diferencial. Se você criar, por exemplo, um backup completo na segunda-feira, o backup de terça-feira será semelhante a um backup incremental. O backup de quarta-feira, então, faria o backup do diferencial que mudou desde o backup completo de segunda-feira. A desvantagem é que o crescimento progressivo de backups diferenciais tende a afetar negativamente sua janela de backup. Um backup diferencial gera um arquivo combinando uma cópia completa anterior com uma ou mais cópias incrementais criadas posteriormente. O arquivo montado não é uma cópia direta de nenhum arquivo atual ou criado anteriormente, mas é sintetizado a partir do arquivo original e de quaisquer modificações subsequentes nesse arquivo.
O backup completo sintético é uma variação do backup diferencial. Em um backup completo sintético, o servidor de backup produz uma cópia completa adicional, que se baseia no backup completo original e nos dados obtidos de cópias incrementais.
Os backups incrementais contínuos minimizam a janela de backup enquanto fornecem acesso mais rápido à recuperação de dados. Um backup incremental contínuo captura todo o conjunto de dados e depois o complementa com backups incrementais. O suporte de bloco modificado também é conhecido como diferenciação delta. Cópias completas de conjuntos de dados são normalmente armazenadas no servidor de backup, que automatiza a restauração.
Os backups incrementais reversos são mudanças feitas entre duas instâncias de um espelho. Após a execução de um backup completo inicial, cada backup incremental sucessivo aplica todas as alterações ao backup completo existente. Basicamente, isso gera um novo backup completo sintético cada vez que uma mudança incremental é aplicada, ao mesmo tempo que fornece uma reversão para backups completos anteriores.
O backup dinâmico se aplica aos dados que permanecem disponíveis para os usuários enquanto a atualização está em andamento. Este método evita o tempo de inatividade do usuário e perda de produtividade. O risco com o backup ativo é que, se os dados forem modificados enquanto o backup está em andamento, a cópia resultante pode não corresponder ao estado final dos dados.
Técnicas e tecnologias para complementar o backup de dados
A Proteção Contínua de Dados (CDP) refere-se a camadas de tecnologias associadas projetadas para aprimorar a proteção de dados. Um sistema de armazenamento baseado em CDP faz backup de todos os dados da empresa sempre que uma alteração é feita. As ferramentas CDP permitem que você crie várias cópias de dados. Muitos sistemas de proteção contínua de dados contêm um mecanismo integrado que replica dados de um servidor de backup primário para secundário e/ou promove o armazenamento baseado em fita. O backup de disco para disco para fita é uma arquitetura popular para sistemas CDP.
O sistema CDP quase contínuo tira instantâneos de backup quase continuamente em intervalos definidos, que são diferentes dos instantâneos do provedor com base em array que são tirados cada vez que novos dados são gravados no armazenamento.
A redução de dados diminui sua pegada de armazenamento. Existem dois métodos principais: compactação de dados e desduplicação de dados. Esses métodos podem ser usados individualmente, mas os provedores geralmente combinam as abordagens. A redução do tamanho dos dados tem implicações nas janelas de backup e nos tempos de restauração.
A clonagem de discos envolve copiar o conteúdo do disco rígido de um computador, salvá-lo como um arquivo de imagem e transferi-lo para uma mídia de armazenamento. A clonagem de discos pode ser usada para provisionamento, provisionamento do sistema, recuperação do sistema e reinicialização ou retorno de um sistema à sua configuração original.
O código de exclusão, também conhecido como correção direta de erros, evoluiu como uma alternativa escalonável aos sistemas RAID tradicionais. A codificação de apagamento está mais frequentemente associada ao armazenamento de objetos. O RAID distribui gravações de dados em várias unidades, usando uma unidade de paridade para garantir redundância e capacidade de recuperação (resiliência). A tecnologia divide os dados em fragmentos e os codifica com outros bits de dados redundantes. Esses pedaços codificados são armazenados em diferentes mídias de armazenamento, localizações geográficas ou nós. Os fragmentos associados são usados para reconstruir dados corrompidos, usando uma técnica conhecida como sobreamostragem (oversampling).
O backup simples é um esquema de proteção de dados no qual uma cópia direta de um instantâneo é movida para um armazenamento de baixo custo sem o uso de um software de backup tradicional. O instantâneo original retém seu formato e localização nativos; a réplica de parte traseira plana é montada, caso o original esteja indisponível ou inutilizável.
A duplicação, ou espelhamento (mirroring), coloca os arquivos de dados em mais de um servidor de computação para garantir que permaneça acessível aos usuários. No espelhamento síncrono, os dados são gravados no disco local e remoto simultaneamente. As gravações do armazenamento local não são reconhecidas até que uma confirmação seja enviada do armazenamento remoto, garantindo que os dois sites tenham uma cópia de dados idêntica. Por outro lado, as gravações locais assíncronas são consideradas concluídas antes que a confirmação seja enviada do servidor remoto.
A replicação permite que os usuários selecionem o número necessário de réplicas ou cópias dos dados necessários para manter ou retomar as operações de negócios. A replicação de dados copia os dados de um local para outro, fornecendo uma cópia atualizada para acelerar a recuperação de desastres.
A recuperação no local, ou recuperação instantânea, permite que os usuários executem temporariamente um aplicativo de produção diretamente de uma instância de máquina virtual (VM) de backup, mantendo assim a disponibilidade dos dados enquanto restauram a VM principal. Montar uma instância de máquina física ou virtual diretamente em um servidor de backup ou mídia pode acelerar a recuperação do nível do sistema em minutos. A recuperação de uma imagem montada resulta em degradação do desempenho, pois os servidores de backup não são dimensionados para cargas de trabalho de produção.
Os instantâneos de armazenamento capturam um conjunto de marcadores de referência no disco para um determinado banco de dados, arquivo ou volume de armazenamento. Os usuários se baseiam nos marcadores, ou ponteiros, para restaurar os dados a partir de um determinado ponto. Por ser derivado de um volume de origem subjacente, um único instantâneo de armazenamento é uma instância, não um backup completo. Assim, os instantâneos não protegem os dados contra falhas de hardware.
Os instantâneos são geralmente agrupados em três categorias: bloco modificado, clones e CDP. Os instantâneos apareceram pela primeira vez como uma ferramenta de gerenciamento dentro de uma matriz de armazenamento. O advento da virtualização adicionou instantâneos baseados em hipervisor. Os instantâneos também podem ser implementados usando software de backup ou até mesmo por meio de uma máquina virtual.
Gerenciamento de cópia de dados, sincronização e compartilhamento de arquivos
Tangencialmente relacionado ao backup está o gerenciamento de cópia de dados (CDM). Este é um software que fornece informações sobre as várias cópias de dados que uma empresa pode criar. Permite que grupos distintos de usuários trabalhem a partir de uma cópia de dados comum. Embora não seja tecnicamente uma tecnologia de backup, o CDM permite que as empresas gerenciem cópias de dados com eficiência, identificando cópias supérfluas ou subutilizadas, reduzindo a capacidade de armazenamento de backup e as janelas de cópias de segurança.
As ferramentas de sincronização e compartilhamento de arquivos protegem os dados em dispositivos móveis usados pelos funcionários. Essas ferramentas basicamente copiam arquivos de usuário modificados entre dispositivos móveis. Embora proteja os arquivos de dados, elas não permitem que os usuários retrocedam a determinado ponto no tempo no caso de falha do dispositivo.
Backup de dados: variações de um só tema
Ao decidir que tipo de backup usar, você deve levar em conta várias considerações importantes. Não é incomum que uma empresa mescle várias abordagens de backup de dados, de acordo com as suas necessidades de informação. Sua estratégia de backup deve ser regida pelos acordos de nível de serviço (SLAs) de uma aplicação, pela relação acesso/disponibilidade de dados, pelos objetivos de tempo de recuperação (RTO) e pelas metas de ponto de recuperação (RPO). Sua escolha também será influenciada pela versatilidade de sua aplicação de backup.