Nos últimos anos, com o surgimento da virtualização e, mais recentemente, com Big data (manipulação de grandes volumes de dados) surgiram variantes de soluções existentes, cobrindo novas necessidades, proporcionando capacidades de armazenamento ainda maiores e maior redundância. Alguns exemplos seriam o mesh ou armazenamento modular para SAN e VTL.
Algumas dessas soluções existentes estão listadas aqui:
VOCÊ DÁ (Armazenamento com conexão direta)
Esse tipo de armazenamento pode ser encontrado de PCs domésticos a servidores. O (s) disco (s) são conectados diretamente ao barramento da placa-mãe. Geralmente é de baixo custo e geralmente não é otimizado como repositório de informações, pois é polivalente. Armazena o sistema operacional e qualquer outro software que precise ser executado.
Para melhorar sua funcionalidade, com dois ou mais discos é possível configurar diferentes tipos de RAID (Redundant Array of Independent Disks) de acordo com a necessidade do usuário. Em todos os casos, a informação é dividida em blocos e a forma de armazenamento desses blocos dá lugar a diferentes configurações lógicas.
RAID0 (remoção)As informações (blocos) são divididas e distribuídas uniformemente entre dois ou mais discos. Geralmente é usado para aumentar o desempenho (leitura / gravação), mas não tem nenhuma paridade ou redundância, se algum disco configurado em RAID0 falhar, a informação é completamente perdida.
RAID1 (espelhamento)Também utiliza dois ou mais discos, onde a informação é armazenada em duplicado (espelhado), por isso consome o dobro de discos (um para a informação e outro para o seu espelho), razão pela qual costuma ser a opção mais cara economicamente .
A perda de um membro do conjunto não afeta a disponibilidade das informações.
RAID 0 + 1/1 + 0Combinação dos dois anteriores. A velocidade do RAID0 e a redundância (e custo) dos discos RAID1 estarão disponíveis.
RAID5 (com paridade simples)Você precisa de pelo menos três discos. Ele usa uma paridade que é distribuída por todos os membros. O cálculo de armazenamento disponível é: total de discos menos um.
Se um disco falhar, a paridade distribuída é usada para calcular as informações ausentes, o que acarreta uma penalidade de desempenho, mas as informações ainda estarão acessíveis.
RAID6 (com paridade dupla)Configuração muito semelhante ao RAID 5, mas é possível acessar os dados mesmo com a perda de dois discos. Estatisticamente falando, a perda de dados é muito mais improvável, uma probabilidade estimada de 1 / 120.000 em comparação com o RAID5 em um grupo de discos em execução por 5 anos.
Para ambas as configurações com paridade, ao substituir o (s) disco (s) com falha, o sistema precisará reconstruir as informações usando os outros discos. Este período de tempo dependerá do tipo de disco.
Quanto ao espaço disponível, aqui está uma tabela de comparação se fossem 10 discos de 1Tb.
SANTO (Rede da área de armazenamento)
É uma rede de alto desempenho, onde o objetivo principal é fornecer sistemas de informática com armazenamento de alta capacidade, variando de alguns terabytes a petabytes ou mais …
Originalmente, as SANs usavam exclusivamente o protocolo Fibre Channel, onde a informação viaja através da fibra óptica como um feixe de luz, hoje o iSCSI também foi incorporado usando cabeamento Ethernet e, mais recentemente, redes convergentes FCoE, que é o mesmo protocolo Fibre Channel, mas encapsulado em um IP pacote. As informações estão acessíveis no nível do bloco.
Os dispositivos de armazenamento geralmente são compostos por dois ou mais controladores (redundantes entre si) que gerenciam um conjunto de discos. Agora também é possível conectar a esta rede SAN Bibliotecas de Backup, armazenamento e servidores, entre outros.
A hora de projetar um SAN será necessário considerar:
- Como garantir alta disponibilidade, seja por meio de seus componentes serem todos redundantes (controladores, switches, cabeamento, fonte de alimentação, discos, etc.),
- escalabilidade, ao crescer se você decidir substituir partes específicas do equipamento, substitua-o ou adquira outro para trabalharem juntos.
- Ou características específicas do produto que atendam às nossas necessidades. Cada fabricante oferece diferentes tipos de funcionalidade e licenciamento.
SANTO (Armazenamento modular)
Normalmente, uma configuração de SAN consiste em dois controladores executando ativo-ativo (para evitar pontos únicos de falha) e um conjunto de discos configurados nos tipos de RAID mencionados acima. Cada controlador é multifuncional, de forma independente poderá gerenciar a comunicação com o host, o cache interno e o conjunto de discos. Diante da falha de um deles, o restante suportará a carga transacional total, na maioria dos casos com a conseqüente diminuição do desempenho geral do sistema.
Armazenamento interno SAN é uma opção economicamente eficaz, mas apresenta complexidade de escalabilidade. Uma vez que dois controladores ou nós são o máximo suportado na maioria das configurações, para expandir o esquema de armazenamento, os controladores terão que ser substituídos por outros de maior desempenho ou outra SAN deve ser adicionada com o consequente custo econômico e administrativo.
Nos últimos anos, duas empresas introduziram no mercado um novo conceito de armazenamento SAN. É um cluster de vários nós, onde inicialmente, como a configuração SAN padrão, é composto por dois nós multifuncionais redundantes. A principal diferença está na interconexão dos controladores por meio de interruptores formando uma malha ou rede entre todos os membros. As informações são distribuídas entre todos os membros e podem ser acessadas de qualquer controlador, aumentando o desempenho cada vez que um nó é adicionado.
Discos (Tipos de discos / conectores)
Canal de fibraÉ um protocolo de transporte que transmite comandos SCSI por canais de fibra. Cronologicamente, os discos Fibre Channel foram os primeiros a serem usados em SANs. Este tipo de conectividade de alta velocidade permite até 127 discos (em oposição a 15 para SCSI) em uma distância de até 30 metros.
São utilizados em data centers de médio e alto desempenho, embora hoje em dia devido ao custo dos discos a indústria de informática tenda a utilizar SAS, deixando o FC para um nicho específico.
Serial Attached SCSI ou SASSerial Attached SCSI ou SAS é a substituição do SCSI (Paralelo), que tem sido usado por mais de duas décadas. Com desempenho semelhante ao dos discos FC, menor custo e sujeito aos mesmos controles rigorosos de seus componentes, gradativamente tem conseguido ingressar no segmento de negócios high-end.
NearLine SAS (NL-SAS)Foi a responder à demanda por armazenamento de baixo custo em ambiente corporativo. Pode dizer-se que são discos SATA com melhor controlo de qualidade e interface SAS (herdando assim as suas funcionalidades), pelo que permitem ter grandes capacidades onde o desempenho não é o principal.
SSD empresarialSSD empresarial (Enterprise Solid State Drive), embora seu custo por Gb ainda seja alto Oferece o melhor desempenho em comparação com outros tipos de disco. Por não possuir peças móveis, os tempos de acesso às informações são drasticamente reduzidos. Disponível com uma interface SAS ou SATA e em capacidades de até um terabyte, sua vida útil é um pouco menor do que a de um disco SAS. Eles são freqüentemente usados como memória cache.
Em termos gerais, existem três categorias de discos se os classificarmos por seu desempenho geral (IOPS, entrada e saída por segundo): NL-SAS sendo o mais lento e o SSD corporativo na outra extremidade da lista. Esse tipo de agrupamento ou camada de desempenho é chamado de camadas.
Diversos fabricantes oferecem, embutidos no firmware de seus controladores ou por meio de software, funcionalidades como “auto tiering”, colocando as informações acessadas com mais frequência no grupo dos dispositivos mais rápidos e à medida que a solicitação diminui, elas serão reatribuídas a outros dispositivos de menor desempenho e custo.
NAS (Armazenamento conectado à rede)
Também denominado "servidor NAS", é um computador de menor valor econômico com um sistema operacional e / ou software otimizado para armazenamento de informações acessíveis em nível de arquivo. Você não precisa de uma infraestrutura de rede especial, pois a comunicação com os clientes é feita por meio de TCP / IP e os protocolos usados para compartilhar arquivos são: CIFS (Common Internet File System) popular no ambiente Windows ou NFS (Network File System) Linux nativo.
É tradicionalmente usado para compartilhamento de arquivos (documentos e multimídia), auditoria, repositório, etc., embora recentemente, como sua disponibilidade e desempenho tenham melhorado, também seja freqüentemente usado para certos tipos de bancos de dados relacionais e virtualização.
Apesar de suas diferenças com o SAN, eles não são mutuamente exclusivos.
Cópia de segurança (Backup em fita)
Este é o tipo mais antigo de armazenamento em massa (e ainda é usado!).
O backup em fita enfrentou testes severos ao longo de sua existência, especialmente quando as tecnologias emergentes são mais práticas e rápidas. As fitas sempre gostaram de ter grandes quantidades de armazenamento em comparação com um disco rígido, estamos falando da ordem de 15 Tb comprimindo os dados (em uma fita LTO7 de última geração).
Com a tecnologia atual, cada fita tem uma expectativa de vida de 30 anos ou mais e isso a torna o meio preferido para o arquivamento de informações. É importante mencionar que cada geração de fitas (LTO-x) tem compatibilidade duas gerações anteriores para leitura e uma para escrita.
Ainda hoje são utilizados pela sua portabilidade e relação custo / benefício.
VTL (Virtual Tape Library)
Nos últimos anos, o backup baseado em disco ganhou popularidade devido aos preços mais baixos do disco e também à menor intervenção do usuário. Geralmente seu desempenho é superior, pois não depende de busca sequencial como a fita.
É um dispositivo que se comunica com o software para backup se comportando como uma biblioteca de fitas, mas o armazenamento resulta em um conjunto de discos. Simplificando, é um híbrido. Teve alguma aceitação em centros de informática que os utilizam como um estágio intermediário antes do despejo na fita, reduzindo as janelas de segurança e restauração. Em alguns casos, ele foi usado para substituir robôs de backup sem sacrificar o esquema de execução. Existe mais de um produto no mercado que cumpre a mesma função, mas que está conceitualmente distante de uma livraria virtual.