Linux / PHP / Java / Designer

As melhores dicas estão aqui.

Introdução ao Storage

| 2 Comentários

O aumento do volume de informações que circula nas empresas passou a ser crítico em qualquer corporação e com ele a importância de contar com ferramentas de armazenamento de dados cresceu. Atualmente, o desafio não é só dimensionar a necessidade de espaço, em função dos terabytes a serem preservados, mas gerenciar esse processo de forma eficiente para garantir acesso rápido e inteligente aos dados armazenados. Com isso, o conceito do gerenciamento dos dados vem evoluindo a cada dia, com o surgimento de novas soluções, estratégias e tendências.

Isso porque, antigamente, o computador era conectado diretamente ao seu setor de armazenamento, e nenhum outro PC podia acessar os dados guardados. Os aplicativos eram executados em um mainframe. Na medida em que a computação cliente-servidor foi desenvolvida, os aplicativos passaram a ser executados em servidores dedicados, cada qual com seu próprio sistema de armazenamento.

Não tardou a surgir, contudo, a necessidade desses aplicativos compartilharem dados. Conforme a capacidade dos sistemas de disk array (módulos de armazenamento de discos) foi crescendo, um único disk array pôde suprir as necessidades de armazenamento de vários servidores. Assim, nasceu o storage em rede. Hoje, o storage – armazenamento de dados – vai além do seu conceito. Entre as novas modalidades atreladas ao tema estão a virtualização de dados e o gerenciamento do ciclo de vida da informação, por exemplo.

Mas o que é virtualização de storage? Nada mais do que o processo de consolidar vários dispositivos físicos, de diversos fabricantes e reorganizá-los em agrupamentos virtuais, lógicos ou em unidades de armazenamento. Essas unidades são apresentadas ao sistema operacional (OS) para utilização por aplicativos ou pelos usuários finais apropriados.
Apesar de soar como um recurso atual, a virtualização do armazenamento não é novidade, tanto no conceito como na prática. Definida há quase 20 anos, na computação em mainframes, a tecnologia está se consolidando com o avanço das SANs (Storage Área Networks), que serão tratadas mais detalhadamente nos próximos módulos.

Já o gerenciamento do ciclo de vida da informação ou ILM - Information Lifecycle Management - permite diagnosticar quais informações realmente demandam acesso mais ou menos rápido, além de classificar o grau de importância estratégica desse dado ou informação para a corporação. Assim, o modelo de armazenamento pode ser redimensionado, representando acesso mais inteligente, rápido e com menor custo. Esse conceito está integrado ao que se convenciona chamar de Storage Resource Management (SRM).

Virtualização

O armazenamento de informação sempre foi parte da infra-estrutura tecnológica de qualquer empresa ou de qualquer usuário. Armazenar informação é fundamental no ambiente tecnológico, independente da arquitetura utilizada. Pela falta de um modelo de padronização na área de storage, as empresas investiram, ao longo do tempo, em ilhas de storage, com diversas marcas para suportar diferentes aplicações. Hoje, o que se observa é uma verdadeira “Torre de Babel” nessa área, com sistemas que não se comunicam por terem arquiteturas proprietárias.

Essa diversidade acontece tanto em relação ao uso de recursos físicos de armazenagem (como os discos) até as aplicações. No caso dos discos, isso aconteceu principalmente porque eles foram adquiridos para suportar a demanda cada vez maior de armazenamento em função do uso de aplicações como Customer Relationship Management (CRM), Enterprise Resource Planning (ERP), Business Intelligence (BI) e até correio eletrônico. Em cada época um fornecedor possuía o melhor preço ou a melhor tecnologia para complementar essas soluções.

Atualmente, os discos, transformados em commodities, podem ser melhor aproveitados e facilitam a composição de uma estratégia de armazenamento de dados de uma forma inteligente. A virtualização de storage, por exemplo, garante que todos os discos, até então incomunicáveis, possam fazer parte de um único sistema de armazenamento. Dessa forma, a corporação consegue gerenciar de maneira simples os dados armazenados. Além dessas facilidades, a modernização dos recursos para armazenamento possibilitou uma economia considerável para os usuários que agora têm como utilizar os discos para todas as aplicações, com livre escolha de fabricantes.

Assim como no universo dos discos, a virtualização contribui para organizar o modelo de aplicações na área de armazenamento. O grande drama enfrentado no passado pelas empresas era a falta de interoperabilidade que existia entre as aplicações, visto que elas aconteciam de forma isolada – em cada departamento – e utilizando software de fabricantes diferentes e muitas vezes proprietários.

Elo de integração

Mas a virtualização veio resolver esse problema, transformando-se em um elo de integração. Isso porque ela possibilita que soluções de diferentes fabricantes possam conversar entre si e realizar funções de provisionamento dinâmico. Esse recurso permite que as empresas criem “pools” de armazenamento, obtendo uma visão unificada e consolidada da capacidade total de storage. De um lado, a tecnologia dobra a capacidade de utilização do armazenamento nas empresas e, de outro, o provisionamento dinâmico possibilita que a alocação de mais espaço por uma aplicação ou servidor seja feita automaticamente.

Mas não basta só virtualizar, é preciso gerenciar. Segundo o instituto de análise Gartner Group, para cada dólar investido na compra de soluções tecnológicas, cinco são gastos para controlar e manter o ambiente. Investimentos no gerenciamento da informação é prioridade para as empresas que adotam o Storage Resource Management (SRM), permitindo administrar as diversas plataformas de armazenamento.

O SRM abrange desde relatórios para classificar os dados e políticas de alocação, até o gerenciamento baseado na aplicação e monitoração do desempenho. Com a classificação de dados, é mais fácil detectar arquivos que não são acessados normalmente e realocá-los em fita, por exemplo, livrando-os de ocupar centenas de gigabytes em dispositivos mais caros.

Os CIOs (Chief Information Officers), ainda segundo o estudo do Gartner Group, apontam que cerca de 40% das informações armazenadas pelo usuário final não interessam às empresas. Uma boa solução de SRM, dizem os especialistas, incorpora múltiplas visões, assim como gerencia a capacidade física e lógica de storage, tornando o ambiente de armazenamento muito mais eficaz. A tendência é contar com mais serviços de integração para que os usuários não tenham de gerenciar ambientes estanques de software de diferentes fornecedores.

No controle total

O primeiro passo para atingir a plena capacidade de controle é construir uma rede de armazenamento inteligente, que permita acesso ao transporte de dados e faça a informação se mover de um lado para o outro. Os passos seguintes são classificar os dados segundo regras de negócios e partir para a automatização, usando ferramentas que facilitem a identificação de dados e utilizando a rede implementada na primeira etapa. Com plataformas de conteúdo fixo, é necessário que estas sejam acessadas por aplicações, independente de estarem em fita ou em disco.

Para obter acesso livre e interoperabilidade global entre as aplicações, o que irá proporcionar gerenciamento completo das informações, é necessária a construção de uma rede de armazenamento inteligente. Com um conjunto de software para gerenciamento de storage, é possível identificar as informações que estão sem acesso e solucionar o problema. Em cima dessa estrutura são feitas várias evoluções, como ligação online entre os storages de produção e de backup.

Na hora de escolher a melhor solução, principalmente se a intenção é fazer o gerenciamento do ambiente de storage, o administrador da rede vai ter de “juntar pedaços”. Não há ainda fornecedor que disponha de uma solução completa, abrangendo todas as nuances tecnológicas. Para que o gerenciamento seja aperfeiçoado e também entendido em todos os departamentos da empresa e funcione de maneira linear, é importante que seja implementada uma política de gestão dos recursos de storage.

Contudo, ela depende de uma boa capacidade de negociação e de um profundo conhecimento da infra-estrutura existente e das necessidades da empresa. Até porque, as informações transformam-se rapidamente em terabytes, acessadas, simultaneamente, por centenas, quando não, milhares de usuários que criam e acessam dados ao mesmo tempo e com as mais diferentes finalidades.

Tecnologias emergentes

Com o objetivo de minimizar o caos do gerenciamento das informações corporativas e, ao mesmo tempo, ajudar as organizações a reduzir significativamente os gastos com armazenamento, os fornecedores de storage começam a oferecer soluções para a nova onda desse mercado: a organização das informações tendo como base sua importância para os negócios, em determinado momento.

Os nomes ainda variam – alguns fornecedores chamam de hierarquização, outros preferem mais um acrônimo de três letras, o ILM (Information Lifecycle Management – gerenciamento do ciclo de vida da informação) –, mas o conceito é um só. Identificar cada informação, avaliar o quanto é crítica para o negócio e a necessidade de acesso rápido a ela e, finalmente, rever a infra-estrutura de storage, de forma a permitir a alocação apenas dos dados mais importantes em mídias de alta performance e, portanto, mais caras, deixando o restante em equipamentos mais econômicos. Tudo isso feito de maneira dinâmica, automática e transparente para o usuário.

Entre as tecnologias emergentes na área de storage, portanto, estão a virtualização, já citada anteriormente, a Internet SCSI e o ILM (Information Lifecycle Management). Ao lado de tecnologias já consolidadas como o NAS (Network Attached Storage) armazenamento conectado à rede. As vantagens de seu uso incluem armazenamento compartilhado, habilidade de adotar diferentes protocolos de arquivos para diferentes ambientes e redução de custos administrativos, resultando em menor custo total de propriedade.

Já a SAN (Storage Area Network), rede de armazenamento, pode ser utilizada para conectar múltiplos servidores e é indicada para organizações com necessidade de storage de larga escala e um arsenal complexo de dispositivos de armazenamento. O ILM, gestão do ciclo de vida da informação, é um recurso que contribui para o gerenciamento de storage de forma inteligente e é fundamental para a demanda atual. Estudos mostram que os dados da maioria das aplicações não precisam necessariamente estar disponíveis para acesso online, na medida em que o tempo passa.

Exemplo disso são as mensagens arquivadas na caixa postal do correio eletrônico. Normalmente, após 45 dias do recebimento, essa mensagem, bem como seus anexos, não precisam consumir espaço em um disco mais rápido e, conseqüentemente, mais caro. Assim, caso a empresa necessite comprar discos, a adoção da gestão das informações permite a aquisição de discos mais lentos (e mais baratos), que vão receber automaticamente as informações utilizadas com menos freqüência, reduzindo sensivelmente os novos investimentos em storage.

Entre os protocolos de comunicação figuram o FC (Fibre Channel) – uma das tecnologias mais comercializadas para transmitir dados entre dispositivos de computador, adequada para conectar servidores de computadores a dispositivos de armazenamento compartilhado. E o novíssimo iSCSI (Small Computer System Interface) – protocolo emergente que oferece I/O por Ethernet e redes IP e que tem as mesmas vantagens da SAN, mas usa protocolos de networking.

Esse protocolo é hoje apontado como a tecnologia que mais vai ajudar o desenvolvimento do mercado de SAN. O FC/IP (Fibre Channel over IP) – junto com o iSCSI, é também uma das principais abordagens da transmissão de dados de armazenamento via redes IP. Também fazem parte desse pacote de tecnologias emergentes as soluções de Disaster Recovery (Prevenção de desstres). Visto que o armazenamento ocupa papel fundamental na estratégia de recuperação dos negócios.

A minimização dos prejuízos provocados por um eventual desastre que se abata sobre os sistemas de informação corporativos depende bastante das opções estratégicas e das soluções adotadas pela organização na área de armazenamento. As soluções centram-se cada vez mais na continuidade do negócio e na preservação dos sistemas. A velocidade da recuperação de dados terá de ser entendida por toda a estratégia de TI da corporação e como elemento central do próprio negócio.

2 Comments

  1. Muito bom esse seu descritivo.
    Simples, bem explicado.

    Obrigado.

Deixe uma resposta

Campos requeridos estão marcados *.