Linux / PHP / Java / Designer

As melhores dicas estão aqui.

Virtualização

| 1 Comentário

A virtualização de storage – armazenamento em rede, de forma que os dados guardados possam ser compartilhados – é um conceito usado para definir uma infra-estrutura inteligente. Nela, dispositivos diversos, com características, funcionalidades, performance, níveis de serviço e até mídia física diferenciadas são apresentados ao servidor e às aplicações como se fossem virtuais. Assim, simplifica-se o gerenciamento e diminui-se a complexidade da alocação e de configuração.

Essa modalidade nada mais é do que o processo que permite consolidar vários dispositivos físicos de diversos fabricantes e reorganizá-los em agrupamentos virtuais, lógicos ou unidades de armazenamento. Essas unidades são apresentadas ao sistema operacional (SO) para utilização pelos aplicativos e usuários finais determinados. Apesar do crescente interesse na virtualização do armazenamento, o conceito não é novo. Definido há quase 20 anos, na computação dos mainframes, a tecnologia está descobrindo uma nova oportunidade e importância com a emergência das SANs (Storage Area Networks), dispositivos de armazenamento de dados em rede.

A área é tão importante no mercado de storage que, em 2007, duas grandes empresas anunciaram investimentos nessa tecnologia: Sun Microsystems e Dell. A Sun anunciou sua entrada no mercado de virtualização no final de 2007 com a plataforma batizada de xVM composta inicialmente de um servidor e do sistema de gerenciamento Ops Center. Já a Dell apostou na compra da EqualLogic, fornecedora de storage area network (SAN) por US$ 1,4 bilhão em novembro de 2007. A compra é considerada como um impulso para os esforços da Dell em oferecer virtualização aos seus clientes.

A virtualização permite o uso da infra-estrutura, diminuindo sua ociosidade e tornando possível a implementação da Information Lifecycle Management (ILM) em todas as aplicações, independente da infra-estrutura. Alguns requisitos são essenciais para implementá-la: escalabilidade, gerência ponto-a-ponto, interoperabilidade, aderência a padrões da indústria e a tão sonhada redução do custo total do armazenamento, proporcionando economia real perante as soluções existentes.

Além do compartilhamento das SANs, os benefícios da virtualização também são observados na arquitetura de armazenamento de dispositivos conectados fora da rede – Direct Attached Storage (DAS). Seja em mainframe ou em ambientes de sistema aberto, as tecnologias de virtualização são utilizadas para simplificar e centralizar o gerenciamento e fornecer a flexibilidade no atendimento à demanda do acesso aos dados, onde quer que estejam.

Esse recurso elimina as restrições físicas, ao criar uma camada acima do armazenamento físico, que é acessível como um agrupamento lógico de storage e que pode ser alocado quando e onde for necessário. Essa camada oferece a capacidade de combinar dispositivos físicos heterogêneos em entidades virtuais projetadas para atender aos requisitos individuais dos aplicativos.

Por exemplo, um agrupamento virtual de armazenamento pode ser criado utilizando-se os discos físicos mais rápidos, a fim de otimizar o desempenho para um aplicativo de missão critica, sem modificar a implementação do hardware. Na medida em que o novo hardware se torna disponível ou que as características do aplicativo se modificam, as alterações na camada física podem ser realizadas sem interromper o acesso aos dados no dispositivo lógico. As tecnologias de virtualização de armazenamento estão evoluindo, incluindo soluções de banda interna e externa (in-band e out-band), com base em storage e em hospedagem.

Soluções de armazenamento e hospedagem

As soluções com base em armazenamento foram as primeiras tecnologias de virtualização e permitem que vários servidores compartilhem o acesso a dados em um único (e grande) array (matriz) individual. O lado negativo é que esses servidores não podem acessar os dados além de seu próprio array. Além disso, os usuários correm o risco de ficar limitados a soluções que dependem dos fabricantes, com base nas restrições de compatibilidade de hardware do array mais amplo ou dos servidores diretamente conectados. A virtualização com base no armazenamento pode, então, ser mais dispendiosa do que outras alternativas.

As soluções baseadas em hospedagem possibilitam os discos dentro de vários arrays, e de diversos fabricantes, sejam representados como um agrupamento virtual para um único servidor host. Isso permite que os profissionais da tecnologia da informação, por exemplo, tenham maior flexibilidade de habilitá-los como independentes dos fabricantes de soluções de armazenamento, embora ainda desfrutem dos benefícios da administração de storage centralizada a partir de um único console.

Embora os dados estejam concentrados para acesso apenas por meio de um único servidor, este pode tornar-se altamente disponível, garantindo que os dados sejam utilizados. A desvantagem surge quando vários servidores exigem o acesso compartilhado aos mesmos dados. Nesse caso, a duplicação dos dados ou outros métodos de virtualização de armazenamento podem atrapalhar a aplicação.

Um desafio na evolução da virtualização do armazenamento era garantir que os discos de vários arrays e de diversos fabricantes fossem representados virtualmente para mais de um servidor. Essa possibilidade, no entanto, pode ser obtida com uma solução de banda interna (in-band) chamada de virtualização simétrica. Assim como as soluções com base em host, esse tipo de virtualização também é independente do fabricante e pode ser utilizado nas SANs e nas redes locais. No entanto, nessas circunstâncias, é fundamental que o dispositivo de banda interna tenha a escalabilidade para atender as crescentes exigências do gerenciamento de aplicativos e de armazenamento.

Já as soluções out-of-band fornecem a capacidade de virtualização simétrica, mas movem o dispositivo de armazenamento para fora do caminho de dados. Essa modalidade também está melhor posicionada para utilizar a capacidade de conexão rápida de um switch SAN. Mas para conseguir esses benefícios, é necessário que o software seja executado nos próprios servidores de aplicativos, para a comunicação do dispositivo virtual. Isso pode aumentar a utilização da CPU e tornará as atualizações de sistemas operacionais mais precárias quando essas soluções estiverem instaladas.

Todas as diferentes tecnologias de virtualização são úteis, e a escolha depende do ambiente de TI e dos requisitos corporativos específicos do usuário final. Ao selecionar uma solução, é importante entender o fluxo de dados de um usuário, para garantir que as atuais necessidades de negócios sejam supridas, enquanto é mantida uma capacidade de adaptação às novas exigências que surgirão na medida em que as tecnologias continuam a evoluir e se modificar. É fundamental haver uma camada de virtualização de armazenamento que ofereça compatibilidade, em vez de limitações.
Uma vez que os dados não estão associados a dispositivos específicos de hardware, a virtualização permite um nível sem precedentes de flexibilidade no uso de recursos de storage, a fim de atender as exigências referentes aos aplicativos e aos usuários finais. Os dispositivos de armazenamento virtual não estão restritos pelas limitações de capacidade, velocidade ou confiabilidade dos dispositivos físicos que os incluem. A aplicação de software de armazenamento inteligente na camada de virtualização proporciona um meio de resolver os desafios funcionais de storage, sem comprometer a necessidade de disponibilidade dos dados.

O provisionamento consiste em fornecer aos usuários ou aplicações a quantidade e o melhor tipo de armazenamento, no momento certo. A virtualização torna muito mais fácil esse processo. Somada à administração centralizada, permite que modificações na camada de armazenamento físico sejam efetuadas sem a interrupção do acesso aos dados, a fim de fornecer, continuamente, a melhor qualidade de serviços de armazenamento em tempo real. Dessa forma o usuário acessa com mais rapidez os dados de que necessita.

Redes virtuais

Um dos benefícios da tecnologia iSCSI (internet small computer system interface) – é usar protocolo emergente que oferece I/O por Ethernet e redes IP com as mesmas vantagens da SAN, que usa protocolos da infra-estrutura de rede. Entretanto, esse benefício é facilmente ultrapassado. Se a rede tem ainda switches gigabit de reserva, o benefício da iSCSI é imediato. Mas muitas redes são superdimensionadas, envolvendo a interface SCSI e o transporte de grandes quantidades de dados. O cliente não vai precisar gastar muito em upgrades para administrar o tráfico adicional.

O uso da infra-estrutura existente é muito importante. Fazer upgrade de uma rede é menos caro que desenvolver uma e fazer uma SAN valer a pena para uma pequena rede que não justifica o alto preço do Fibre Channel (FC). O mercado vai puxar para baixo os custos de uma iSCSI, ao ponto de substituir as FC na tecnologia SAN. A tendência é os fabricantes oferecerem servidores com bandas para a tecnologia iSCSI, assim como fizeram com o FC, oferecendo 1 U e servidores blade integrados com portas iSCSI.

Um servidor departamental pode contar com apenas um link de 100 Mbps Ethernet para o storage e tráfico de aplicações, mas um servidor de banco de dados pode facilmente requerer uma conexão Gigabit Ethernet apenas para o tráfico de storage. E se há muitos desses servidores, o custo da iSCSI pode aproximar-se da FC. Uma rede IP e Ethernet, portanto, tem a vantagem de ser reutilizada se no futuro o projeto de SAN for abandonado. Os custos podem ser ainda maiores se o tráfico de storage ficar em cima da WAN (rede que interliga dispositivos em locais remotos). Entretanto, a iSCSI ainda integra as duas alternativas.

A virtualização pode ser executada em blocos ou em níveis de arquivo. Nas redes de storage, os blocos são associados às SANs Fibre Channel e os arquivos de storage às Network-Attached Storage (NAS). Em uma típica virtualização em bloco, os dados são mapeados em um ou mais discos. O bloco requerido pode ser distribuído em múltiplos arrays de storage, mas parece para o usuário residir em um único drive.

Na vitualização de arquivo, múltiplos objetos podem parecer como apenas um arquivo. Esse tipo de virtualização provê um nível de abstração entre os arquivos e sua localização física. Nessa abordagem, um espaço comum é criado, que permite ao usuário acessar diferentes arquivos sem alterar o nome de sua raiz. O nome do espaço de arquivo aparece ao usuário como um único e grande arquivo de sistema.

O arquivo também pode ser virtualizado. Quando aplicado à estrutura de blocos de storage é convertido em objetos ou arquivos. Estes podem residir em servidores ou em sistemas NAS (Network Attached Storage). A vistualização de sistemas de arquivo e o metadado dos sistemas de arquivo individual podem ser combinados para formar uma extensão virtual desse sistema.

No caso da NAS, usuários podem acessar arquivos, primeiramente usando os protocolos Network File System (NFS) e Common Internet File System (CIFS) sem estarem familiarizados com os aspectos físicos ou lógicos da infra-estrutura. Idealmente, o sistema de arquivo distribuído deve ser capaz de se espalhar para múltiplos dispositivos NAS, permitindo escalabilidade e acesso fácil dos dados pelos usuários, independente de onde estejam. Essa é a essência da virtualização.

Desafios lógicos

A virtualização pode também ser implementada em diferentes dispositivos, como arrays, usando software de virtualização residente neste dispositivo. Esse software permite o desenvolvimento de pools de storage em múltiplos arrays.
Com o storage baseado na virtualização, as unidades lógicas são mapeadas nos dispositivos físicos via algorítimos ou usando uma abordagem baseada em tabelas. Basicamente, volumes tornam-se independentes dos dispositivos onde residem. Dependendo da solução usada, o storage baseado na virtualização pode incluir RAID, espelhamento disco a disco e replicação de dados.

Enquanto a área de storage baseado em virtualização favorece bons resultados para os fornecedores de disk array além de ser relativamente fácil de administrar, sistemas com essa abordagem ainda são tipicamente proprietários e limitados quanto à interoperabilidade entre os fornecedores de hardware e de software.

Dispositivos como bibilioteca de fitas podem também ser virtualizados. Na virtualização das fitas, os discos de storage são feitos para parecerem drives de fita. Os discos tipicamente front end de biblioteca de fitas permitem uma função de cache para que os dados possam ser acessados mais rapidamente. Quando o dado não é mais acessado freqüentemente pelos usuários, ele pode ser transferido para a fita. Entretanto, o administrador deve certificar-se de que existe uma quantidade suficiente de fitas para receber os dados sem comprometer a performance. Algumas soluções de virtualização de fitas são também restritas a bibliotecas proprietárias.

Enquanto a virtualização cai como uma luva para as corporações que querem otimizar a utilização de storage, alavancar o gerenciamento, provisionar e administrar sistemas de armazenamento e reduzir os custos, existem alguns obstáculos a serem ultrapassados. O primeiro inibidor dessa modalidade é a inexistência de padrões para a tecnologia com a falta de interoperabilidade entre os produtos voltados para a virtualização.

Ainda há muita confusão gerada pela virtualização e o que ela pode trazer. Os potenciais usuários têm sido hesitantes em investir em produtos. Apesar da existência de múltiplas abordagens, a virtualização provê flexibilidade mas pode também causar problemas durante seu uso se a corporação escolher uma solução que, mais tarde, torne-se obsoleta. Mas o mercado não tem dúvidas de que uma verdadeira política baseada na automação do storage requer a maximização do uso da virtualização.

Iniciativas de interoperabilidade

Os fornecedores de tecnologia se têm preocupado com a interoperabilidade. As iniciativas da EMC, Cisco, Brocade e McData, por exemplo, apontam para a implementação de uma infra-estrutura de virtualização escalável, aberta, interoperável e com custo total menor do que uma SAN tradicional. O primeiro passo foi unir os principais fornecedores de switches de SAN e armazenamento para, juntos, desenvolverem um conjunto de interfaces de programação de aplicações – as APIs padrão.

Estas API, ainda em estudo, formarão um padrão para todos os switches inteligentes denominado Fabric Application Interface Standard (FAIS -Padrão para Interfaces de Aplicações em Fabric = rede) e já contam com um comitê do American National Standards Institute (ANSI – Instituto Americano de Padrões Nacionais), o denominado T11.5, parte do subgrupo de comitês que desenvolvem os padrões para Fibre Channel.

O padrão FAIS começa por separar o controle do processamento da operação de mapeamento/virtualização em um equipamento denominado CPP – Control Path Processor – ou Processador do Controle de Caminhos. É no CPP onde são executadas as aplicações de armazenamento, tais como réplicas ou cópias entre volumes, migração de volumes dinâmica e mapeamento virtual/físico/array.

O padrão FAIS está sendo adotado com suporte aos principais dispositivos de armazenamento do mercado, de diferentes fornecedores (EMC, HDS, HPQ, IBM), aos principais sistemas operacionais (Windows, Linux, Solaris, AIX, HP-UX e VMware) e funciona com os switches inteligentes da Cisco, Brocade e McData. Outro ponto importante do padrão FAIS é que tanto os switches e dispositivos de armazenamento quanto as próprias aplicações podem ter fornecedores distintos e, por ser um padrão baseado em uma API aberta, a interoperabilidade entre os distintos softwares e hardwares está assegurada.
Para o usuário, isso significa proteção ao seu investimento, independência de fornecedor, múltiplas alternativas de hardware e software e a possibilidade de implementar a virtualização de forma gradual, adequada às necessidades da empresa.

One Comment

  1. I might be baetnig a dead horse, but thank you for posting this!

Deixe uma resposta

Campos requeridos estão marcados *.