Lo que realmente significa el almacenamiento a hiperescala

Seamos claros: la hiperescala no se trata de cuán grande eres.

Las organizaciones no tienen que ser enormes para aprovechar las soluciones de hiperescala. Pero eso es exactamente lo que piensan muchos profesionales de la infraestructura, las operaciones y el desarrollo de sistemas de TI cuando aprenden sobre la hiperescala.

La creencia predominante es que la arquitectura de hiperescala está destinada a infraestructuras extremadamente grandes, como las operadas por LinkedIn, Amazon o Netflix, porque escala a miles de instancias y petabytes de datos. Resulta que es mejor pensar en la hiperescala como una descripción de un enfoque en lugar de un tamaño . Se trata de automatización, orquestación y creación de TI que escale de manera inteligente cuando la empresa lo necesite. Las implementaciones de hiperescala pueden y deben comenzar con un tamaño pequeño y luego escalar indefinidamente. También deberían permitirle escalar de forma independiente solo la parte de la infraestructura que lo necesita, lo que contradice otra tendencia emergente del centro de datos empresarial, la hiperconvergencia.

¿Confundido todavía? Si es así, no estás solo. Profundicemos un poco más.

Definición de hiperescala

El concepto de construir una arquitectura de hiperescala está enturbiado por muchos términos tangenciales. En particular, vemos a los clientes confundidos acerca de la infraestructura hiperconvergente, de hiperescala (o escala web), convergente, definida por software y basada en productos básicos.

Tomemos un momento para aclarar las definiciones de estos términos de ingredientes:

  • Definido por software: infraestructura donde la funcionalidad está completamente desacoplada del hardware subyacente y es extensible y programática. Lea esta publicación para conocer nuestra elaboración sobre el almacenamiento definido por software en particular.
  • Basado en productos básicos : Infraestructura construida sobre una infraestructura estándar de la industria o de productos básicos, generalmente un servidor blade o de montaje en rack x86. Como hemos escrito en el pasado, no combine productos básicos con baratos.
  • Convergente: una arquitectura de escalamiento horizontal en la que el servidor, el almacenamiento, la red y los componentes de virtualización / contenedorización se unen como una solución probada y preintegrada. Los componentes siguen siendo distintos en esta arquitectura.
  • Hiperconvergente: una arquitectura escalable que lleva la infraestructura convergente un paso más allá al combinar componentes definidos por software sobre hardware básico, empaquetados como una solución única, a menudo un solo dispositivo. Los componentes ya no son distintos.
  • Hiperescala: una arquitectura de escalamiento horizontal que también está definida por software y basada en productos básicos, pero en la que el servidor, el almacenamiento, la red y los recursos de virtualización / contenedorización permanecen separados. Cada componente es distinto y se puede escalar de forma independiente.

En resumen, piense en la infraestructura hiperconvergente como el extremo lógico y moderno de los sistemas convergentes, mientras que la hiperescala es el extremo lógico y moderno de cómo hemos estado construyendo centros de datos durante 30 años. Ambos tienen sentido para entornos específicos, como se muestra a continuación.

Hiperescala e hiperconvergente

En Hedvig, nos esforzamos por ofrecer una solución de almacenamiento que se pueda adaptar de manera flexible a cualquier carga de trabajo, desde nubes privadas, incluidas Docker y OpenStack, hasta implementaciones de big data que ejecutan Hadoop o NoSQL, hasta virtualización de servidores, recuperación de desastres, respaldo y archivado más tradicionales. La plataforma de almacenamiento distribuido de Hedvig virtualiza y agrega discos flash y giratorios en un clúster de servidores o en la nube, presentándolo como un único sistema de almacenamiento elástico al que se puede acceder mediante interfaces de archivo, bloque u objeto.

La plataforma de almacenamiento distribuido Hedvig consta de tres componentes:

  • Servicio de almacenamiento Hedvig: un motor de sistemas distribuidos patentado que escala el rendimiento y la capacidad del almacenamiento con servidores ARM y x86 disponibles en el mercado. El servicio de almacenamiento de Hedvig se puede ejecutar en las instalaciones o en nubes públicas como AWS, Azure y Google. Ofrece todas las opciones y capacidades de almacenamiento necesarias para una implementación empresarial, incluida la deduplicación en línea, la compresión en línea, las instantáneas, los clones, el aprovisionamiento ligero, el autotiering y el almacenamiento en caché.
  • Proxy de almacenamiento Hedvig: una máquina virtual o contenedor liviano que permite el acceso al servicio de almacenamiento Hedvig a través de protocolos estándar de la industria. Actualmente, Hedvig admite NFS para archivos e iSCSI para bloques, así como los controladores OpenStack Cinder y Docker. El proxy de almacenamiento Hedvig también permite el almacenamiento en caché y la deduplicación del lado del cliente con SSD local y recursos flash PCIe para lecturas locales rápidas y transferencias de datos eficientes.
  • API de Hedvig: API basadas en REST y RPC para el almacenamiento de objetos y las operaciones de Hedvig. Actualmente, Hedvig admite Amazon S3 y Swift para el almacenamiento de objetos. Los desarrolladores y los administradores de operaciones de TI pueden utilizar las API de gestión para permitir el acceso a todas las funciones de almacenamiento de Hedvig para automatizar el aprovisionamiento y la gestión con portales de autoservicio, aplicaciones y nubes.

Hedvig admite la hiperconvergencia al agrupar Hedvig Storage Proxy y Hedvig Storage Service como dispositivos virtuales que se ejecutan en un servidor básico con un hipervisor o un sistema operativo de contenedor. Para la hiperescala, el servicio de almacenamiento Hedvig se implementa en servidores bare-metal para formar un nivel de almacenamiento dedicado, mientras que el proxy de almacenamiento Hedvig se implementa como una máquina virtual o contenedor en cada servidor en el nivel informático.

Por qué elegir la hiperescala para el almacenamiento

Los datos están creciendo mucho más rápido que los presupuestos de almacenamiento. La economía es paralizante para las empresas que no tienen los recursos de los gigantes de Internet como Amazon, Google y Facebook. Por lo tanto, las empresas deben adoptar el almacenamiento definido por software y basado en productos básicos para reducir costos y mantener la flexibilidad y escalabilidad necesarias para mantenerse al día con los requisitos comerciales.

En Hedvig, hemos notado que aproximadamente el 80 por ciento de las veces, los clientes eligen una arquitectura de hiperescala en lugar de hiperconvergente, a pesar de que admitimos ambas. Lo que es aún más interesante es que muchos de nuestros clientes acuden a nosotros pensando exactamente lo contrario. Alrededor del 80 por ciento solicita inicialmente una solución hiperconvergente, pero después de hacer sus deberes, optan por el enfoque de hiperescala.

¿Por qué? En pocas palabras, porque favorecen la flexibilidad (o agilidad, si debe usar ese término) por encima de todo al diseñar su infraestructura. Considera lo siguiente:

  • Un sistema hiperconvergente ofrece un enfoque simplificado de "bloques de construcción" para TI. Para las organizaciones de TI esbeltas que buscan reducir los gastos generales de implementación y expansión de una infraestructura similar a la nube, la hiperconvergencia proporciona una buena solución. Pero requiere un conjunto relativamente predecible de cargas de trabajo donde la "localidad de datos" es una prioridad máxima, lo que significa que la aplicación o VM debe ubicarse lo más cerca posible de los datos. Esta es la razón por la que VDI ha sido un modelo para la hiperconvergencia. Los usuarios quieren que su "unidad C: virtual" sea local. Pero no es flexible, ya que implica escalar todos los elementos al mismo tiempo.
  • Un sistema de hiperescala mantiene el almacenamiento independiente de la informática, lo que permite a la TI empresarial escalar la capacidad cuando la empresa lo requiere. El enfoque de hiperescala para el centro de datos y la infraestructura en la nube ofrece un alto nivel de elasticidad, lo que ayuda a las organizaciones a responder rápidamente a las cambiantes necesidades de almacenamiento de datos y aplicaciones. También es una arquitectura que se adapta mejor a cargas de trabajo modernas como Hadoop y NoSQL, así como a aquellas diseñadas con plataformas en la nube como OpenStack y Docker. Todos estos son ejemplos de sistemas distribuidos que se benefician del almacenamiento compartido escalado de forma independiente.

Lo que hemos experimentado con nuestros clientes es una confirmación de recopilación de lo que hemos estado notando por un tiempo: que la hiperconvergencia es una respuesta y no la respuesta cuando se exploran las arquitecturas de almacenamiento modernas. Sin duda, la industria está viendo un gran péndulo que se convierte en hiperconvergente debido a su simplicidad. Pero si sus datos están creciendo exponencialmente y sus necesidades de computación no, entonces tiene una falta de coincidencia de impedancia que no es adecuada para la hiperconvergencia.

¿Hiperescala o hiperconvergente?

La hiperconvergencia puede ser un enfoque más simple y rentable. Sin embargo, lo que nuestros clientes descubren con Hedvig es que admitimos una función que hace que la hiperescala sea adecuada para casi todas las cargas de trabajo: el almacenamiento en caché del lado del cliente. Hedvig puede aprovechar los dispositivos SSD y PCIe locales en su nivel de cómputo para crear una caché de escritura directa. Esto mejora significativamente el rendimiento de lectura y, lo que es más importante, resuelve el desafío de la ubicación de los datos. El almacenamiento todavía está desacoplado y se ejecuta en su propio nivel de hiperescala dedicado, pero las aplicaciones, las máquinas virtuales y los contenedores pueden beneficiarse de los datos almacenados en caché localmente en el nivel de cómputo. Esto también resuelve el problema de cómo hacer crecer su nivel de almacenamiento en caché, pero ese es un tema para otro artículo.

Como ejemplo de este beneficio, un cliente eligió el enfoque de hiperescala de Hedvig para VDI, una carga de trabajo tradicionalmente reservada para soluciones hiperconvergentes como se discutió anteriormente. En este caso, el cliente tenía "usuarios avanzados" que requerían 16 CPU virtuales y 32 GB de memoria dedicados a cada escritorio alojado. Como resultado, la empresa se vio obligada a implementar una gran cantidad de nodos hiperconvergentes para soportar los requisitos de procesamiento y memoria, mientras que aumentaba innecesariamente la capacidad de almacenamiento al mismo tiempo.

Con la plataforma Hedvig, el cliente pudo crear nodos dedicados para ejecutar la granja Citrix XenDesktop en servidores blade robustos con CPU y RAM adecuadas. Los datos se guardaban en un clúster Hedvig de hiperescala independiente en servidores de montaje en bastidor, con datos almacenados en caché en los servidores XenDesktop en SSD locales. ¿El resultado? Una solución dramáticamente menos costosa (60 por ciento menos). Más importante aún, también proporcionó un entorno más flexible en el que la empresa podía seguir la Ley de Moore y comprar los servidores más potentes necesarios para mejorar el rendimiento de su escritorio sin tener que actualizar los servidores de almacenamiento.

Según nuestra experiencia, existen algunas reglas básicas para determinar qué arquitectura es la adecuada para usted.

  • Elija hiperescala cuando ... su organización tiene 5000 empleados o más, más de 500 terabytes de datos, más de 500 aplicaciones o más de 1000 máquinas virtuales.
  • Elija hiperconvergente cuando ... esté por debajo de estos números de marca de agua, tenga cinco empleados o menos administrando su infraestructura virtual o esté en una sucursal o en una oficina remota.

La buena noticia es que no tiene por qué ser una decisión de una u otra. Puede comenzar en un entorno hiperconvergente, luego cambiar a hiperescala, o puede mezclar y combinar los dos. Nuestra filosofía es que sus aplicaciones dicten cuál debe utilizar. Y como las necesidades de su aplicación cambiarán con el tiempo, también debería hacerlo su implementación.

En las empresas modernas, el cambio y el crecimiento son obligatorios. Cada vez más, no hay forma de resolver este enigma sin la arquitectura de hiperescala en la que fueron pioneros los gigantes de la Web. Lo que ha cambiado es que cualquier empresa ahora puede beneficiarse del enfoque de hiperescala.

Rob Whiteley es el vicepresidente de marketing de Hedvig.

New Tech Forum proporciona un lugar para explorar y discutir la tecnología empresarial emergente con una profundidad y amplitud sin precedentes. La selección es subjetiva, basada en nuestra selección de las tecnologías que creemos que son importantes y de mayor interés para los lectores. no acepta material de marketing para su publicación y se reserva el derecho de editar todo el contenido contribuido. Envíe todas sus consultas a [email protected]