Maximo Perfomance en nuestro entorno de vSAN

Buenas chic@s! En el post anterior, vimos “Entendiendo la arquitectura: vSAN Disk Group“. En el post de hoy, vamos a entrar de lleno en las mejores practicas de vSAN, especialmente en aquellas que nos permitan obtener el mejor perfomance en nuestra arquitectura de vSAN, y especialmente en nuestros diskgroups.

Como he comentado en post anteriores, para que sea simple, nos basaremos en desligues de clúster de all-flash, ya que los despliegues de entornos híbridos han perdido mucha fuerza en el mercado por el abaratamiento de los discos flash .

Best Practice Generales

1ºAsegurarse de que el hardware que estamos utilizando esté incluido en la Guía de compatibilidad de VMware.

2º Asegurarnos que tanto nuestro driver como nuestro firmware de la HBA estan en matriz.

3º Debemos mantener nuestro entorno actualizado, ya que en cada versión de vSAN incorporan mejoras a nivel de perfomance.

4º Todos los host que conformen el clúster deben ser iguales en todos los aspectos(CPU memorias, HBA, discos). En caso de necesitar aumentar el numero de host(Scale Out), procurar que sean del mismo fabricante y de características muy similares.

5º Debemos diseñar nuestro entorno para un futuro crecimiento, por ello deberemos dejar un 30% de espacio libre al diseñar la capacidad, esto se debe a que vSAN iniciará el reequilibrio automático cuando un disco alcance el umbral del 80%, lo que genera tráfico de reconstrucción en el clúster.

6º Necesitaremos un mínimo de 4 host si usamos la políticas por defecto, pero si optamos por el uso de RAID5 o RAID6, necesitaremos 5 y 7 host respectivamente. Recordar la regla siempre 2N+1.

7º Tarjetas de red 25 Gb, olvidaros de las 10 Gb. El nuevo estándar son las 25 Gb, además el aumento de uso de los discos Nmve, hace que el consumo de red aumente bastante derivado del perfomance ofrecido por estos. Importante que estar tarjetas de red posean características como RSS,TSO,LRO,…

8º La mejor configuración para vSAN es el uso de 2 NIC en LACP. En caso de ser compartidas con otro tipo trafico, asegurarnos de que tenemos configurado NIOC para prioriza el trafico en caso contención.

9º Si puedes implementar Jumbo Frames mejor, dependiendo de tus switches puede que tengas una pequeña mejora en el rendimiento, lo que es seguro es la disminución del uso de CPU en los host debido a la menor cantidad de paquetes a procesar.

10º Igual que con las tarjetas de red, nuestros switches deben tener puertos de 25Gb. ! Ojo!, no es todo la capacidad switching, también debemos fijarnos en el tamaño de los buffer por puerto entre otras cosas.

11º Cuando hagamos nuestros cálculos de capacidad, debemos tener en cuenta el overhead generado por vSAN tanto en aspecto de la CPU(entorno a 10 %), como en aspecto del filesystem de vSAN.

Mejores practicas para nuestros Disk Group

Cuando estamos diseñando nuestros diskgroups, muchas veces pensamos en que debemos invertir buena parte de nuestro presupuesto en los discos de cache, ya que estos recibieran todas la escrituras(hot data), y tendriamos el mejor perfomance en nuestro entorno.

Este pensamiento es un error, ya que si los discos de capacidad no tiene el suficiente perfomance para absorber los datos del tier cache. Esto provocara una latencia hacia nuestras maquinas virtuales. Por eso si vamos añadir discos de cache rápido, deberemos o bien añadir mas discos de capacidad, o bien crear multiples diskgroup.

Mejores practicas para nuestros Disk Group sin Deduplicacion ni compresion

1º Para nuestro tier de cache el uso de Nvme es innegociable, entre tantos, los discos Nvme con interfaz PCIe es la mejor opcion, entre ellos el Intel Optane le mejor sin duda.

2º Para nuestro tier de capacidad tenemos varias opciones:

  • Si quieres el mejor rendimiento y presupuesto ilimitado, optar por discos Nmve es la opción.
  • Si quieres un buen rendimiento sin sufrir con el presupuesto, mi recomendación es optar por una HBA que tengo un alto QD(Queue Depth), y el uso de discos SAS SSD.
Source:vMware

3º El uso de multiples diskgroup disminuye nuestro dominio de fallo, además aumentara nuestro rendimiento al redistribuir las escritura de las VMs entre los diferentes diskgroup.

Mejores practicas para nuestros Disk Group con Deduplicacion ni compresión

1º Para nuestro tier de cache el uso de Nvme es innegociable, entre tantos, los discos Nvme con interfaz PCIe es la mejor opción, entre ellos el Intel Optane le mejor sin duda.

2º Una de las desventajas de usar Deduplicacion & Compresion es la degradación de perfomance que sufre el el cluster a medida que se vaya llenando el buffer de cache, ya que cuando nuestro tier de cache empieza a llenarse, tiene que empezar el proceso de «descarga» de dato(Destage). Este es un proceso costoso en todos los sentido CPU,RAM,.. provocando una degradación del perfomance que se ve reflejada en nuestras maquinas virtuales en forma de latencia.

Una de las formas en las cuales se ve muy reflejada este fenómeno es cuando le entra una gran ingesta del dato, y no puede descarga el dato a la misma velocidad a la que entra. Esto viene derivado en parte porque todo el proceso de Deduplicar & Comprimir se encarga un proceso de ello. Podemos leer mas sobre ello aquí.

3º Para aumentar el perfomance derivado del uso de estas features, es mejor el uso de varios diskgroup con discos de capacidad pequeños, estos nos proporcionara mas capacidad de albergar nuevas escrituras(Buffer) , además disminuirá nuestro dominio de fallo. Recordar el fallo de un disco de capacidad, nos marcara todo el diskgrop como fallido.

4º El uso de este tipo de arquitectura esta pensado para cargas donde el rendimiento no es una prioridad.

Hasta aquí hemos llegado en este post, como veis tenemos múltiples opciones para maximizar nuestro rendimiento. Como todo, dependerá de lo que queramos, de la cargas que vayamos albergar, y sobre todo de nuestro presupuesto.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *