vSAN Disk Fault Injection

Buenas, en el dia de hoy os voy a traer un post sobre «vSAN Disk Fault Injection». Dentro del esxi tenemos numerosos script que el soporte de vMware suele utilizar para obtener datos o realizar pruebas.

En este caso dentro de la ruta(abajo), nos encontraremos con algunos scripts de utilidad. En este caso yo voy hacer hincapie en el siguente «vsanDiskFaultInjection.pyc»

/usr/lib/vmware/vsan/bin

¿ Que nos permite realizar este script?

Si alguna vez hemos querido simular la extraccion o el fallo de algun disco, este es tu script. Gracias a este script podremos comprobar como se comporta nuestro cluster de vSAN a la hora de un fallo de uno de nuestros discos.

Pasemos a la accion

Procedimiento

Para ello, lo primero de todo es seleccionar un disco, podemos optar por el disco de cache o por alguno de capacidad. En mi caso voy a realizar voy a optar por uno de los de capacidad, por ello, lo primero sacamos un listado con los discos que esta usando el host para el almacenamiento vSAN.

esxcli vsan storage list

Una vez hemos seleccionado el disco, pasamos a lanzar el script. Antes de ejecutarlo os recomiendo lanzarlo con el parametro «-h», para comprobar los tipos de fallo que podemos realizar.

python vsanDiskFaultInjection.pyc -h

Yo en mi caso, voy a ejecutarlo simulando un fallo de disco de capacidad, por ello utilizare el parametro «-p» seguido del device, seleccionandolo con el parametro «-d».

python vsanDiskFaultInjection.pyc -p -d naa.6000c2901e94c1cfe6dae91294b19027

Como podemos observar una vez ejecutado el comando, vSAN ya nos reporta el fallo dentro «Monitor–>vSAN–>Physical Disks».

Al ser un fallo permanente del disco, vSAN comienza inmediatamente a resincronizar todos los objetos para cumplir con las politicas asignadas a las VMs, y resto de objetos y de esta manera tener asegurada la disponibilidad de nuestros objetos.

En mi caso tengo configurado vSAN solo con la compresion activada, por ello cuando falle uno de los discos, no me marcara todo el disk group como "failed", como si lo haria si tuviera activada la "Deduplicacion y la Compresion".

Por ultimo, podemos observar en el log del «vmkernel.log», como inyecta el fallo y despues nos reporta que el disco esta en fallo.

Hasta aqui hemos llegado, espero que os sirva de utilidad y como siempre procurar usarlos en entornos de POC o en una puesta de pre-producion.

Nos vemos en el siguente post.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *