Y falló un disco

O... la prueba real de la configuración RAID de mi servidor.

Pues si, el primer disco (hda) de los tres que componen el RAID5 (hda,hdc,hdg) ha dicho que no quiere trabajar más. Sin problemas, recibo un email del monitor de RAID avisándome que el disco está fallando y lo saca del RAID.

Bien, el siguiente paso lógico es comprar un nuevo disco para sustituir al afectado. Voy a comprar otro disco de 300G pero sólo encuentro SATA. No importa, le enchufo una controlador SATA PCI, le conecto el nuevo disco (sda), quito el defectuoso (hda) y arranco de nuevo la máquina... y no arranca.

Momento de pánico...

Bien, no aparece nada en pantalla, o sea no carga ni el bootloader (GRUB). Así que sospecho que el problema está en que justamente ha fallado el disco principal (hda). Lo vuelvo a conectar y por suerte el disco no estaba totalmente irrecuperable y logro arrancar el sistema de nuevo.

Al parecer lo que indiqué en el artículo anterior no es del todo correcto. Curiosamente creí haberlo probado convenientemente. Al final mediante el wiki de Gentoo (aunque uso Debian) probé el mecanismo alternativo de configurar GRUB. Arranqué y funcionó.

Así que tengo dos teorias:

  • El procedimiento que utilicé originalmente no es correcto y lo probé mal.
  • El procedimiento original era correcto pero con los cambios de kernel y actualizaciones automáticas del GRUB se debería volver a ejecutar con cada actualización de kernel.¿Alguna idea?

Actualización 25/2/09: Vaya, hace tiempo de esta entrada. Pero revisando el blog la he encontrado y queria actualizar este tema. El enlace a la web de Gentoo está roto porque hay una nueva versión que de paso tiene la solución correcta.

Los pasos serian así, os pongo un ejemplo en el que queremos actualizar el tercer disco (/dev/sdc) para que arranque (de la primera partición, /dev/sdc1):

  • device (hd0) /dev/sdc
  • root (hd0,0)
  • setup (hd0)

Así que se trata de una variación del anterior haciendo "creer" al sistema que el disco /dev/sdc es el primero (en realidad si falla el otro y hay que cambiar el orden del RAID, así será). Como siempre, YMMV.