Foros del Web » Soporte técnico » Hardware »

Fallo en sistema RAID1

Estas en el tema de Fallo en sistema RAID1 en el foro de Hardware en Foros del Web. Buenos días: Hace un mes montamos un equipo bajo Windows 2003. Para mejorar la seguridad de la información, preparamos un sistema RAID1 con 2 discos ...
  #1 (permalink)  
Antiguo 26/11/2008, 04:00
Avatar de sedinho  
Fecha de Ingreso: marzo-2003
Mensajes: 91
Antigüedad: 21 años, 1 mes
Puntos: 0
Fallo en sistema RAID1

Buenos días:

Hace un mes montamos un equipo bajo Windows 2003.
Para mejorar la seguridad de la información, preparamos un sistema RAID1 con 2 discos duros de 500Gb.

Ayer, la aplicación notificó un fallo en un disco duro a través de un evento SMART:


El sistema RAID se ha montado con el controlador "Intel(R) ICH8R/ICH9R SATA RAID Controller".
A continuación os dejo el informe que muestra la aplicación que monitorea el RAID:

Cita:
Información del sistema

Kit instalado: 7.6.0.1011
Historial de instalación de kits: 7.6.0.1011
Versión del shell: 7.6.0.1011

Nombre del SO: Microsoft(R) Windows(R) Server 2003, Standard Edition
Versión del SO: 5.2.3790 Service Pack 2 Compilación 3790
Nombre del sistema: SERVIDOR
Fabricante del sistema: Gigabyte Technology Co., Ltd.
Modelo del sistema: EP35-DS4
Procesador: Procesador Intel(R) Pentium(R) III Xeon ~2666 MHz
Versión/fecha del BIOS: Award Software International, Inc. F3, 02/27/2008

Idioma: ESP



Intel(R) RAID Technology

Controlador RAID Intel: Intel(R) ICH8R/ICH9R SATA RAID Controller
Número de puertos ATA serie: 6

Versión de la ROM opcional de RAID: 7.5.0.1017
Versión del controlador: 7.6.0.1011
Versión del módulo RAID: 7.6.0.1011
Versión del recurso de lenguaje del Módulo de RAID: 7.6.0.1011
Versión del Asistente Crear volumen: 7.6.0.1011
Versión del recurso de lenguaje del Asistente Crear volumen: 7.6.0.1011
Versión del Asistente Crear volumen desde disco duro existente: 7.6.0.1011
Versión del recurso de lenguaje del Asistente Crear volumen desde disco duro existente: 7.6.0.1011
Versión del Asistente Modificar volumen: 7.6.0.1011
Versión del recurso de lenguaje del Asistente Modificar volumen: 7.6.0.1011
Versión del Asistente Eliminar volumen: 7.6.0.1011
Versión del recurso de lenguaje del Asistente Eliminar volumen: 7.6.0.1011
Versión de la biblioteca ISDI: 7.6.0.1011
Versión de la Herramienta de notificación de eventos al usuario: 7.6.0.1011
Versión del recurso de lenguaje de la Herramienta de notificación de eventos al usuario: 7.6.0.1011
Versión del Supervisor de eventos: 7.6.0.1011

Array_0000
Estado: No hay ninguna migración o migraciones activa(s)
Caché de escritura del disco duro activado: Sí
Tamaño: 931.5 GB
Espacio disponible: 0 GB
Número de discos duros: 2
Disco duro miembro 1: ST3500320AS
Disco duro miembro 2: ST3500320AS
Número de volúmenes: 1
Miembro del volumen 1: Volume0

Volume0
Estado: Normal
Volumen del sistema: Sí
Caché de escritura no simultánea del volumen activado: No
Nivel RAID: RAID 1 (imagen)
Tamaño: 465.7 GB
Tamaño de sector físico: 512 bytes
Tamaño de sector lógico: 512 bytes
Número de discos duros: 2
Disco duro miembro 1: ST3500320AS
Disco duro miembro 2: ST3500320AS
Agrupación de nivel superior: Array_0000

Disco duro 0
Sintaxis: Miembro de la agrupación
Estado: Evento de SMART
Puerto del dispositivo: 0
Ubicación de puerto de dispositivo: Interno
Modo de transferencia ATA serie actual: Generación 2
Modelo: ST3500320AS
Número de serie: 5QM2T5N5
Firmware: SD15
Compatibilidad con Colocación en cola de comandos nativos: Sí
Caché de escritura del disco duro activado: Sí
Tamaño: 465.7 GB
Tamaño de sector físico: 512 bytes
Tamaño de sector lógico: 512 bytes
Número de volúmenes: 1
Miembro del volumen 1: Volume0
Agrupación de nivel superior: Array_0000

Disco duro 1
Sintaxis: Miembro de la agrupación
Estado: Normal
Puerto del dispositivo: 1
Ubicación de puerto de dispositivo: Interno
Modo de transferencia ATA serie actual: Generación 2
Modelo: ST3500320AS
Número de serie: 5QM2TVX1
Firmware: SD15
Compatibilidad con Colocación en cola de comandos nativos: Sí
Caché de escritura del disco duro activado: Sí
Tamaño: 465.7 GB
Tamaño de sector físico: 512 bytes
Tamaño de sector lógico: 512 bytes
Número de volúmenes: 1
Miembro del volumen 1: Volume0
Agrupación de nivel superior: Array_0000

Puerto no utilizado 0
Puerto del dispositivo: 2
Ubicación de puerto de dispositivo: Interno

Puerto no utilizado 1
Puerto del dispositivo: 3
Ubicación de puerto de dispositivo: Interno

Puerto no utilizado 2
Puerto del dispositivo: 4
Ubicación de puerto de dispositivo: Interno

Puerto no utilizado 3
Puerto del dispositivo: 5
Ubicación de puerto de dispositivo: Interno

Mi pregunta es:

- Para reemplazar el disco duro que está dando fallos, ¿qué debemos hacer? ¿Basta con reemplazarlo y listo o hay que seguir algún proceso para que los datos se copien del disco espejo (el que no falla) al disco nuevo que instalemos?

- ¿Es fiable el mensaje de fallo que está dando la aplicación que controla el sistema RAID? Lo digo porque el equipo lleva funcionando un mes y me extraña que un disco duro Seagate falle en tan poco tiempo.

Saludos y gracias de antemano por sus comentarios.
  #2 (permalink)  
Antiguo 30/12/2008, 17:57
 
Fecha de Ingreso: junio-2008
Mensajes: 3
Antigüedad: 15 años, 10 meses
Puntos: 0
Respuesta: Fallo en sistema RAID1

Hola sedinho:

Lo mismo que te ha pasado a ti me ha estado pasando durante este ultimo mes en tres servidores montados casi con las mismas características que el tuyo. Voy a extenderme un poco sobre el tema, las configuraciones y la solución que aplico yo cuando me ocurre esto:

Los 3 Servidores han sido montados sobre placas ASUS P5Q-PRO (dos de ellos) y P5Q-E (el tercero), los discos duros usados en todos ellos han sido SAMSUNG de 500 GB, se han montado en RAID 1 (dos discos en espejo por seguridad), a la hora de hacer las particiones, se han hecho dos, una de 160 GB para el sistema y programas y el resto se ha dejado para datos, quizá mi error ha estado en no haber montado un disco a parte para el sistema operativo, pero bueno, ahora ya está hecho y no voy a volver a instalar todo de nuevo.

La primera vez que recibí el mensaje de que el Array estaba "Degradado", lo primero que hice fué entrar en la consola de configuración de la RAID y ver que me marcaba un disco dañado (realmente creí que estaba dañado y lo sustituí por uno nuevo), después explicaré el proceso de recuperación de datos, es muy sencillo, mejor dicho, SON muy sencillos ya que existen dos métodos, uno lento (al rededor de 14 horas y otro mas rápido sobre 3 horas, todo depende de la cantidad de datos, la ram, procesador, etc).

Tras cambiar el disco y encender de nuevo el equipo, al pasar por el controlador de la RAID, entro el solito en la consola y me informó que había encontrado un disco nuevo, que si lo quería agregar a la RAID como disco miembro, me lo estube pensando unos minutos, cogí el manual de la placa, no encontré información al respecto y empleé la lógica, le respondí que SI. Pues bien, al entrar al Sistema, el programa de Intel, (Intel Matrix Storage Manager), comenzó a recuperar datos del disco "viejo" al disco nuevo, tardó exactamente 3 horas y 22 minutos, ese servidor estubo funcionando corectamente 1 mes y volvió a fallas tras un apagón y tube que hacer de nuevo la operación.

Esta respuesta te la estoy escribiendo desde el último de los servidores que he instalado y que precisamente hoy 30/12/2008 a las 00:20 horas ha terminado de hacer una recuperación de las largas tras haberse apagado "misteriosamente".

Siento enrrollarme tanto, ahora voy a explicar lo que suelo hacer yo cuando me ocurre un desastre de ese tipo con la RAID.

Solución Rápida:
Antes de hacer nada, entro en la consola de la RAID, la que carga antes de WINDOWS (o el sistema que sea), con control + I y me fijo cuál de los dos discos me está marcando como degradado o dañado, salgo de la consola, apago el equipo antes de que entre al S.O. y desconecto el OTRO HD, (como tengo un mini windows el el JetFlash USB, hago que arranque desde él, sin olvidarme de decirle que agregue un controlador de la RAID que llevo en un Floppy con el conocido F6 y con el maravilloso paragon partition manager, deshago la partición del HD, o sea, lo dejo sin partición ), finalizo las tareas, apago el servidor y nuevamente conecto los dos discos duros, durante el arranque de la maquina entro en la consola de la RAID y si no me propone o me dice que ha encontrado un disco nuevo de lo agrego yo, ¿ como diferenciarlo ?, facil, si a la hora de determinar el disco que estaba dañado te has fijado en cuál de los dos era, seguramente el número de serie es diferente en al menos las 3 ultimas cifras. Bien, una vez agregado en la línea de la consola donde definimos el ARRAY veremos que nos aparece en AMARILLO la palabra REBUILD (esto es en las placas ASUS y me imagino que será en todas aquellas que usen este controlador para la RAID), salgo de la consola habiendo guardado los cambios oportunos y dejo que cargue el S.O., una vez en Windows, si abrimos el programa Intel Matrix Storage Console y la poenmos en: VER -> Modo Avanzado, observaremos que en el Volumen (el que hemos creado en la RAID) está siendo reconstruido, si presionamos el botón derecho del ratón podremos ver cuanto va a tardar en completar la operación, repito que suele ser bastante rápida y el Intel Matrix Storage Console no suele equivocarse mucho en el tiempo, tal vez en 3 o 5 minutos.

Solución Lenta:
La solución lenta es mas sencilla siempre y cuando es servidor no esté soportando mucha carga de trabajo, quiero decir con ello, que no haya muchos usuarios de la red local usando recursos de la máquina y que no estén metiendo datos sin parar.
El propio controlador de la RAID, al detectar algún fallo en el arranque del sistema, si lo cree oportuno, inicia una reconstrucción de datos que suele tardar bastante y si el servidor en cuestión está lejos de tu ubicación y no puedes desplazarte inmediatamente es una buena alternativa, como decía mas arriba, este servidor desde el que te estoy escribiendo la respuesta, ha comenzado la reconstrucción de datos a las 09:00 de la mañana, cuando han detectado que se había apagado y lo han encendido y ha finalizado aproximadamente 15 horas después, pero el volumen ha sido reconstruido correctamente.

Me he fijado que tu empleas una placa GigaByte, por lo que no podemos culpar a los fabricantes de las placas base y tus discos son Seagate, los mios son Samsung, por lo tanto el culpable o es Microsoft o Intel (desde luego, nosotros los usuarios no somos los culpables, ¡ A que NO !)


Si puedo ayudarte en algo mas, no dudes en comentarlo y recuerda, aunque creas que el HD está dañado, es casi seguro que no lo está, es mas bien un aviso de que el controlador de la RAID se asusta y engaña a los pobres discos duros.

Pido disculpas por haberme extendido tanto.
Un saludo.
Fontela
  #3 (permalink)  
Antiguo 07/01/2010, 05:46
 
Fecha de Ingreso: enero-2010
Mensajes: 1
Antigüedad: 14 años, 3 meses
Puntos: 0
Respuesta: Fallo en sistema RAID1

Yo tuve el mismo problema, por desgracia empeoró mi situación porque perdí mucha info valiosa, teniendo así que llamar a una empresa de recuperación de datos, en mi caso llamé a ONRETRIEVAL, hicieron un buen trabajo.

Tener cuidado con este tipo de fallos, pueden ser muy perjudiciales, lo mejor es dejarlo en manos de expertos.
  #4 (permalink)  
Antiguo 07/01/2010, 08:24
Avatar de Myakire
Colaborador
 
Fecha de Ingreso: enero-2002
Ubicación: Centro de la república
Mensajes: 8.849
Antigüedad: 22 años, 3 meses
Puntos: 146
Respuesta: Fallo en sistema RAID1

Revivir tema viejo y con spam
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Tema Cerrado




La zona horaria es GMT -6. Ahora son las 01:45.