No hay nada más desagradable que tener toda la información en un Disco Duro y que éste, sin previo aviso, falle. En efecto, muchas veces la información perdida es invaluable y las consecuencias de ese desastre no sólo se miden por el valor de un Disco Duro nuevo. De hecho, estos dispositivos han bajado tanto de precio que cada vez fallan más rápido y cuando menos se espera. Causas hay muchas, pero no siempre es simple individualizarlas.
Siendo una Compañía con una de la infraestructuras de Investigación y Desarrollo más grandes del mundo, Google tiene la oportunidad de dedicarse no sólo la «búsqueda por Internet«. De vez en cuando,
Existe una regla casera para reemplazar los Discos Duros, la cual le ha enseñado a los clientes a mover la información de un HDD a otro cada cinco años. Pero específicamente, la naturaleza mecánica de los dispositivos de almacenamiento masivo los hacen más vulnerables y, uno de estos aparatos, puede llegar a fallar mucho antes que la marca de los cinco años. Tradicionalmente, condiciones ambientales extremas son citadas como la principal razón de colapso de los HDD, siendo las más importantes la temperatura y el exceso de actividad.
Un estudio de Google, presentado en
Google indicó que junta «información vital» de prácticamente todos sus sistemas cada pocos minutos y guarda esa información para posteriores análisis. Por ejemplo, esta información incluye factores ambientales (tales como temperaturas), niveles de actividad y parámetros SMART («Self-Monitoring Análisis and Reporting Technology» o «Tecnología Análisis y Reporte de Monitoreo Propio«), los cuales son considerados buenos indicadores para describir la salud de un Disco Duro.
En general, la población de HDDs de Google evidencia un aumento en la tasa de fallas con la edad de la unidad. Dentro del grupo de los dispositivos con un año de edad, el 1.7% de ellos tuvo que ser reemplazado debido a problemas. Esta tasa aumenta al 8% para el caso de los dispositivos de 2 años de antigüedad y al 8.6% para los de tres. De esos resultados, es posible deducir que la tasa de falla suele estabilizarse mientras más antiguas son las unidades pero Google cree que la confiabilidad de los HDDs con más de 4 años de uso está más influenciada por «cada modelo en particular en vez de por los efectos de la edad misma.«
Observando el estudio desde el punto de vista de diferentes niveles de utilización, lo resultados que se obtienen son bastante interesantes. Sólo unidades con una edad de seis meses o menos, demostraron una decida mayor probabilidad de falla al ser puestas en un ambiente de alta actividad. Una vez que los HDDs sobreviven sus primeros meses, la probabilidad de falla debido a
alto uso decrece en el año 1,2,3 y 4 pero, aumenta significativamente en el año 5.
La investigación de la temperatura por parte de Google mostró otro sorprendente hallazgo,
«Las fallas no aumentan con un aumento promedio de la temperatura. De hecho, existe una clara tendencia que indica que las bajas temperaturas están asociadas a mayores tasas de fallas. Sólo a muy altas temperaturas esta tendencia se invierte.»
Por otro lado,
Similarmente, conteos de reubicación, un número que resulta de reubicar sectores defectuosos a un nuevo sector físico, pueden tener un dramático impacto en la vida útil de un HDD. Google indicó que las unidades con una o más reubicaciones fallaban más a menudo que aquellas que no las tenían. El 85% de los Discos Duros sobrevivió los ocho meses luego de la primera reubicación.
Google determinó similares efectos en Discos Duros en otras categorías de la tecnología SMART pero, en general, los resultados obtenidos revelan que el 56% de todas las unidades defectuosas no tenían ninguna relación con alguna de estas categorías, lo cual significa que más de la mitad de todos los dispositivos con fallas fueron retirados de operación por factores distintos a errores de escaneo, número de reubicaciones, etc.
En resumen, la investigación de Google no resuelve el problema de predecir cuando un Disco Duro fallará. Sin embargo, demuestra que la temperatura y el excesivo uso no son los únicos responsables de las fallas. Además, el estudio apunta a una tendencia que ellos llaman «fase de mortalidad infantil«, un periodo inicial de la vida de un Disco Duro en el cual existen crecientes probabilidades de defectos bajo ciertas circunstancias. El reporte adolece de una clara conclusión pero los autores indican que en la actualidad no existe un acercamiento que pueda predecir las fallas en los Discos Duros. Según ellos,
«Poderosos modelos predictivos deben hacer uso de señales que van más allá de las entregadas por las tecnología SMART.»