当前,人类的社会活动越来越依赖于各种数字化的信息。随着计算机网络的发展,软硬件技术的进步,人类社会的数据总量呈现爆炸式地增长。据估计,对于存储容量的需求每个月就要翻一番。近年来,云计算、云存储、物联网等新兴技术的发展,更加需要海量存储系统的有力支撑,因此现在大型互联网企业的内置硬盘盒正变得越来越多、越来越大。
1、高可用性
在模型发出硬盘故障预警后,重要的就是对故障预警的处理方法。要把主动容错机制引入实际的大规模存储系统,必须要制定好故障预警处理的策略。针对模型预测出即将发生故障的硬盘,系统必须及时迁移保护其上的数据,这样能够提高数据的可靠性,并保持系统的高可用性。目前,大规模存储系统普遍采用副本或者纠删码作为冗余机制,预警处理直接的方法就是将潜在的故障盘上的数据简单拷贝到系统的其他硬盘或者新的硬盘上。
2、运算安全性
对于采用纠删码的存储系统而言,采用主动容错机制的一个优点是提前迁移备份数据对用户的正常读写性能影响较小,低于硬盘发生故障后重构数据的开销。当釆用纠删码的存储系统发生硬盘故障后,系统处于降级模式,需要替换新的硬盘并在新的硬盘上通过解码运算重构出已经丢失的数据或校验。而采用主动容错机制后,对于潜在故障硬盘上的数据可以提前进行迁移备份,这时直接采用拷贝操作即可,无需进行编解码的运算。
如果系统能够做到数据迁移平均时间小于故障预测的平均提前时间,则可以明显减小系统处于降级模式的概率,减小重构数据的磁盘读写、网络传输开销和编解码运算操作,将内置硬盘盒故障预测的性能转化为存储系统可靠性和可用性的提升。