题 SSD驱动器和机械驱动器一样可靠吗(2013)?


SSD驱动器已经存在了好几年了。但可靠性问题仍然存在。

我想这是4年前发布的这个问题的后续跟踪,最后一次更新是在2011年。现在是2013年,已经发生了很大的变化?我想我正在寻找一些真实的证据,而不仅仅是一种直觉。也许你在你的DC中使用它们。你的经历是什么?

ssd驱动器的可靠性


更新:

它现在是2016年。我认为答案可能是肯定的(遗憾的是,它们仍然每GB的成本更高)。

本报告提供了一些证据:

生产中的闪存可靠性:预期和意外

关于(消费者)机械驱动器的一些有趣数据:

Backblaze:硬盘数据和统计数据


159
2018-05-14 04:11




为什么你说可靠性问题仍然存在? - ewwhite
我妻子的笔记本电脑SSD每隔几个月停止工作,需要一个奇怪的“通电,但不要尝试启动20分钟”修复。然后再好了。新技术,失败的新方法。 - Jaydee
只是单一的数据点,我担心:去年9月我买了一台MacBook Retina Pro,并在60天内发生终端SSD故障。更换装置一直很好,但我现在非常警惕,因为用户更换/升级这些并不是一种选择。 - Roddy
无论如何,你不需要可靠的驱动器。如果它在每天下午2点失败,您将能够依靠它来设置您的手表。你想要的是弹性驱动器。 - Alan B
固态硬盘已经存在 很多 比“现在几年”更长。实际上,更像是40,即使你的意思是基于闪存的固态硬盘,我们也谈了近20年。 - alastair


答案:


这将取决于您的工作量和您购买的驱动器类别...

在我的服务器部署中,我没有正确规范的SSD故障。这涉及许多不同类型的驱动器,应用程序和工作负载。 

请记住,并非所有SSD都相同!

那是什么呢 “正确的,只具备” 意思?

如果你的问题是关于在企业和服务器应用程序中使用SSD的问题,那么自从过去几年以来,这个问题发生了很大变化 原始问题。以下是一些需要考虑的事项:

  • 确定您的用例: 有消费者驱动器,企业驱动器甚至 坚固耐用的工业应用SSD。不要购买适合桌面使用的廉价磁盘,并在其上运行写密集型数据库。

  • 有许多形状因子可供选择: 今天的SSD可以在PCIe卡,SATA和SAS 1.8“,2.5”,3.5“和其他变体中找到。

  • 为您的服务器使用RAID: 在服务器情况下,您不会依赖单个机械驱动器。为什么你会为SSD做同样的事情?

  • 驱动器组成: 有基于DRAM的SSD,以及MLC,eMLC和SLC闪存类型。后者具有有限的寿命,但它们由制造商明确定义。例如你会看到每日写限制 5TB /天3年

  • 推动申请事宜: 某些驱动器用于一般用途,而其他驱动器则是读取优化或写入优化的。基于DRAM的驱动器就像 sTec ZeusRAM 和 DDRDrive 不会磨损。这些是高写入环境和前置较慢磁盘的理想选择。 MLC驱动器往往更大并且针对读取进行了优化。 SLC驱动器的寿命比MLC驱动器好,但企业MLC对于大多数情况来说确实足够好。

  • 修剪 似乎并不重要: 硬件RAID控制器仍然 似乎并不完全支持它。大多数时候我使用SSD,它将采用硬件RAID设置。这不是我在装置中担心的事情。也许我应该?

  • 耐力:过度配置在服务器级SSD中很常见。有时这可以在固件级别完成,或者只是通过正确的方式对驱动器进行分区。磨损均衡算法也更好。有些驱动器甚至可以报告生命周期和耐久性统例如,我的一些HP品牌Sandisk企业级固态硬盘就显示出来了 98% life remaining 经过两年的使用。

  • 价格大幅下跌: 固态硬盘的价格合理:许多应用的性能比。当真正需要性能时,现在很少会默认使用机械驱动器。

  • 声誉得到巩固:  例如英特尔是安全的,但不是高性能的。 OCZ 是不可靠的。 SandForce的基于驱动器很好。 STEC / STEC 非常坚固,是许多高端阵列驱动器的OEM。 Sandisk公司/ Pliant是类似的。 OWC 拥有出色的SSD解决方案,可为低影响服务器和工作站/笔记本电脑部署提供卓越的保修。

  • 掉电保护很重要: 查看具有超级电容器/超级电容器的驱动器,以便在电源事件期间处理出色的写入。一些驱动器通过板载缓存提高性能或利用它们来减少磨损。 Supercaps确保将这些写入刷新到稳定存储。

  • 混合方案: 硬件RAID控制器供应商能够利用SSD扩充标准磁盘阵列,以加速读/写或充当智能缓存。 LSI有 的CacheCade 和它的 Nytro硬件/软件 产品。软件和操作系统级解决方案也可用于在应用程序,数据库或管理程序系统上提供本地缓存。高级文件系统 ZFS 非常智能地使用读取和写入优化的SSD; ZFS可以配置为使用单独的设备进行辅助缓存和意图日志,并且即使对于HDD池,SSD也经常以该容量使用。

  • 顶级闪存已经到来: PCIe闪存解决方案如 FUSIONIO 已经成熟到组织可以轻松部署依赖于提高性能的关键应用程序。设备和SAN解决方案如 RanSan 和 小提琴记忆 仍然在那里,更多的参赛者进入那个空间。

enter image description here


173
2018-05-14 04:52



TRIM在驱动器中非常重要,只需很少的过度配置,这在消费者驱动器中非常重要,其中$ / GB非常重要。大多数企业驱动器都有足够的过度配置,以至于TRIM没有任何区别。 - Mr Alpha
@MisterSmith看看我上面写的内容。不同的SSD具有不同的特性。使用正确的工具完成工作。如果我要拿一个 海盗 或其他消费级驱动器,并将其用作主动写入数据库系统的SSD或作为 ZIL 日志设备 对于ZFS存储阵列,我会在一两个月内烧掉它。 - ewwhite
优秀的帖子。我的一个小问题:RAID控制器并不总是SSD的正确选择。 RAID控制器设计用于条带化数据并在多个磁盘上添加纠错码。 SSD控制器已经 原生条带数据并添加纠错码 跨越多个NVRAM银行。此外,添加RAID控制器会引入一个额外的SPOF,即RAID控制器本身。使用单独的RAID控制器是 经常 正确的选择,但是 有时 用一个 更好的SSD (更高级别的SATA / SAS甚至像Fusion-IO这样的PCI-E卡)是一种 更好 选择。 - Jesper Mortensen
@rickyduck,实际上在数据中心,单个驱动器故障受RAID保护,并且意味着花费几个$$$来替换它而没有停机时间;而在游戏装备中,单个驱动器的故障是总数据丢失,并且OS重新安装。
@MisterSmith甚至高端桌面固态硬盘每GB的价格也低于典型数据中心使用的固定硬盘。除了在某些情况下功能更强大的控制器(或者只是为了吞吐量而不是突发性能而调整的低容量固件),它们可以从生产运行的顶部获得最佳闪存,因为许多服务器工作负载比桌面数据集的IO密集程度高出几个数量级驱动并迅速杀死消费者驱动器。 - Dan Neely


自2009年以来,我工作的每台笔记本电脑都配备了SSD或Hybrid。我的SSD经验总结如下:

  • 我称之为“第一代”驱动器,主要销售于2009年左右:
    • 在第一年大约1/4死亡,几乎全部来自猝死综合症(SSD - 这很有趣,笑)。这对最终用户来说非常明显,而且很烦人,但是 激烈 速度差使这种恒定的故障模式可以容忍。
    • 3年后,所有的驱动器都已经死亡(突然死亡或磨损),除了两个仍在踢的人(实际上现在服务器中的L2Arc驱动器)。
  • 2010-11期间出售的“第二代”驱动器与上一代不同,因为他们的猝死综合症率急剧下降。然而,磨损“问题”仍在继续。
    • 第一年后,大多数驱动器仍然有效。有几个突然死亡。一对夫妇因磨损而失败。
    • 在2 - 3年后,一半以上的人仍然在工作。第一年的失败率基本上仍在继续。
  • 2012年销售的“第三代”驱动器仍在使用。
    • 第一年后仍然工作(敲木头)。
    • 我所拥有的最古老的车道是从2012年3月开始的,所以还没有2到3年的数据。

SSD Failure (Cumulative)


2014年5月更新:
一些“第二代”驱动器已经失败,但大约三分之一的原始驱动器仍在工作。上图中的所有“第三代”驱动器仍在工作(敲木头)。我听过别人的类似故事,但他们仍然会发出同样的警告 快速的翅膀死亡。警惕将保持他们的数据良好的备份。


58
2018-05-14 04:27



我的经历与此相呼应。也就是说,我们仍然为员工提供USB硬盘驱动器作为时间机器备份(除了我们的标准异地备份方案),以便在发生灾难性故障或丢失时进行快速,精细的恢复。 - EEAA
再过一两年给第三代。 ;) - Andy
另外值得注意的是SSD比HDD更容易遭受固件错误;固件更复杂,更不成熟,这不是一个很好的组合。 - alastair
@Andy是对的。从2009年开始,你说半衰期大约是一年。对于2010年至2011年,我们现在只有3岁时处于该范围的中间位置,在此表示半衰期为3年。这只能基于目前的观察。 2012年和2013年驱动器的半衰期是否已经提升至3年以上,至少要到2016年才能确定。(我们可以尝试从早期故障中推断,但这些可能只是孤立的制造缺陷,而不是长期造成的 - 经常使用。) - Andrew Vit
自2010年以来,我一直在使用2 x Intel X25M 80Gb G1。我的工作涉及繁重的读/写过程。每隔几个月左右,我重置驱动器(我没有必要)以恢复性能,否则零问题。我去年增加了256Gb三星230。到目前为止没问题! - Antillar Maximus


根据我的经验,真正的问题是垂死的控制器,而不是闪存本身。我安装了大约10个三星固态硬盘(830,840 [不专业])到目前为止它们都没有出现任何问题。完全相反的是使用Sandforce控制器的驱动器,我在OCZ敏捷驱动器上遇到了一些问题,特别是在不规则的时间间隔内冻结,驱动器停止工作直到我关机/在计算机上。 我可以给你两个建议:

  1. 如果您需要高可靠性,请选择带MLC的驱动器,更好的SLC闪存。三星840 f.e.有TLC闪存和短保修,我想不是没有任何理由;)

  2. 选择一个已知稳定的控制器的驱动器。


17
2018-05-14 09:39



让我想起当前基于LED的照明的垂死控制器。 LED持续很长时间但控制器似乎没有。 - Matt
谁知道,但也许它是行业计划过时的一部分:) - klingt.net


www.hardware.fr 法国最大的硬件新闻网站之一是合作伙伴 www.ldlc.com 法国最大的在线经销商之一。他们可以访问他们的返回统计数据,并且自2009年以来每年两次发布故障率报告(主板,电源,RAM,显卡,硬盘驱动器,SSD等)。

这些是“早死”统计数据,使用时间为6个月至1年。直接返回制造商也无法计算,但大多数人在第一年返回经销商,不应影响品牌和型号之间的比较。

一般而言,硬盘故障率在品牌和型号之间的差异较小。规则是更大的容量>更多的拼盘>更高的故障率,但没有什么戏剧性的。

固态硬盘故障率整体较低,但有些SSD型号非常糟糕,在您要求的时期(2013年),臭名昭着的产品的回报率约为50%。现在似乎已经停止了这个臭名昭着的品牌被收购。

一些SSD品牌正在“优化”他们的固件只是为了在基准测试中获得更高的结果,而你有时最终会冻结,蓝屏......现在这似乎也不像2013年那样成为一个问题。

失败率报告在这里:
2010
2011(1)
2011(2)
2012(1)
2012(2)
2013(1)
2013(2)
2014(1)
2014(2)
2015(1)
2015(2)
2016(1)
2016(2)


10
2018-05-14 08:11



这是法国文章自动翻译版本的链接 translate.googleusercontent.com/... - SDwarfs



0
2017-09-05 07:39