|
本帖最后由 Accelerator 于 2020-3-25 08:50 编辑
2016年12月组装了一台服务器,用的是酷鱼2 TB硬盘。到现在大约三年半基本是每天24 h满负荷使用,前几天发现硬盘坏了。
故障表现是SSH突然无法执行任何命令,提示磁盘处于只读状态,想重新连接就再也连不上了。手动断电进入recovery模式,fsck执行不动,拿去tb上的硬盘维修店铺得到的答复是磁头损坏,盘片有划伤,数据恢复可能性不大,正在积极尝试中。
这件事带来的启示是家用机械硬盘满负荷使用可能到3年左右就比较危险了,越是临近这一时间点越是要注意多做冷备份。如果买监控盘之类的不知道会有多少改善。
这台机器是楼主大二时买的,当时还买不起较好的,选便宜的买了个8核的cpu,32 GB内存,主板上另一路只能空着,请全系的同学过来一起花了两天的时间才装好。大家都没装过机器,还记得大霜塔请两个男生左右平衡花了一晚上才装上去。后来发现2696v3好之后就换了个cpu,结果因为不懂行情,咸鱼上出旧的CPU时开价竟然比原价低了四分之一。当时晚上宿舍会断电,就早上七八点一起来就开机,把输入文件拷上去(当时还不知道可以用SSH),执行一整天,晚上看情况再拷回来关机等第二天再来。后来配置好了SSH和PBS,又找到了可以不断电的地方,就成为自己的集群里的第一个节点了。名字叫iroha。
后来发现iroha的主板有一路是坏的,想要扩建成双路,也就不了了之,一直用到今天。
后来同学出资建立了第二个节点4669v3*2,128 GB(akane),自己又出资买了Gold 6139*2, 128GB(usubeni)和4660v3*2 64GB(eriri),有了另外三台之后iroha由于运行慢就用得不多了,主要用作一些优先级比较低的项目。作者一直以来的所有文章iroha都有不少参与,特别是第一篇文章,对应的工作的两年间除去最后一个月外都是iroha在做,想起来就像是抱病的老友的感觉。这位老友今后是会以新的姿态继续和自己一同工作,还是会永久性失忆,只好取决于这次硬盘的危机能否被抢救过来了。
|
评分 Rate
-
查看全部评分 View all ratings
|