计算化学公社
标题: 淘宝店购买双路2696v3服务器的过程、使用感受和杂谈 [打印本页]
作者Author: sobereva 时间: 2017-7-10 23:19
标题: 淘宝店购买双路2696v3服务器的过程、使用感受和杂谈
后记:写本文的5年后,在2022年9月末,笔者又购买了新的服务器,是双路2696v3性能的3.5倍,强烈建议一看:《淘宝上购买的双路EPYC 7R32 96核服务器的使用感受和杂谈》(http://sobereva.com/653)。
后记:在买这台服务器后没多久又买了个PM961高速硬盘,相关讨论见《硬盘速度与内存容量对量子化学计算速度影响的测试》(http://sobereva.com/397)。
淘宝店购买双路2696v3服务器的过程、使用感受和杂谈
The process of purchasing a dual-socket 2696v3 server, usage experience and gossip
文/Sobereva @北京科音 First release: 2017-Jul-10 Last update: 2018-Apr-16
自从笔者在http://bbs.keinsci.com/forum.php?mod=viewthread&tid=5418提及过E5 2696v3之后,此U在计算化学公社的“硬件配置与采购”版中就逐渐火了起来,现在几乎成了坛友皆知的秘密。此U的神奇之处就在于,它是正式版但是价格却只有ES版的水平。其规格和v3里最强的2699v3是等同的,即18核,基准频率2.3GHz,全核睿频2.8GHz,撰文时TB价一颗仅4750元。正式版却有如此神奇的性价比可以说彻底颠覆了常规观念,真乃穷人的法拉利。之所以价格这么bug,是因为它是OEM特供品,不在正规渠道流通,Intel ARK上也查不到。在撰此文时,2696v3无疑是购机的绝对不二之选,性价比碾压任何正式版CPU。虽然也有类似于2696v3的v4版,即2696v4,规格等同v4里最顶级的2699v4,是22核,全核睿频也是2.8GHz,但是价格比2696v3贵非常多,而考虑到v4比v3同频性能没有改进,量化程序大多数并行效率不佳,22核比18核占不了太大便宜,所以2696v4暂不值得推荐(但当2696v3没货的时候,2696v4则是首选之一)。
然而有人对2696v3这U,以及TB上购买组装服务器还心存疑虑,笔者这里就把近期从TB商家处购买双路2696v3+256GB内存的服务器的经历、各种细节和使用感受在此文说说。希望此文对欲买机子的人能提供有益的参考,并且看过此文的人以后不会被某些JS坑,少花冤枉钱。
在本文末尾,给出了时下最推荐、性价比最高的基于2696v3的单路和双路服务器配置,其中很多细节在本文都提到了,在淘宝上很容易买到。
声明:笔者不拿任何服务器厂商好处费、广告费。实际上,曾有服务器厂商想付钱在计算化学公社论坛上要广告位,也被笔者断然拒绝,一方面不想给坛友增加视觉负担,另一方面也为了维持论坛的纯粹性和客观公正性,杜绝商业因素侵入。虽然笔者对买的这机子很满意,但笔者不打算给出经销商的信息,也请勿问笔者在哪买的,请自行淘宝搜索,能提供相同配置相似价格的服务器商家很多,看看商家的信誉度、客户评价就能判断靠谱性。
1 购机途径杂谈
鉴于一些刚入行的人对于购机渠道不清楚,这里就先随便说几句。
服务器商家,从规模由大到小、价格由高到低、订制灵活度由低到高可以分为三类:
(1)联想、曙光、DELL等一线知名大牌子,有一定自己的研发能力,一些部件都是定制的。这类商家报价价格较高,适合不差钱的买家。
(2)国内的一些服务器生产厂家。厂商我就不提了,有一大堆。这些厂家实力比(1)要弱,规模小,自己没有研发能力,往往都是拿现成的超微等厂商提供的现成平台(主板+机箱+电源套装),自行把CPU、内存、硬盘等部件装上提供给客户。这类厂商提供的同等配置的服务器价格比(1)要低,除非是碰见JS看客户不懂而漫天要价的情况。
(3)服务器攒机商。就是把各种散件装在一起,这就是电脑城里攒PC的那些人改成了攒服务器,不过他们的知识、经验水平整体来说是那些攒PC的没法比的。这些服务器攒机商很多都有淘宝店,提供的服务器性价比是最高的,你自己去淘宝上把散件都一一买回来,总价格往往也不比这些攒机商给的低。而且经由他们组装,还免得自己折腾,或者碰见某些硬件不兼容的时候得麻烦地寄来寄去调换。从这类商家买,可以对所有配件根据自己的需要来调整,灵活度是最高的。如果买机子纯粹自己私用,从这类商家买是不二之选,而且增加税点的话他们大多也都能开发票。不过,如果走招标之类途径,他们应该没兴趣参与,只有(1)、(2)类才会参与。
至于服务器的质量,上面三类商家的东西一般不会有太大差异。虽然看似(3)是自行组装的,仿佛没品牌机可靠,但由于用的也都是大厂配件,发货前一般也都经过长时间满载拷机和兼容性测试,而且他们销量往往也不小,也有足够的经验,所以不会有什么问题,何况也照样能提供起码一年质保。不过由于(3)的规模小,人手紧,能提供的技术支持程度一般不如前两类,能提供上门服务的较少,送货大多也都是走快递,如果一次买一大批机子,想组集群而自己又没经验,或者买来不是纯粹自己私用又不想之后自己操心,或者需要预装一些本领域常用的计算程序而自己水平太烂又懒得鼓捣,那还是从前两类商家那里买为宜。
至于信誉,(1)是肯定没问题的,(2)和(3)我看半斤八两,都有良心和黑心商家。(3)比(2)更为透明一些,从淘宝店上还能看见客户评价,而且类似配置的价格也可以在淘宝上方便地对比。而如果从(2)购买,若自己没有硬件常识,而且又不知道货比三家,也不经常看计算化学公社的“硬件配置与采购”版了解行情,那么3、4万的配置被忽悠到8、9万都不是不可能,这种事有不少先例。
2 从淘宝店购机过程
能提供双路2696v3服务器的商家在淘宝上有很多,由于其中没有之前打过交道的,所以也在不同商家之间反复对比、犹豫了许久。为了谨慎起见,还是打算去实地看一下,而且还需要对配置进行修改,在网上通过旺旺担心说不清楚。而且我对机子噪音很敏感,因为服务器放家里,往往不分昼夜满载运行,噪音大了吵着楼上楼下睡觉会很麻烦,所以需要现场听一下。最后要了两个商家的地址,他们在中关村都有店,一个在e世界财富中心,一个在鼎好,他们提供的几乎完全一样的配置价格都一样,都是13799元,默认配置都是2*E5-2696v3+16GB内存+120GB固态(无显卡)。差别也就是机箱样式不同和主板不同,主板一个是X10DRL-i,一个是X10DAL-i。由于前者带集显,偶尔可能用得上,于是就先去了前一家,打算如果感觉不靠谱的话再去另一家,反正离得近,也就500米。
e世界财富中心从e世界商场背面进。由于中关村早就黄了,e世界已经大门紧闭,但是作为写字楼的e世界财富中心还有很多租户。到了7楼,往里走了走,就看到卖服务器的店家。那个店有两间屋子,总共也就30多平米,挺挤的。入口的屋子里有三个人,一个是老板,另外两个像是打杂的。这个商家是主要卖图形工作站的(TB上服务器攒机商貌似多半客户都是搞3D作图、影视处理的),也难怪周边堆了一大堆GTX1080的盒子。里面那个屋子是装机室,台子上放了大概五六台服务器,有的正在测试,有的是正要发货的。
和店主商量配置比较顺利,做了以下修改:
(1)增加希捷4T企业级硬盘,加了1000元出头。其实2T也够用了,不过2T也得800元,还不如多花两百多上4T。
(2)增加影驰铁甲战将480GB固态,加了960元。原先标配的120G固态折了大概400元
(3)加了8条32GB内存,共256GB,每条加了1500元。原先标配的16GB折了大概八九百元
(4)加了个光驱,华硕的D刻,100元。作为纯计算用的话倒没太大必要加,装系统用Ultraiso做启动U盘就行了。
我要改什么配置商家都很痛快答应,价格给的也都确实是底价,而且原配件折价的价钱也很公道。商家明显不是那种为了几十块钱会来回讨价还价的那种。商家业务上的事极多,在店里呆的不到半小时的时间里,只见他一会儿淘宝旺旺收到客户发的消息,一会儿接电话,一会儿收到短信,一直忙个不停,看样子生意挺好。(之前在淘宝上看到有用户评价,说是买之前消息回复都很及时,买了之后遇到软件上的问题就回复不怎么及时了。这也没办法,一些弱智用户自己软件上的事还麻烦店主,店主又这么忙,不可能很周到去一一解答)
最后商家打印出的装机单如下,比预想的便宜,才27159,还以为得3w。这价格比标配贵了一倍,基本都花在内存上了。实际上,对于一般量化目的的用户,这个CPU配置,用64GB也够,最多128GB足矣,没必要学我用256GB。这配置128GB内存的话才区区2w左右(若换成大品牌,用正规渠道U的话,起码得4w)。
(, 下载次数 Times of downloads: 402)
虽然商家没有给其它的材料诸如质保单、收据,但这个装机单上质保时间、金额等信息都很充分,也盖着章,质保靠这个就行了。
到店里的时间已经是下午了,要是当天发货说是要等到晚上七点,因为要有装机和拷机的时间。由于不方便等,于是就先交了2000块钱当订金,就回家了,约好是第二天上午派人送货。商家发了两个他们店两个服务器链接给我,一个是双路2696v3,一个是单路2696v3,合计价格都没超过待付款25159。他让我都拍下来,备注上写上配置的改动,然后等他改完价格成为实际待付款金额后再付款。于是我回去后就拍了下来,按他说的修改了备注,他也改了价格,然后就付款了。第二天等了一早上服务器也没送来,后来商家说下午发顺丰,次日上午不到九点就收到货了,然后用了一天没发现问题,就在淘宝上确认收货了。(他让我拍下两件,而不是只拍一件后改价格,9成可能性是为了这样能在淘宝上显示的销量更多)
购机前令我犹豫纠结了N个小时的事是用不用水冷。商家标配的是两个不知什么牌子的侧吹散热器,一方面担心标配风冷的可能噪音大影响深夜楼上楼下休息,另一方面担心2696v3必定也是发热大户,在夏天时那散热器能不能压得住这U长期满载。鉴于噪音和散热能力的考虑,特别想加个酷冷冰神II 120mm版,这算是优秀的高端水冷,噪音普遍评价比较小,散热能力不亚于其它厂家的240mm冷排的,压2696v3没问题,可惜价格贵,699一个。虽然这个还有240mm冷排版还能降几度,但价格就更高了,而且噪音必定更大。商家配的这个机箱倒不错,能装倆240mm的水冷,而且还剩一个120mm的空位。这个商家推荐他们自己找鑫谷定制的120mm水冷,估计也就是市面上两百多块钱水冷的水准。然而,低端、中端的120mm水冷,无论在静音上还是散热性能上都拼不过同档次风冷(虽然冷排风扇噪音没多大,但是泵容易比较响,而且也看rp),再加上鑫谷这牌子我一直看不上眼,犹豫再三还是放弃了。他们用的风冷据说是找厂家定做的,无论对哪个档次的U都用同样的这个风冷,实际听了听他们正在测试的机子的这个风冷,感觉噪音不大,卖相还可以,于是最终决定先用标配的风冷看看情况,之后若真有必要的话再上酷冷冰神II。
3 机子的硬件和照片
购机后隔了一天顺丰把机子送来了:
(, 下载次数 Times of downloads: 405)
包装相当上心,打开最外层后:
(, 下载次数 Times of downloads: 390)
揭掉缓冲膜,打开机箱的箱子:
(, 下载次数 Times of downloads: 433)
再去掉一层缓冲膜和塑料泡沫,就看到机子了。没想到在机箱里面也塞满了缓冲物,不得不说商家在包装上真是超用心,从里到外共用了三层缓冲。
(, 下载次数 Times of downloads: 379)
(, 下载次数 Times of downloads: 409)
除了机子,附件就一跟主机电源线,还送了一个16G优盘(市值50元),便于用户装系统。
(, 下载次数 Times of downloads: 377)
卖家有四种机箱可以选,综合来说,还是这个先马Titan机箱最好,售价才290元,却十分宽大,比一般机箱大一圈,做工不错,设计相当科学合理,还能装E-ATX服务器主板!装服务器几乎不用考虑其它机箱了,Titan这个是极佳选择。下面把各个细节依次说说。
此机箱按钮和接口都在上方,且有两个面板风扇调速杆(但是对当前这服务器好像这倆滑杆没什么调节效果,不知道是线没插,还是效果太微弱感受不到)
(, 下载次数 Times of downloads: 372)
背面没什么特别的。电源是下置的,电源从机箱下方进风(机箱下方有一定空间)
(, 下载次数 Times of downloads: 394)
(, 下载次数 Times of downloads: 386)
机箱的前面板的铁丝网可以很方便地取下来,便于装前置风扇。这俩带红色LED灯的前置12cm风扇是Titan机箱自带的。这个位置装冷排也是可以的。
(, 下载次数 Times of downloads: 401)
上方的铁丝网面板也可以很方便地卸下,用于装顶部的机箱风扇或者冷排。
(, 下载次数 Times of downloads: 375)
机子内部。机箱也自带了后部的12cm风扇。此机箱有三个固态硬盘位,正面可以固定两个
(, 下载次数 Times of downloads: 387)
背面。白盒子是第三个固态硬盘位。机箱下方有两个机械硬盘位
(, 下载次数 Times of downloads: 353)
细节
(, 下载次数 Times of downloads: 385)
由图可见卖家装机水平是挺专业的,再加上此机箱支持背部走线,正面看着走线非常整洁。
毕竟不是家用主板,所以主板没有集成声效芯片,但是很多人买这机子当图形工作站用,或者做影视编辑之类,还得用得到声卡,故商家白送一个声卡。稍有硬件常识的人都知道,这是个极low的声卡,8738是十几年前二手市场就一簸箕一簸箕的10块钱一块的东西,现在支持了PCI-E接口居然还活着。
(, 下载次数 Times of downloads: 384)
此主板有集显,这对搞量化计算的还是挺有益的,省得再去淘宝上买个20块钱一块的二手PCI-E亮机卡(如过从正规渠道购机,若主板没有集显,商家往往还会强加给你一块弱爆的Quadro K620当显卡,白花近1000块钱)。集显是通过这个AST2400 super I/O芯片提供的,只支持纯2D显示,是D-sub端口(起码上1680分辨率是没问题的,很清楚)。
(, 下载次数 Times of downloads: 361)
其实本来有意顺便装一块GTX1080Ti来GPU加速跑gmx的,但由于目前价格偏高,而且使用几率不高,就先作罢。手头上还有一块GTX770,就装到这机子上了,GPU加速不期望能有什么效果,毕竟挺老了,但偶尔跑跑大型游戏还是不错的。
内存。装机单写的是DDR4-2400,但是实际给的是2133的,不过无所谓,因为v3最高只支持2133,而且2133和2400也没什么性能差别。
(, 下载次数 Times of downloads: 379)
CPU散热器是蓝色LED,机箱面板风扇是红色LED,机箱是镂空的可以看到内部的效果。运行时的照片
(, 下载次数 Times of downloads: 392)
(, 下载次数 Times of downloads: 386)
(, 下载次数 Times of downloads: 380)
不过LED灯、侧面板镂空对笔者而言毫无意义,只会造成光污染,而且镂空处的透明塑料容易沾手印,更不好的地方是没法阻挡电磁辐射,所以这服务器摆在桌子上时是让镂空的那面不冲着我的。
这里顺带说一下装双路E5 v3/v4服务器最常用的超微的X10DAi、X10DRL-i、X10DAL-i主板的区别,了解一下很有好处。当前机子用的是X10DRL-i。
共同点:这仨主板都是C612芯片组,支持v3,只要BIOS是2.0及以上的,就可以支持v4和DDR4-2400。当前这主板BIOS是目前最新的2.0b版。都带两个千兆网口,支持Raid。
X10DAi:是E-ATX规格,普通PC机箱装不了但先马Titan可以。倆CPU位间距比较大,因此可以上两个性能很好的大霜塔至尊版之类的宽大散热器。集成ALC888声效芯片,但没有集显。带16个内存槽。
X10DRL-i:是ATX规格,价格比X10DAi便宜300左右。带集显,但端口位置由于被D-sub占了,本身板子线路又拥挤,就没有集成声效芯片了。此主板是ATX的好处是,可以塞到普通PC机箱里,双路主板能做成ATX也不容易。代价就是,由于版型较小,内存槽减半到8个,而且两个CPU位置非常近,因此散热器的选择是个问题,双塔的风冷没法用,只能用当前商家配的这种较窄的散热器,或者用不占地方的水冷。较窄的风冷也不好选择,比如市面上很流行的玄冰400由于不支持LGA2011没法用,也就99元的酷冷至尊T400i(性能略好于玄冰400)等极少数风冷可以选。
X10DAL-i:和X10DRL-i各方面,包括价格都相仿佛。主要差别就是这个是集成了ALC888,但作为代价没有集显。和X10DRL-i比用哪个合适就看实际情况了。另外X10DAL-i也没有X10DRL-i的IPMI远程管理功能,因此少了个网口,不过这个功能一般用不上,无所谓。
再说说商家给的配的CPU散热器。这散热器是4热管的,外观上看性能应该>=玄冰400,比较窄但是很高,约16cm。这个牌子是欧立酷,没什么名气,官网也进不去,搜了搜其产品,和这个最像的是他们的极600(http://cooler.zol.com.cn/534/5344896.html),评测性能不错,不过那是6热管的,而这个四热管版本淘宝上也买不到,说不定还真是商家找欧立酷定制的。这散热器是12cm大口径风扇,而且风扇边缘有橡胶垫避免共振,看这设计就能预感噪音不会太大。这个散热器,总的来说就是市值100块钱的水准,淘宝上也能买到他们的极600。X10DRL-i这个主板能装的下的风冷里面也基本不会有性能比这明显更好的了。
(, 下载次数 Times of downloads: 365)
(, 下载次数 Times of downloads: 413)
4 使用感受
这机子用了几天,非常稳定,什么质量问题也没有,很满意。之前比较关注的噪音问题看来是多虑了,即便把我那旌宇GTX770装上(又多了3个小风扇),噪音也挺小,而且CPU进入满载状态,噪音也并未增加很多。给我的感觉,满载的时候噪音甚至还没我用的双风扇的笔记本满载时候大。
下面给出温度数据的时候都是在室温为28.5度未开空调,并且机子上插了GTX770的情况(不插这个的话温度能降低4~5度)。这是待机状态的温度,很低:
(, 下载次数 Times of downloads: 396)
这是所有核满载>半小时的状态,温度比预想的低得多,既可能是高估了2696v3发热,也可能有点低估了这个散热器。
(, 下载次数 Times of downloads: 348)
上图可见CPU2的温度比CPU1明显要高,这是因为CPU1靠近前面板,CPU2靠近后面板,空气从CPU1出来再进入到紧挨着的CPU2时已经是热风了。满载时候机箱后风扇对着吹的镂空铁罩挺热的,后置风扇还是很有用处的,很有助于把CPU2吹出来的热风带走。
好在之前没选择用水冷,用鑫谷那个水冷噪音肯定不会更低,散热估计还不如这个(毕竟只是普通的120mm);而用冰神II 120水冷的话,得多花1200块钱,静音和散热能力估计也不会比这个强哪去。
这个主板开机时自检花时间比较多,服务器板子往往都这样,自检得花大约60秒,然后才开始进系统。如果想省一点时间,可以按照手册2-35节的方法调整跳线把BMC关掉,但也就能省不超过10秒。
本来是想让商家装个Win7-64bit,然后再自己装个CentOS 7.3,装机时商家说Win7-64bit支持不了256GB内存,搜了搜也确实是,只支持到192GB内存,于是就装Win10 64bit了,256GB内存都正常识别了:
(, 下载次数 Times of downloads: 360)
这是CPU和内存信息
(, 下载次数 Times of downloads: 328)
(, 下载次数 Times of downloads: 331)
(, 下载次数 Times of downloads: 351)
硬盘信息,确实是影驰480GB和希捷企业级4T
(, 下载次数 Times of downloads: 375)
手头有功率计量插座,测了下功耗,都是带着GTX770时候测的。待机状态:
(, 下载次数 Times of downloads: 361)
CPU满载功耗。差不多两个小时一度电,按帝都的电价,相当于4个小时一块钱,满载一天约6块钱电费。
(, 下载次数 Times of downloads: 354)
显卡满载功耗(确切来说,是跑Unigine Heaven测试程序时候的功耗)
(, 下载次数 Times of downloads: 335)
GPU加速跑gromacs时候测的
(, 下载次数 Times of downloads: 393)
CPU和GPU全部满载,是AIDA64稳定性测试里把CPU和GPU的stress都选上的情况测的,算是此机子功耗极限了,比GPU加速跑MD时候功耗高很多。
(, 下载次数 Times of downloads: 340)
GTX770的TDP是230W,GTX1080Ti的TDP是250W,虽然性能比GTX770强太多,但由于工艺先进所以功耗增加有限。就算换了成GTX1080Ti,GPU加速跑MD时最多也超不过上图的极限功耗620W。注意这是功率计量插座测量的功率,转换到电源实际输出的直流电功率要乘上0.8~0.9的电源效率,因此商家配的台达650W电源对于2*2696v3+GTX1080Ti跑GPU加速的分子动力学应当也是没问题的。但如果你想留有更大余量,可以搞个850W电源,正品行货一般在1k左右。(顺带一提,商家虽然在淘宝页面上标的是台达650W电源,但是去他店里时,却看到装机配置表里默认写的是航嘉600W。航嘉和台达哪有得比,遂让之改成台达650W了,也没额外要钱)。
5 性能测试
Cinebench R15测试。跑测试任务几秒钟就完成了,相当快。
(, 下载次数 Times of downloads: 368)
superpi 1M,体现单核性能。和期望的差不多,单核性能中规中矩
(, 下载次数 Times of downloads: 373)
AIDA64 5.70 CPU性能测试,和自带的其它配置的数据相比,2696v3完全发挥出了应有的性能(FP64测试的图中2696v3显示3.5GHz是不对的,实际就是2.8GHz)。
(, 下载次数 Times of downloads: 375)
(, 下载次数 Times of downloads: 362)
固态硬盘性能,比较理想
(, 下载次数 Times of downloads: 343)
机械硬盘性能
(, 下载次数 Times of downloads: 346)
机械盘持续读写性能还是和固态差距甚远(哪怕两块组Raid 0,还是有一定差距),对于搞量化的,TDDFT、后HF等任务需要大量读写硬盘,临时文件目录应尽量设在固态硬盘上以降低耗时。笔者这里用的480GB,实际上完全可以用个960GB的以留出更大空间读写临时文件,便宜牌子的目前在两千三左右。
测了下此机子跑G16 AVX2版的性能,%mem=240GB,%nproc=36:
C60体系,B3LYP/6-311G* nosymm int=fine:3min41s
苯胺,结构无对称性,CCSD(T)/def2TZVP:15min27
测了个Multiwfn很耗时的任务,用的Multiwfn 3.4版,输入文件是examples/benzene.wfn,settings.ini里设nthreads=36,用主功能5计算静电势格点数据,选medium quality grid,耗时37s。
跑了下gromacs2016.3,发现由于GTX770性能不济,GPU加速后反倒拖后腿。跑了个蛋白水溶液,带-nt 36 -pin on选项,CPU版速度是82ns/day,用GTX770加速时速度是68ns/day。不过,当CPU核数给的比较少的时候,GPU加速还是提升巨大的,比如:
只给2个核,CPU版速度是7.8ns/day,GTX770加速时速度是34ns/day
只给4个核,CPU版速度是14ns/day,GTX770加速时速度是49ns/day
可见,随CPU核数增加,纯CPU性能提升迅速,而GPU加速后的性能虽然也在提升,但斜率明显小于纯CPU的情况。对于GTX770,两条曲线交点在36核以下,所以所有CPU核心都用上时候GPU加速反倒更慢。给双路2696v3 GPU加速,GTX1080Ti是一定要上的,1070都明显不够意思。
6 其它杂事
商家并没好好按照我去他们那里时提的要求分区,后来又自己灌了系统。这机子装了一个Win10一个CentOS 7.3,480G固态和4T机械都是给每个系统一半,系统在固态上。之所以弄俩系统,是为了以后可能偶尔在Windows下跑点大型3D游戏,有时还跑跑Windows程序;而之所以不在Windows下用虚拟机跑Linux,一方面是目前最新的VMware只支持64GB内存和16核没法充分利用资源,另一方面是没法利用GPU加速。
装这个双系统还挺折腾的,按照当年装Win7+RHEL6的流程还不行,Linux装完后没法出现能进Windows的引导界面。网上有大量坑爹介绍装Win10+CentOS 7的文章,都是说先装win后装Linux,然后再用大白菜/老毛桃进WinPE修复MBR,进入win后再用EasyBCD构建Win+Linux引导界面,亲测这样弄出来的界面根本不去CentOS 7.3。后来才找到正途,而且比这简单太多,即先装Win10,后装CentOS 7.3,然后在CentOS里装上NTFS-3G从而令系统能认出装Win10的NTFS分区,之后运行grub2-mkconfig -o /boot/grub2/grub.cfg即搞定,启动时Linux引导界面里就有了Win10选项且能正常进入。
商家没有给主板的驱动盘、手册等东西。不过在超微的网站的主板介绍的页面上可以进入个ftp目录,里面可以下4GB多的主板驱动盘镜像。在Win10里把里面的芯片组、网卡、AST2400集显等驱动装上即可。而白给的CMI8738声卡,网上很容易就能找到其for Win8的驱动,也可以用于Win10。CentOS 7.3下倒不需要手动装什么驱动,直接都认了。
在CentOS 7.3下给GTX770装nVidia的驱动NVIDIA-Linux-x86_64-375.66.run着实费了好大力气,也来回装了数次CentOS。网上的标准做法是先禁了系统自带的该死的n卡开源驱动nouveau,然后再装官方驱动。然而发现nouveau禁用之后,系统也进不去,会卡住。反复折腾发现最简单流程是这样:
(1)用init 3命令进入纯文本模式,运行驱动的.run文件。此时会发现nouveau已经启用了而无法继续,让驱动自动把禁用nouveau的设置文件写进系统
(2)重启后用del键进BIOS,在PCI-E设置里把VGA priority设成onboard(即集显优先),然后把显示器的数据线连接到主板上的集显VGA口上,这样进系统时候就会用集成的AST2400来进去了,可以正常进入
(3)再次进init 3模式,再运行驱动的.run文件,就可以正常装了
(4)重启后进BIOS,把VGA priority改回offboard,把集显的数据线拔掉,进系统后发现n卡官方驱动已经装好了,Applications-Other里面有了NVidia的驱动设置面板了。
不知道没有集显的X10DAL-i上面插GTX770装驱动时会不会也在禁用了nouveau后进不了系统,要是也是如此,那么X10DRL-i的集显在装n卡驱动时还立功了(如果你的主板没集显的话,也可以通过SSH远程连接方式来安装nVidia驱动)
注:有可能驱动自动把禁用nouveau的设置文件写入后,即便已经重启过,安装nVidia驱动时仍提示nouveau没有被禁用。此时可以编辑/etc/default/grub文件,在GRUB_CMDLINE_LINUX那一行里加上modprobe.blacklist=nouveau,保存文件后运行grub2-mkconfig -o /boot/grub2/grub.cfg来重建grub配置文件。然后再重启,nouveau肯定就会被禁用了。
7 配置推荐
注:下面的配置推荐是写这个帖子的时候最推荐的配置。如今情况已经发生了很大变化,目前最推荐的配置见此《计算化学购机配置推荐》(http://sobereva.com/444),其中的配置会不断更新。
最后,笔者给出当下最推荐的用于量化计算的服务器配置。如果跑动力学,固态硬盘可以去掉,内存用32GB就够,显卡改成GTX1080Ti。
双路服务器:
CPU:2* XEON E5-2696 v3(18核,全核睿频2.8) 2*4750
散热器:2*酷冷至尊T400i 2*99
主板:超微X10DRL-i(集显) 1900
硬盘:希捷 企业级4TB 1050
固态硬盘:影驰铁甲战将 480G 960
内存:三星DDR4 ECC 4*16GB/32GB 4*850/1500
电源:海韵S12II-620(额定620W) 529 或 台达NX650(额定650W) 629
机箱:先马泰坦豪华黑 289
键盘鼠标:罗技MK200 多媒体套装 85
总价:约18000/20600 (64/128GB,不含显示器时)
单路服务器:
CPU:XEON E5-2696 v3(18核,全核睿频2.8) 4750
散热器:九州风神大霜塔普通版 199
主板:华擎X99 Extreme3 1399
显卡:PCI-E亮机卡 30
硬盘:希捷 2TB 400
固态硬盘:影驰铁甲战将 240G 520
内存:三星DDR4 ECC 4*16GB 4*850
电源:康舒上品550(额定550W) 269
机箱:先马泰坦豪华黑 289
键盘鼠标:罗技MK200 多媒体套装 85
总价:约11300
作者Author: syjohn 时间: 2017-7-11 04:52
赞,但是有个问题,如果上1080ti,电源是否要更换个功率更大的???
作者Author: liyuanhe211 时间: 2017-7-11 08:23
(, 下载次数 Times of downloads: 338)
作者Author: watfros 时间: 2017-7-11 08:59
这个帖子一出,2696v3估计要涨价了
作者Author: gauss98 时间: 2017-7-11 09:40
本帖最后由 gauss98 于 2017-7-11 09:45 编辑
非常好!
两个问题,一个是能够测个大家通用的test0397 (包含 fine 和ultrafine), 我根据您的算例 然后通过自己的机器算倒推出 test0397,在 int=fine 下大约是 76秒,但是没有直接的证据,如果能详细测试,可以跟小日本的测试2699v4 直接比较
第二是,网上好多人都在玩 打鸡血,到满载 3.2甚至 3.5G, 咱们做量化的是不是也可以这么搞? 这样还可以提高 大约20%的效率
作者Author: sobereva 时间: 2017-7-11 09:52
这服务器板子超不了频
test任务有空我可以跑跑
作者Author: gauss98 时间: 2017-7-11 10:00
谢老师解答,不用去心痒痒鸡血的问题了
期待详细测试
作者Author: sobereva 时间: 2017-7-11 10:21
test0397
g16AVX2 默认(即ultrafine,acc2e=12) 137s
g16AVX2 int=fine 94s
g16AVX2 int(fine,acc2e=10) 71s
g09 默认(即fine,acc2e=10)95s
g09 int(fine,acc2e=12) 124s
作者Author: gauss98 时间: 2017-7-11 11:14
谢谢! 根据 g16AVX2 默认(即ultrafine,acc2e=12) 137s
g09 默认(即fine,acc2e=10)95s
和小鬼子的 2699v4 测试比较, 2696 v3 相当于 2699 v4 32核的成绩,离44核还有 13%-19%的差距。考虑到其它配件的差别,还有最重要的,32核以上频率的并行奇差,这个成绩相当不错了。
作者Author: ximi1986 时间: 2017-7-11 16:27
上次也在群里问了E5-2696V3的,后来还是选的E5-2650V4,Dell T7810的系统,因为要走高校招标,在淘宝问了一圈组装机商,愿意的比较少~~
作者Author: abin 时间: 2017-7-11 23:43
本帖最后由 abin 于 2017-7-11 23:44 编辑
社长好文笔,
内容好详尽。
买两个并起来,直通线连接, 做个小规模的并行,应该是不错的选择。
我之前,和密度泛函小卒的做法一样,都是采用E3处理,PC主板,好处就是便宜;不好之处,就是单节点,核心较少。
作者Author: smutao 时间: 2017-7-12 01:22
(, 下载次数 Times of downloads: 324)
作者Author: sobereva 时间: 2017-7-12 10:27
朱门酒肉臭路有冻死骨
作者Author: hakuna 时间: 2017-7-12 11:10
这是要来杀周瑜的节奏啊
作者Author: Tinker 时间: 2017-7-12 18:13
同样的配置,服务器公司给的报价是五万元左右,但是淘宝没有办法走政府采购
作者Author: liyuanhe211 时间: 2017-7-12 18:17
只要愿意花时间折腾,总能找到报价基本合理的政府采购的供货商或其他渠道。
作者Author: Accelerator 时间: 2017-7-12 18:52
这个风扇体积这么小,散热功能却很好的样子。
我的单路2696v3用大霜塔,室内25℃左右,平时CPU温度在40-50度之间,满负荷60℃。
作者Author: Tinker 时间: 2017-7-13 07:58
谢谢,还有一个问题,淘宝上的cpu会不会是二手的
作者Author: sobereva 时间: 2017-7-13 10:29
可能会,可以事先问清楚
但完全没必要在意这个,用起来完全一样,顶多是触点有上过的痕迹,金属顶盖有点污而已,CPU没有寿命一说
作者Author: dreamyeye 时间: 2017-7-13 17:11
机箱顶部有没有必要配风扇?
作者Author: sobereva 时间: 2017-7-13 21:06
没必要
作者Author: steven 时间: 2017-7-14 15:10
老师 直接Extra Packages for Enterprise Linux (EPEL)源里的N卡驱动可以吗?
作者Author: sobereva 时间: 2017-7-14 16:55
我不清楚,那个肯定不是nvidia官方的,没法充分发挥显卡性能
作者Author: dimdang 时间: 2017-7-14 19:23
请问sob老师480G的固态硬盘是如何分区的
作者Author: sobereva 时间: 2017-7-14 20:12
240G给Linux,其中30GB挂在/,其余的挂在/sob
另外240G给Windows,其中120G作为C盘装系统和杂物,剩下120G作为D盘装程序
作者Author: ene 时间: 2017-7-18 10:51
请问老师,如果是跑动力学模拟的话,显卡买1080Ti更好还是K10更好?
作者Author: Jasminer 时间: 2017-7-18 10:58
可能是个人心理。
我对那些补过电容的完全不放心,怎么也说服不了自己。
作者Author: steven 时间: 2017-7-18 19:51
本帖最后由 steven 于 2017-7-18 23:47 编辑
老师,有几个问题请教您一下
您建议1080ti上哪个牌子的好一些?
这样一种配置大概能坚持几年呢?
这样直接在TB攒机配的服务器,cpu可能是二手的啊?
作者Author: sobereva 时间: 2017-7-19 05:36
1080Ti
作者Author: sobereva 时间: 2017-7-19 05:38
什么牌子都行,映众、微星、华硕、索泰等的等都可以,但不建议七彩虹之类牌子
没法说用几年,看使用者的要求。鉴于如今CPU发展速度很慢,5年内不至于落伍
考虑CPU是不是二手这种问题是完全多余的,根本不影响你任何使用
作者Author: sobereva 时间: 2017-7-19 05:39
补过电容的另谈,那种我也不推荐,哪怕贱价一些。
一般CPU不磕不碰极少会有掉电容这样的事
作者Author: steven 时间: 2017-7-19 12:51
本帖最后由 steven 于 2017-7-19 23:23 编辑
是不影响。这钱对还没正式赚钱的我来说是个很大的数目,所以想的有点多哈哈。但是一想到自己能有多一个这样的计算资源还是觉得心里痒痒。我大概找到那家店了,确定想买了 怎么跟他说能拿到新的呢老师,或者是这U现在都这样基本买不到全新?
还有我本人不到实体店直接在网上拍是不是也行?我28号到北京很晚了,然后满满的您的课,上完课晚上就走,票都订好了,如果必须本人去店里靠谱我还得看看退票的事。。
另外,除了Cpu其他配件都是全新的吧?
没这么弄过 很多不懂,有的问题比较幼稚, 谢谢老师。
作者Author: sobereva 时间: 2017-7-20 01:01
对于现成的服务器,CPU“二手”这个概念完全就是没法定义。
你单买CPU,看触点、外壳品相可以判断是新的还是拆机的,但是人家直接给你组装好的服务器,你根本就没法判断CPU是新的还是二手的,没有任何方式能够判断,只能商家说什么就是什么,除非你去现场监视他们装机过程,或者你自己买来CPU和其它配件自己组装;而且,即便是全新的CPU,商家给你装到机子上,在这一瞬间就已经成为了“二手”。所以纠结这个问题没有丝毫意义。
显卡是不是二手把显卡拆下来一看品相就知道,灰尘再怎么清,也不可能有全新品锃光瓦亮的感觉。
基本上你看商家淘宝店的销量、客户评价,就知道靠谱程度。稍微靠谱的,都不会在未经客户同意的前提下用二手件的情况。
如果你死活信不过商家,那你真正应该关心的,不是别的,而是硬盘是不是二手,毕竟数据无价,而且硬盘寿命相对有限。这个看硬盘的S.M.A.R.T.信息就能知道硬盘已经运转的时间和通电次数。
作者Author: steven 时间: 2017-7-20 10:51
谢谢sob老师耐心解答 放心了 一会直接订一个~ 在看到这帖子之前都一直想买了,就是不敢
作者Author: steven 时间: 2017-7-20 13:15
sob老师 还有个事请教一下您,其他条件都相同情况下,64G和128计算速度大概会差多少?谢谢老师.
作者Author: gauss98 时间: 2017-7-20 16:29
代回复一下
在内存够的情况下,速度基本没影响
但有些体系较大,计算频率的时候会有较大影响
作者Author: steven 时间: 2017-7-20 18:00
知道了. 谢谢回复!
作者Author: sobereva 时间: 2017-7-21 00:48
关键看算什么,以及用什么程序。
Gaussian的话,其实对大内存利用并不充分,哪怕是消耗资源比较大的任务,128比64GB也未必能提升多少性能,往往毫无提升。不过,有些大型后HF任务是没有大内存根本不给你算的,这时候如果内存不够大,那就只能降低并行的核数了,速度自然降低很多。另外,充分利用大内存优势的一种做法是把一部分内存虚拟成硬盘来用,此时如果是需要大量读写硬盘的那种任务,会带来速度不少提升,不过这个就是题外话了,不用管。总之如果预算比较紧,先用着64GB,对一般计算也够了,以后宽裕了可以再提升到128GB。
作者Author: steven 时间: 2017-7-21 02:00
明白了,多谢sob老师一系列的回复,还有这篇贴,让我了解了很多之前不懂的东西 :D 已入手
作者Author: azero 时间: 2017-7-24 11:37
sob老师,我想问下分子动力学需要32G那么大内存吗?
之前跑动力学4G内存好像也没用光
作者Author: sobereva 时间: 2017-7-24 12:08
32GB用不着,16GB也够了。但现在PC机都8GB起步,我的笔记本都16GB,36核服务器连32GB都没有太寒碜了
作者Author: azero 时间: 2017-7-24 13:32
好的,谢谢sob老师。。。突然想起一个问题,就是1080Ti 显卡的显存多少比较好?,
作者Author: sobereva 时间: 2017-7-24 13:40
只有11GB一种
作者Author: steven 时间: 2017-7-25 00:50
本帖最后由 steven 于 2017-11-20 15:49 编辑
C:\Users\Steven\Desktop\QQ图片20170725003741.png
作者Author: sobereva 时间: 2017-7-25 01:36
貌似是别人用过一阵的,你可以问问商家是怎么回事
不过写入量8.6TB,还可以接受,如果你用着正常,可以不去在意
作者Author: steven 时间: 2017-7-25 01:58
我问了,客服说他问一下库房.过了一会儿告诉我说厂家发来就是这样的,还说这批的影驰好多都有这个问题,正常质保三年,如果我在意可以换一个.可我现在着急用哪有这工夫邮来邮去的,而且配置自己的系统什么的一次就得大半天..您觉得他这story可信吗? 我反正现在差点儿就信了..
用着是正常,测试性能也正常.可是这对强迫症晚期患者造成了成吨的伤害
作者Author: sobereva 时间: 2017-7-25 02:08
你就这么用吧,应该不会有什么事。反正质保三年,用出毛病找他们直接换新就行
作者Author: steven 时间: 2017-7-25 02:19
嗯,就得这样了。之前我怕别的配件有问题,根本没想硬盘的事。现在发现别的配件还真都是新的,硬盘貌似被用了5个月。
谢谢sob老师这么晚的回复,早点休息。
作者Author: ghlsx 时间: 2017-7-25 16:27
写得很详细用心
作者Author: dreamyeye 时间: 2017-8-1 20:40
此主机集显会不会有时候让页面造成卡顿?更新驱动后分辨率最高1680?不更新反而1920?
作者Author: Mirror 时间: 2017-8-3 15:05
赞,为其他学友提供参考
作者Author: sobereva 时间: 2017-8-4 20:46
没有卡顿问题
我的显示器比较老,分辨率是1680的,没测试这集显对于1920是否支持得很好
作者Author: xiaoma0417 时间: 2017-8-5 18:52
单路服务器用这个板子可以吗?微星X99a raider,商家说华擎X99下线了。
作者Author: kyuu 时间: 2017-8-5 19:17
本帖最后由 kyuu 于 2017-8-5 19:22 编辑
廋老师,这种双路的情况下,高斯是要求site license 还是single computer? 什么样的PC是 要求用site license的?如果把之前使用single compter license 的卸载,可以装在另外一台机器上吗
作者Author: sobereva 时间: 2017-8-5 22:53
single computer
site license是指买了之后整个学院所有人都能用
作者Author: kyuu 时间: 2017-8-6 01:11
本帖最后由 kyuu 于 2017-8-6 10:12 编辑
弱弱的问一句,如果买的是single license,能同时装在自己的电脑和HPC上给自己用吗(在自己的home文件夹下编译),系里一时半会没钱升G16,我想自己买个single license用
作者Author: sobereva 时间: 2017-8-6 12:02
可以
确切来说(根据我买到的高斯的光盘袋子上写的条款理解),single license不是只能装在一台机子上用,而是指,同一时间,要求你买的这个高斯只能在一台机子上跑,不能多台机子同时跑这个高斯,但并没限制不允许装在多台机子上。
作者Author: kyuu 时间: 2017-8-10 14:48
Sob, 双路适合用来跑一个36核任务,还是两个各18核任务效率更高
作者Author: sobereva 时间: 2017-8-10 19:31
如果不涉及大量读写硬盘的任务,同时跑两个18线程的任务效率更高,但实际上也就快个10~20%
如果涉及大量读写硬盘的任务,同时跑两个可能更慢
作者Author: xiaoma0417 时间: 2017-8-11 19:38
本帖最后由 xiaoma0417 于 2017-8-11 19:43 编辑
老师,新购的机器 64G 内存. 鲁大师 和 AIDA64 都只能显示3个16G的内存条. 并且三个内存条的序列号都一样? 这两个图片 有问题吗?
并且装的是win7的系统, C盘三星的固态 232G 可用显示只有104G 这是什么原因呢?
作者Author: sobereva 时间: 2017-8-11 19:43
正常
不要管鲁大师,有AIDA64足矣
作者Author: xiaoma0417 时间: 2017-8-11 19:45
老师 AIDA64 也只显示出了3个内存条 而且序列号都是一样的,可以不纠结这个问题吗 ?
作者Author: sobereva 时间: 2017-8-12 01:23
系统能认出所有内存就完了
作者Author: xiaoma0417 时间: 2017-8-12 22:22
老师gaussian09.是装在linux的固态硬盘上的sob目录下吗?临时文件目录是放在固态硬盘上,还是机械硬盘上?如果gaussian09安装在固态上在进行后hf计算,需要大量读取硬盘,会读固态硬盘还是机械硬盘呢?
作者Author: sobereva 时间: 2017-8-13 14:07
是的。临时文件也在固态(我后来另买了个高速512GB固态,专门用来读写临时文件用)。
读哪个盘看你rwf文件产生在哪,可以用%rwf指定,也可以用GAUSS_SCRDIR环境变量设置默认的路径
作者Author: dingniu2 时间: 2017-8-14 20:38
请问,用linux 下Gaussian 09 做DFT优化,频率,过渡态计算,用固态硬盘对计算速度提升大吗?
如果用固态硬盘,在上面安装linux系统、home、g09的scratch文件夹,其中哪个装在固态硬盘上对计算速度提升大?
作者Author: sobereva 时间: 2017-8-14 20:43
不大,提升主要在CCSD(T)上
scratch文件夹
作者Author: azero 时间: 2017-8-31 15:57
装机老板说X10DRL-i 参数上写着电压145w,而E5-2696v3是160w,老板表示担心这主板不能发挥CPU的全部性能。。。
请问sob老用起来的时候有没问题?
作者Author: sobereva 时间: 2017-8-31 19:09
没问题
作者Author: azero 时间: 2017-8-31 21:35
好的,谢谢sob老师
作者Author: stephen2253 时间: 2017-9-1 17:24
本人服务器小白,请问sobereva大神,以下配置的机器,报价三万,合理吗?水分多少?十分感谢,抱拳抱拳!
2 * Intel Xeon Processor E5-2630V4 10C/20T 2.2GHz 25M 8GT/s 85W;
6 * 16GB/DDR4/2133或2400MHz/ECC/REG/2RANK;
1 * 2TB/SATA/7200PRM/3.5寸/企业级
1 * LS282G:8口/SAS/6Gb/支持RAID 0、RAID 1、RAID 10
1 * DVD/CD刻录机/SATA厚
1 * 四盘位热插拔模组
16* DIMM插槽
6 * PCI Express接口
独立显卡(可支持多种型号显卡及GPU卡)
作者Author: sobereva 时间: 2017-9-1 22:17
合不合理得看购买渠道,单说这价格和配置,和我此文里的相比,性价比也就是其1/3
作者Author: stephen2253 时间: 2017-9-4 11:29
性价比这么低呀。谢谢Sob老师!
作者Author: funyboy 时间: 2017-9-7 20:41
准备只做Gaussian和MOLCAS,不知道这个配置合适不?据说多核心对Gaussian提高并不明显?换成双路E5-1680V3如何?或者相同价位有更好的推荐?
作者Author: funyboy 时间: 2017-9-8 00:33
您现在用的这个板子X10DRL-i,能装得下冰神Ⅱ吗?另外有没有宽敞一点的板子能装的下大霜塔至尊版之类的宽大散热器的同时又带集显的?推荐一个?谢谢。
作者Author: sobereva 时间: 2017-9-8 03:32
水冷都没问题,明显比风冷省地方得多
文中说了几种X10D系列的区别,买那个E-ATX板型的就应当塞得下
作者Author: funyboy 时间: 2017-9-8 13:28
本帖最后由 funyboy 于 2017-9-8 13:33 编辑
之前 就认真看了全文,现在E-ATX确实够宽敞,但就是没有集显,还得另外配显卡,麻烦,就是想问问,有没有象这种这么宽敞又带集显的型号,给推荐。为何纠结于这个问题,主要是不知道水冷的冷却液性质咋样,不知道在低温负的十几二十度下会不会冻住导致损坏,因为我的机子冬天有可能偶尔会在此低温下工作。。。所以纠结用大霜塔还是用冰神?
另外7这个问题还是请您回答一下:)“准备只做Gaussian和MOLCAS,不知道您推荐的这个配置合适不?据说多核心对Gaussian提高并不明显?您推荐的这个核数多是不是不能够充分发挥?换成双路E5-1680V3如何?或者相有更好的推荐?价钱相差5-6千之内可以接受。”毕竟刚开始学习,很多不懂,见谅。
作者Author: sobereva 时间: 2017-9-9 04:24
如果平时环境温度都比较低,用帖子里说的那种单塔散热器就完全足够了(环境温度30多度的时候都没问题),完全没必要水冷。如果确实能到负十几二十度,那么不排除水冷损坏的可能。
完全合适。没法说不明显,只不过核数越多偏离阿姆达尔定律越多,毕竟不能要求达到这理想情况。36核是非常合适的。E5-1680V3只能单路运行,就算真的能双路,性能也差得太远。
作者Author: funyboy 时间: 2017-9-11 00:54
非常感谢您的回复。
作者Author: funyboy 时间: 2017-9-15 08:50
cent os 64位分区怎么设置比较合理呢?
作者Author: sobereva 时间: 2017-9-15 08:53
完全看你怎么用,以及硬盘容量,没法一概而论
作者Author: funyboy 时间: 2017-9-15 13:34
我现在容量是三星850 PRO 512G 和希捷4TB 7200转 企业级硬盘
目前计划,系统安装windows10X64位专业版和最新版CentOS-7 X64位-Everything版双系统。分区情况,win10 C盘80G固态,剩下的分配给CentOS,win10 D盘500G机械,剩下的分配给CentOS。
合理不?最关心的是,432G固态有必要再细分centos系统区和其他区吗?还是全部做系统区就好?我就是只
作者Author: funyboy 时间: 2017-9-15 13:35
(, 下载次数 Times of downloads: 89)
不好意思,不知道为何这段文字发不出来。。只能发截图了。
作者Author: funyboy 时间: 2017-9-15 13:37
我现在容量是固态 512G 和机械4TB 7200转 企业级硬盘
目前计划,系统安装windows10X64位专业版和最新版CentOS 7 X64位-Everything版双系统。分区情况,win10 C盘80G固态,剩下的分配给CentOS,win10 D盘500G机械,剩下的分配给CentOS。合理不?最关心的是,剩下的432G固态有必要再细分centos系统区和其他区吗?还是全部做系统区就好?我就是只
作者Author: funyboy 时间: 2017-9-15 13:38
我现在容量是固态 512G 和机械4TB 7200转 企业级硬盘
目前计划,系统安装windows10X64位专业版和最新版CentOS 7 X64位 Everything版双系统。分区情况,win10 C盘80G固态,剩下的分配给CentOS,win10 D盘500G机械,剩下的分配给CentOS。合理不?最关心的是,剩下的432G固态有必要再细分centos系统区和其他区吗?还是全部做系统区就好?我就是只
作者Author: funyboy 时间: 2017-9-15 13:39
我现在容量是固态 512G 和机械4TB 7200转 企业级硬盘
目前计划,系统安装windows10X64位专业版和最新版CentOS 7 X64位 Everything版双系统。分区情况,win10 C盘80G固态,剩下的分配给CentOS,win10 D盘500G机械,剩下的分配给CentOS。合理不?最关心的是,剩下的432G固态有必要再细分centos系统区和其他区吗?还是全部做系统区就好?我就是只
作者Author: sobereva 时间: 2017-9-15 13:40
你觉得合理就行。
固态剩下的建议50~100G挂到/上,剩下的挂到home或者某个私人目录
作者Author: azero 时间: 2017-9-22 15:55
sob老师,
我的机子是 2696V4 * 2+1080ti
我尝试跑了个22,7432个原子的模型,分别用
gmx mdrun -deffnm MD -v -nt 44 -pin on
gmx mdrun -deffnm MD -v -nt 22 -pin on跑,
-nt 44和-nt 22后面显示的finish时间都一直变短
虽然没能完全确定分别什么时候跑完,但感觉所需的时间相差不大
1、这是没很好地调用另一个CPU么?-nt 44 后面会显示imbalance
2、通过不断尝试,“感觉”-nt 32“最快”,nt后面数值要自己摸索吗?
3、之前问过sob老师你,老师你说小体系能跑就可以。。。但现在22万个原子,应该不算小体系了吧
4、这个有木有好点的解决方法?
作者Author: sobereva 时间: 2017-9-22 16:01
你跑一分钟,然后Ctrl+C断掉,屏幕上会显示计算性能,你比较一下就知道什么情况速度最高
1 不用太在意这个,只看实测性能
2 不排除某些情况给的核数太多反倒更慢的可能,而且还牵扯GPU的因素,可以试一个性能最高的值
3 22万不算小,但对于这机子绝对算得动
作者Author: heroooo 时间: 2017-10-14 18:43
7月份也配了一个,跟版主去的地方很像,叫什么苹果
自己买的散装的,最后装不好,又拉到他家装了
安了1080TI 11G版本,500G 的SSD
64G内存
鲁大师跑分能到70W
主要是安装LINUX不好装,主板需要在第二个显示界面按F11进入
按早了装机会有问题
还有就是这主板自检时间有点长
作者Author: gauss98 时间: 2017-10-24 15:26
老师您好,我的新机器终于到了,测试了下跟您的效率还有些差距,能分析下可能是哪些原因吗,能否优化?
配置: dell R730, Dell R630
2696v3*2 内存128G 600G sas 15k
centos 7.4 下
gaussian16 avx2 test0397 默认 169秒
int(fine,acc2e-10) 77秒
g09 默认 97秒
您的分别是 137秒, 71秒, 95秒
特别是g16默认 我的效率差了24%
可能是什么原因?
(操作系统有一定原因,用rock6.2(对应centos6.6) 分别问 172秒,82秒,101秒),但最新的操作系统也跟您的数据有不小差距,分析不出来了)
作者Author: sobereva 时间: 2017-10-24 15:37
我也不好说...
作者Author: gauss98 时间: 2017-10-24 19:57
gaussian09 差别不大
gaussian16差距明显
是不是有 avx2 没利用好的原因? 有什么方法可以查看相关设置吗?
谢谢
作者Author: sobereva 时间: 2017-10-25 12:24
如果g16就是AVX2版,并不需要任何额外配置,就会利用AVX2,如果利用不了,程序一开始也报illegal opcode之类错误了
作者Author: kyuu 时间: 2017-10-25 14:50
不要把内存和硬盘设置的过大,按正常需求计算,然后再贴个对比上来
作者Author: tjchkj 时间: 2017-11-4 15:22
版主好,看了你的帖子很好,不知道是否注意到,你的cpu用cpu_z来识别的话,名称里是E52699v3,如图,不知道是不是所谓的正显版,而另外一个名称里就很正规了,就是E5 v3。当然两种cpu规格里都是2696v3是一样的。不知道哪种更好一些呢?
作者Author: dreamyeye 时间: 2017-11-4 21:08
本帖最后由 dreamyeye 于 2017-11-4 21:15 编辑
只是cpu-z的版本不一样导致的对cpu识别结果的不一样,实际上应该都是同一个版本的CPU。较早的CPU-Z(大约1.74及以前的版本),对一些诸如2683V3,2696V3之类的版本,只能识别到M0版,晚一点的版本(大约1.77-1.78及以后),能识别出R2版,两个版本的CPU最高倍频不一样。
CPU-Z里对CPU的识别结果中,CPU名字那里是什么无所谓,但是规格这里是有规定的,如果没有CPU型号,就是“不显”版,如果显示了型号,后面又有“(ES)”字样,就是正显版,如果显示了型号,又没有“(ES)”字样,就是正式版。你给的图中的CPU,都是正式版。用CPU-Z看CPU版本,都看规格这里。
作者Author: tjchkj 时间: 2017-11-23 20:59
而且,准确的说,同一时间,你不能在连接互联网的多个机器上跑。那么还意味着,你同一时间,只要是不联网的机器,你可以在N多台机器上跑都没有问题。
作者Author: tjchkj 时间: 2017-11-23 21:01
本帖最后由 tjchkj 于 2017-11-23 21:02 编辑
更准确的说,你跑36个任务,每个任务用只一个核心,效率最高。我准备在2696v4上跑同时88个任务,前提也是没有大量的磁盘读写和内存的需求。
作者Author: kyuu 时间: 2017-11-24 21:14
good luck
欢迎光临 计算化学公社 (http://bbs.keinsci.com/) |
Powered by Discuz! X3.3 |