本帖最后由 liyuanhe211 于 2017-2-23 23:30 编辑
在公社群里呆着看每天收获都不小,但毕竟群里的“信息传递速率”是蛮低的,有时Sob回答了一个问题要往上翻好几页才能找到问题,同时有很多Sob的回答不看就丢失了,也导致了不断的有不同人问同样的问题(比如最高频的“(minimum/TS)优化不收敛怎么解决”,“l9999怎么解决”,“为什么maxcycle=1000了还不收敛”...)。
于是花了大概两三天的闲(shang)暇(ke)时间,写了个充满bug的小程序,去抓Sob的回答并分析哪个记录是问题。有的时候Sob会@提问者,尤其是(在凌晨/清早的某个时刻)批量回复的时候,这些比较简单;如果是实时的回答就比较困难了,尤其是群里比较热闹的时候,遂调用了一个语义分析的库,加上一些简单的参数如时间差付以权重,就可以使程序以一定概率推荐出其对应的问题,辅之以用一个小GUI实现的人为调(教)就可以比较快速的整出记录:
下面这个问题已修正,见3楼
由于同一人会连续提问多个问题,Sob会连续回答,(虽然其实是为了编程处理方便)。故连续问答的聊天记录都处理成了下面的形式(#这是注释,不在记录中存在),机智的大家一定可以figure out这个对话是怎么回事的(虽然其实只是我懒):
- ----------------------------------------------------
- 2015.11.02 17:27:38
- Q:
- #问题1# 请问用赝势算金属的核磁能准吗
- #问题2# 那我想算金属原子的isotropic hyperfine coupling,不是要从NMR中得到吗?如果不能用赝势,拿什么基组算呢
- #问题3# VTZ可以吗
- #问题4# 我想算Sc Y Lu Ga的核磁,有没有一种基组对这几种金属全部使用呢
- #问题5# 不是每一个基组都能包含镧系和锕系的,我要做对照计算,所以需要一个基组能包含我要算的所有金属原子
- #问题6# 请问老师,有没有有个确定的基组可以符合要求,谢谢
- #问题7# 这个基组要用HF是吧
- #问题8# 用B3LYP可以吗
- #问题9# 这个计算的时候要加上int=dkh2吗
- A:
- #回答1# 用赝势的原子不可能算它的核磁
- #回答2# 全电子基组,考虑相对论
- #回答3# VTZ根本不是一个定义确切的基组,可以指代很多不同基组
- #回答3# 常见的全电子基组这里开头都简要说了
-
- 在赝势下做波函数分析的一些说明
- http://sobereva.com/156
- #回答6# UGBS
- #回答6# ANO-RCC
- #回答6# 文中都写了啊
- #回答7&8# 什么理论方法都行
- #回答9# 加
- ----------------------------------------------------
复制代码
另外会识别出一些奇怪的东西比如:
目前有两个硬伤,估计短期内不会解决:
首先:没有图片,带了图片的几个月的聊天记录轻松上几百兆(即使不带图片,光.txt也上10MB了,载入后共277741条记录,光文字的载入和对象初始化就得几十秒(是的我懒得优化算法)),我还没有能力轻松地handle它。图片在聊天记录里会显示为文字:“[图片]”,请自行脑补。
其次:所有的回答只包括Sob老师的回答,这是力所能及的,但没有精力把所有人的回答搜集下来。不过我认为很大程度上足够了。
以及不怎么重要的,目前不记录提问者是谁。这其实很容易加上,但是我觉得增加了很多无用信息。故还是去掉了。
---------------------------------------------
目前最终的测试结果,大概每周的群聊记录需要2~3个小时整理出来,毕竟内容太多了。以及找Sob要来了2013年至今的群聊记录,所以(朝前/朝后)看心情更。
聊天记录整理结果持续另贴发布,目录见二楼,不定期更新。 由于Sob给开了专门的板块(http://bbs.keinsci.com/forum.php?mod=forumdisplay&fid=103&filter=typeid&typeid=224),目录不再更新
|