星期一, 八月 17, 2015

旧闻:10亿次并行巨型计算机系统

概  述:
银河—— II 计算机是由国防科技大学计算机研究所研制的中国第一台通用10亿次并行巨型机。该机为共享主存紧耦合4处理机系统结构.主频60兆赫,基本字长64位,主存容量256MB,拥有2个独立的输入输出于系统,可进行每秒10亿次以上的运算操作。

在研制过程中,国防科技大学重视用户的需求,做到研制与开发应用系统同时进行。他们和国家气象中心合作开发的中期数值天气预报软件系统,经过在银河—— II 计算机上试算,获得了令人满意的结果。试算还表明,石油、地震、核能、航天航空等领域的大规模数据,均能在银河—— II 上进行高速处理。

1992年11月19日,该计算机通过国家鉴定。由全国42家计算机研究所、应用单位和高等院校的专家组成的鉴定委员会,经过对银河—— II 巨型计算机系统为期一个月的全面严格的技术考核,一致认为它填补了中国通用并行巨型机的空白,表明中国巨型机技术有了新的重大进步,这种具有联网能力的巨型机既适合于作为超级计算中心的主机,又适合于作为大规模数据处理的中心处理机,具有广泛的应用领域。由于世界上只有少数几个发达国家掌握了研究巨型计算机技术,因而银河—— II 计算机的研制成功,进一步缩小了中国与国外先进水平的差距。

银河—— II 巨型机研究成功并通过鉴定后,中华人民共和国国务院、中央军委发出了贺电。
【按】上述机器曾经上过中国《人民日报》的头版头条(http://www.rmrbw.net/read.php?tid=927943&fpage=156)。当时我还在读本科,对此印象很深刻。二十几年过去,我现在用的手机有四个物理核,每个运行频率 1.8 GHz,共 0.0584 TFLOPS 计算能力。1.8 GHz 意味着它每秒可以作 18 亿次运算。刨去带宽,GPU,内存等因素,我这台不太新的手机相当于上述7台大型机的能力,而且还有富裕。

星期二, 八月 11, 2015

Watch live Youtube stream at command line


Flash player is disabled by default by Firefox. It indeed crashes Firefox quite often. Live stream on Youtube usually needs flash player. Below is an alternative on command line. One can then code and watch (if you can) happily and forever.
#!/usr/bin/env bash
# rpmfusion is need for below
sudo dnf install livestreamer vlc
livestreamer $(url) best # or 240p for example
Mplayer can be used using option --player mplayer. The experience here is not very nice. That's why livestreamer's default player vlc was installed here.

星期六, 八月 01, 2015

读《面对面的办公室——悲情图灵》

十九世纪末、二十世纪初是一个三百年一出的英雄时代。往上追溯,只有牛顿时代才能与其媲美。今天,即使一个人没有读过多少书,他或者她也能念出一长串这些英雄的名字。那时候,有曾经在欧亚大陆上如火如荼的两次世界大战,也有之后铁幕两边随时可能向对方扔出核弹的恐怖。在这样的背景下,普通人对那时候的物理学,尤其是核物理学,以及由物理学而推动的数学难免有极深刻的印象。

实际上这一时期在生物学也出了一位千年不出的大人物,他就是达尔文。几年前,我曾经参与过一个谁是有史以来最伟大的科学家的讨论。答案当然不好说了。但我现在每多学一分,我对达尔文的敬仰便多一分。事实上历史上从来没有哪一个人对科学和社会产生过如此巨大的影响。就说宗教吧,现今任何一个稍微严肃的科学家在考虑人是从哪儿来时,都不会去考虑上帝如何造人。从这个意义说,达尔文把大多数宗教的根基都给铲除了。

但达尔文时代人们对生物学了解其实有限。达尔文 1882 年去世,遗传学在 1900 年才诞生。从时间上看,达尔文有机会看到孟德尔的论文。但恐怕他看到了也未必看得懂。

物理学家们对生物学的理解更加了了。因为对核辐射对人体影响的无知,一大串有金光闪闪的名字的物理学家们死于因核辐射引起的癌症:居里夫人,费米,冯诺依曼。有趣的是文中对冯诺依曼死前的说法和我以前看到的版本不一样。以前说是国防部的人围在这位博弈论大师的床前等待他对冷战的看法。

由于许多人,也包括许多普通人死于核辐射,美国国防部才意识到需要有专门的经费来研究这个问题。这也是这个世纪初的人类基因组计划有相当大一部分经费来自美国国防部的原因。人类基因组计划对生物学研究的影响是广泛和深刻的,或者说它彻底改变了人们对生物学的研究方式。有很多情况下,我们对某种生物现象的研究现在可以直奔基因而去。比如这些金光闪闪的科学家为什么这么聪明。现代的遗传学研究表明这只不过是由有限几个基因决定的。而携带这些等位基因的人士往往会在多学科都成为学霸。说一句让许多人失望的话,有些人先天笨就像他们先天做不了运动员一样显而易见。让这些人成为科学家就像让某些人做职业运动员一样困难。

冯诺依曼和阿兰图灵等人发明的计算机或许是上个世纪最优秀的发明。社会对计算机的巨大需求也使得计算机的性能不断飞跃。文中说 Eniac 的内存才只有 1024 比特,现在随便一台 X86 笔记本电脑的寄存器都至少有 256 比特的宽度(YMM),而且这样的寄存器至少有 16 个。

如果说上个世纪数学的进步来自物理学的需求,那么在这个世纪生物学研究恐怕也会给数学不少挑战。生物学仍然是朝阳学科,但即使如此,生物学已经非常庞大。在我自己的研究领域,我感觉这些挑战大多针对计算技术。比如我最近的一个研究结果大体可以在普通的服务器上完成百万阶矩阵的高精度求逆。这个矩阵当然是育种中出现的特殊矩阵,但它至少不是稀疏的。这个过程说出来可能很简单,但它其实综合了育种、数值计算和数理统计等多学科的东西。它使得我们的基因组选择更加贴近实际,或者说在基因组时代,我们又可以像以往那样对百万个体同时估计育种值,而且这个准确度突破了传统 75% 的限制。

毫无疑问,人类对世界的认识是加速度进行的。人类第一个英雄时代大约出现在公元前4-5百年。宗教的出现造就了人类历史上很长的一个洪荒时代。直到文艺复兴,人类才出现了第二个英雄时代。之后英雄时代的出现仅仅用了三百年时间。下一个英雄时代按理说显然用不着等三百年,但现代科学及社会的高度分工使人们很难对它们有整体的认识,这或许就是当下英雄难寻的原因吧。

最后想起了一个飞行的比喻。如果说莱特兄弟让人造机器能飞起来就是英雄,现代社会则是空中飞行的那些空客、波音。它们看起来都很了不起,但谁是发明它们的“英雄”?大约不会有人知道了。