星期四, 十一月 17, 2011

基因组编码 - 引子

上一篇博文大意是为了搞笑,但其中涉及很多有关基因组和生殖生理的统计数据,或许有一天可以拿出来做参考。另外,其中的编码技术已经应用在我的一些程序里面。



有人说人类基因组,或者其他“高等”动物的基因组中大部分的信息是垃圾信息,但即便没有它们,余下的量仍然很大,更何况垃圾信息并不是没用。

二代基因组测序技术将信息量又推向了一个新的高度。经常听到有人拿数个硬盘,坐飞机来传输数据。一个 2T 硬盘如果用飞机 10 个小时运到,用普通家庭的 ADSL(以 500KB 计)则需要 1138 个小时才能下载完成。一般学校的带宽也就是 10M,大约要超过 60小时才能传输完毕。而大多情况下,峰值带宽很难维持。

编码人类基因组信息已经用到了很多压缩技术,这个留待下回分解。

没有评论: