今天偶然看到著名记者土摩托的这样一条微薄:
暴力求解的新案例来了。英国剑桥大学癌症研究所联合了全世界1000多名科学家,找出了乳腺癌、前列腺癌和卵巢癌几乎所有的致癌基因,普通人只要做一个简单的DNA测序,就能知道自己有多大的几率患上述癌症。但是,这个技术需要有知识的消费者才能发挥最大效力,科普工作者有事做了。http://t.itc.cn/UcpKn
这段话只有“科普工作者有事做了”这句话还靠点谱,不过它的意思不光是科普,首先还包括相关知识的学习。我简单评论如下:
这段话明显对 GWAS 的研究手段和进展不了解。我只指出最简单的一种情况,一个人/个体所携带的突变,基因频率低于5%的超过一半以上。这样的基因座位在常规的统计检验中通常得不到显著结果。这也是为什么在做连锁分析/关联分析之前要把这样的基因座位排除在分析之外。而导致发病的基因即便是均匀分布于基因组中,那么也有一多半发现不了,离发现大部分基因的距离就更远了。更何况不利基因受到的选择压力大,频率通常不会太高。
Peter Visscher 去年在爱丁堡的数量遗传学国际会议上说需要有新的手段来发现这些基因,我就不看好有什么好的统计手段能暴力找到所有基因。
举个例子:身高的遗传力在 80% 以上,这个值的意思是在现代社会里,后代的身高基本上由父母决定,环境的影响非常小。2008 年 Peter 收集了所有癌症和其它疾病 GWAS 研究的样本,这些样本在记录疾病状况的同时,还记录了身高、体重等数据。身高无疑是一个理想的研究对象。结果 GWAS 发现的基因只能解释 5% 左右的遗传方差。Nature 杂志为此专门发了评论文章,提出了“丢失的遗传力”这个词。前两年,身高的样本大小超过了30万,并且使用了更高密度的芯片,而今所发现的基因/QTL仍然只能解释约40%的身高遗传方差。
这种暴力求解实际上终将走进死胡同。
注:GWAS 是 Genome wide association study 的缩写。
没有评论:
发表评论