华成网论坛
标题:
自然-方法:利用人工智能搜寻自闭症的根源 基因组深度学习
[打印本页]
作者:
邓文龙
时间:
2017-9-9 19:26
标题:
自然-方法:利用人工智能搜寻自闭症的根源 基因组深度学习
本帖最后由 邓文龙 于 2017-9-9 19:45 编辑
利用人工智能搜寻自闭症的根源 基因组深度学习
作者:伊丽莎白·潘尼西 (Elizabeth Pennisi)
2017-09-06 11:14:01 来源:科学
标签人工智能自闭症
下载 (1).jpg
(5.48 KB, 下载次数: 60)
下载附件
2017-9-9 19:33 上传
“我们只能像生物学家一样说明自闭症等疾病是由什么引起的。在某个方面,一个科学家可以提出10个问题,而同样在这个方面,机器却有能力提出一万亿个问题,这就是改变传统规则的创新。”(视觉中国/图)
(本文首发于2017年8月31日《南方周末》)
人工智能工具正在帮助揭示自闭症的遗传因素。
对于遗传学家来说,攻克自闭症是一个严峻的挑战,而遗传模式表明其中具有很强的遗传成分。但是,在自闭症中发挥一定作用的数十种已知基因的变体只能解释所有病例的大约20%。要想找到可能有助于形成自闭症的其他变体,就需要在25,000个其他人类基因及其周围DNA的相关数据中寻找线索——这是调查人员难以招架的任务。因此,普林斯顿大学的计算生物学家奥尔加·特洛伊安斯卡亚(Olga Troyanskaya)和纽约市西蒙斯基金会得到了人工智能工具的帮助。
纽约基因组中心创始人、主任兼洛克菲勒大学医学科学家罗伯特·达内尔(Robert Darnell)解释说:“我们只能像生物学家一样说明自闭症等疾病是由什么引起的。在某个方面,一个科学家可以提出10个问题,而同样在这个方面,机器却有能力提出一万亿个问题,这就是改变传统规则的创新。”
特洛伊安斯卡亚将数百个数据集结合在一起,其中有的数据集关乎哪些基因在特定的人类细胞中表现出活性,有的关乎蛋白质是如何发生相互作用的,有的关乎转录因子结合位点和其他关键的基因组特征位于何处。然后,特洛伊安斯卡亚及其研究小组利用机器学习创建了一份基因相互作用图,将已经熟知的少数自闭症风险基因的相互作用跟数千个其他未知基因的相互作用进行对比,寻找其中的类似之处。2016年,他们在《自然-神经科学》杂志上报道说:对比表明,另外2500个基因可能跟自闭症有关。
然而,就像最近遗传学家们所认识到的那样——基因并不是单独起作用的,基因的行为是由附近数百万非编码碱基造成的,而非编码碱基跟DNA结合蛋白质以及跟其他因子发生相互作用。跟一开始寻找这些基因相比,确定哪些非编码变体可能会影响到附近的自闭症基因是个更加困难的问题。在普林斯顿大学特洛伊安斯克亚的实验室里,有位名叫周健(Jian Zhou)的研究生正在利用人工智能来解决这个问题。
为了让一个深度学习系统进行训练计划,周健为这个系统引入了DNA元素百科和人类表观基因组学收集的数据,这两个项目记录了数万个非编码DNA位点是如何影响附近基因的。在评估非编码DNA未知片段上潜在的活动时,该系统实际上学会了要寻找的是哪些特征。
2015年10月,当周健和特洛伊安斯克亚在《自然-方法学》杂志上描述他们这个被称为DeepSEA的计划时,加州大学尔湾分校的计算机科学家谢晓辉(Xiaohui Xie)将其称为“把深度学习应用到基因组学的里程碑”。现在,普林斯顿大学的这个研究小组正在通过DeepSEA计划对自闭症患者的基因组进行分析,希望对非编码碱基带来的影响进行排序。
同样,谢晓辉也正在利用人工智能来处理基因组,然而他关注的范围不仅仅是自闭症,他也希望根据造成危害的可能性来对任何突变进行分类。但是,谢晓辉警告说:在基因组学中,深度学习系统只有在受过训练的领域才能像数据集那样有效。他说:“现在,我认为人们会怀疑这种系统在分析基因组方面的可靠性。但是我还认为,过一段时间之后,就会有越来越多的人接受深度学习系统了。”
(胡德良译自美国《科学》杂志网站)
(華成旅行最便宜 03-3833-9823)
欢迎光临 华成网论坛 (http://kaseisyoji.com/)
Powered by Discuz! X3.2