随着2015年奥巴马在美国国情咨文中提出“精准医学计划”,精准医疗开始为大众所熟知。实际上,精准医疗的核心就是基因数据。精准医疗的本质就会以对个人基因的解读为基础,结合蛋白质组,代谢组等相关内环境信息,为病人量身设计出最佳治疗方案,以期达到治疗效果最大化和副作用最小化的一门定制医疗模式。细分来看,精准医疗又包括精准诊断和精准治疗两个环节,前者可以通过基因检测,在提前预测疾病发生的风险、可能的发展方向和疾病可能的结局;后者则对应个人的精准药物靶向治疗。
基因数据解读分析的核心就是找到基因组与表型组/疾病组的关系。疾病是人体表现出表型的一种,即每一个人表现出的样子,这些表型中有些不是疾病,只是体现出人体的多样性,比如肤色、发色、智商、身高和运动能力等,这些差异不是疾病。但是有一些表型就是疾病,比如说智力障碍、先天性白内障等,这些严重地影响到正常生活,就称之为疾病。
基因数据解读分析的核心就是,首先要找到基因组数据和表型组数据,或者基因组突变数据与疾病数据之间的规律,然后通过分析个体的基因数据去比对现有的基因组与表型组/疾病组规律,首先事先疾病风险预测以及提早防治。基因预测疾病风险的典型案例就是好莱坞明星安吉丽娜朱莉。她在2013年查出带有乳腺癌的易感基因,她又结合自己家族的遗传特性,她的祖母和母亲因卵巢癌去世,而姨妈因乳腺癌去世,所以她觉得自己患这些癌症的风险比较高,在医生与自己的商讨决定下,她做了乳腺的切除手术,将自己乳腺癌的风险从87%降到了5%,并且在2015年进一步切除了卵巢和输卵管。
基因测序成本大幅度下降,数据分析解读能力成为未来产业发展的焦点。近两年,基因检测在中国的发展和应用可谓如火如荼。从产业链来看,整个基因检测上游测序成本下降明显。
根据艾瑞咨询的的数据显示,2001年平均每兆数据量基因测序成本是5292.4美元,单人类基因组测序成本是9526.3万美元,至2006年新一代测序技术推出,平均每兆数据量基因测序成本下降至581.9美元,单人类基因组测序成本下降至1047.5万美元,此后基因测序成本以超“摩尔定律”的速度不断下降,从单个人类基因组1000万美元下降到2013年的5000美元;2014年1月Illumina推出HISeqXTen更是将单人类基因组测序成本降至1000美元以下。随着基因检测的成本逐步降低,基因检测将更加普及和得到大规模应用。但每一个人的全基因组数据会达到100G的容量,如何对其进行科学的分析和计算,成为了基因检测发展的核心问题。
参考中国报告网发布《2017-2022年中国精准医疗市场发展现状及运行态势预测报告》现阶段基因数据解读分析技术不够成熟,制约了基因临床应用发展和价值。解读环节可以说是现阶段基因检测产业瓶颈中的瓶颈,由于大部分疾病都是多基因遗传病,由多个基因共同控制,不同的基因突变,不同的突变位点,不同的突变类型,这些因素都会影响到疾病的最终表型。另外,基因组包含的信息很多,而真正为人们真正所了解的大约只占总体的2%,很多基因的功能尚不明确。再加之基因与疾病的对应关系还没有建立起来,解读过程中有太多的不确定性,更多需要人工做判断。无论是科研还是临床上,数据的解读环节都存在极大的局限性和挑战性。
人工智能是解决现阶段基因数据解读分析技术难题的重要技术。斯坦福大学生物医学信息学负责人Russ Altman博士认为,“机器学习和神经网络在发现大型生物数据库的规律时是非常有用的。实际上,使用人工智能来研究基因组与疾病表型的对应关系,方法上是正确的,也确实可行。但从实际工业界的情况来看,由于同时掌握生物信息技术和人工智能技术的复合人才极为稀少,人工智能和基因数据解读分析的技术融合处于早期,现阶段只有少量公司掌握核心技术。
典型案例:Deep genomics。在工业界,加拿大的初创公司Deep genomics在2015年就通过引入深度学习实现基于基因数据的疾病风险预测。公司的第一款数据库产品SPIDEX,综合了一系列的基因突变和对整个人类基因组RNA拼接的预期影响,只需将测序结果和细胞类型导入,SPIDEX便可分析出某一变异对RNA剪切的影响,并计算出该变异与疾病之间的关系。
【版权提示】观研报告网倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至kf@chinabaogao.com,我们将及时沟通与处理。