陈根:研究开发新软件 高效处理基因数据

文/陈根

现代医学的发展,让基因表达得以检测,其最经典的方法是根据在细胞或生物体中所观察到的生物化学或表型的变化来决定某种特定基因是否表达。大分子分离技术的进步,使得特异的基因产物或蛋白分子的识别和分离得以实现,而重组DNA技术的运用,又使得检测、分析任何基因的转录产物也成为可能。

目前,有一些方法广泛应用于研究特定RNA分子,这些方法包括原位杂交、北凝胶分析、打点或印迹打点、s – 1核酸酶分析和RNA酶保护研究等。

可以说,测量单个细胞中基因表达的技术在一定程度上已经改变了生物学,生物学家不再需要对组织内的细胞进行基因表达的平均,现在他们可以随时检测每个细胞中哪些基因是活跃的。

然而,随着测量细胞表达技术的发展,计算能力却难以跟上这种数据产生的速度。例如,一次实验可以观察10万个细胞,并测量数十万个转录本(基因活跃时产生的RNA片段)的信息,会产生数百亿个测序片段。单细胞测序的基因组数据可能会占用数TB的空间,就算在大型计算服务器上处理,也需要几个小时或几天的时间。

针对于此,科学家开发了一种软件——该软件速度快、效率高,可以轻松进行数据处理,还能够利用普通笔记本电脑的计算能力,在30分钟左右的时间内处理大型基因组数据集。

此外,该软件还允许任何人在线使用,现在另一个研究小组正在对该软件进行改编,以研究从筛查试验中收集的样本中的SARS-CoV-2病毒。值得一提的是,就算不同的小组使用不同的技术来研究相同的组织,只要使用该软件,都有利于数据的整合,这对保持科学的一致性和可重复性非常重要。

目前,相关研究成果已经发表在《自然生物技术》杂志上,未来,该软件还将在人类细胞图谱和脑计划细胞普查网络等大型联合体的基因组数据预处理中发挥更多意想不到的作用。

免责声明:该自媒体文章由实名作者自行发布(文字、图片、视频等版权内容由作者自行担责),且仅为作者个人观点,不代表 秒送号Miaosong.cn立场,未经作者书面授权,禁止转载。[投诉 · 举报作者与内容]

「作者 · 档案」
这个人很懒,什么都没有留下~

  
(0)

相关阅读

发表回复

登录后才能评论
发布