事件记录
面试官: 大发娱乐说的是Bam Iobio, 一个易于使用的基于网络的应用程序,可以在几秒钟内分析基因组序列数据.
播音员: 检查最新的研究,告诉你最新的突破, 科学与研究秀在the Scope上播出.
面试官: 我正在和医生谈话. 犹他大学人类遗传学教授Gabor Marth说. Dr. 玛斯,你的应用名为Bam Iobio,刚刚发表在《大发娱乐》上.“你为什么这么兴奋呢??
Dr. 伽柏后: 超级兴奋的Bam.因为这是第一个展示大发娱乐在犹他大学建立的新的交互式基因组生态系统功能的应用程序.
面试官: 告诉我,什么是Bam Iobio? 它能做什么??
Dr. 伽柏后: 在Bam文件中,您正在通信序列对齐. 这是由测序机器产生的数据,也是各种基因组分析的通用数据.
这个特定的应用程序使研究人员能够查看序列比对文件,并在短短几秒钟内能够查看许多有趣的方面, 例如,你从某个人那里得到了多少数据, 你的数据质量如何. 它使您能够深入到各个区域的细节, 看看单个染色体, 了解所有下游分析所基于的数据的整体质量.
面试官: 这是第一步. 等你拿回你的基因组序列数据, 你要检查它,确保它的质量和覆盖范围都符合你的要求.
Dr. 伽柏后: 这是第一步. 这是每个研究人员在开始进一步分析数据之前应该做的事情.
面试官: 这与以前可用的相比如何?
Dr. 伽柏后: 而不是进行端到端的基因组分析,这通常需要几天的时间, 周, 有时超过一个月, 并且需要大量的计算资源、数据存储和计算机集群, 等等, 用户只需使用笔记本电脑浏览器,就可以在几秒钟内查看对他们重要的那部分数据. 然后进一步探索, 来回移动, 变更分析参数, 等等, 他们可以随时进行实时重做分析,并与他们分析的数据和他们使用的工具建立真正的联系.
例如,序列覆盖,对研究人员来说非常重要的是我有多少数据. 大发娱乐可以在几秒钟内估计出来. 如果使用传统的基于unix的工具,则需要花费数小时才能得到相同的答案.
面试官: 所以,这有点像从第一代苹果电脑到iPhone 6.
Dr. 伽柏后: 这是一个非常讨人喜欢的比喻,但也不是完全不正确.
面试官: 你知道, 如果你做这个比较, 这种iPhone 6的交互性已经存在一段时间了, 五年左右, 你认为为什么这种类型的分析要花这么长时间才能赶上呢?
Dr. 伽柏后: 基因组规模, 以不断降低的成本生成基因组规模数据的能力, 今天非常便宜, 让社区感到惊讶吗. 开发人员社区专注于能够全面分析数据,并开发能够处理今天产生的大规模数据的算法. 这是第一个推动力.
现在大发娱乐想让这些数据对研究人员有用,是时候开始考虑让它有用了,让它在没有计算投资的情况下有用, 硬件投资非常昂贵,只能在机构规模上进行.
面试官: 这个应用程序是为谁设计的?
Dr. 伽柏后: Bioinformaticians, 向其他研究人员大发娱乐提供数据的核心设施, 研究人员自己. 你为数据付费. 你从核心设施拿回你的数据. 您可以做的第一件事是检查数据质量.
面试官: 这些都是你更大计划的一部分.
Dr. 伽柏后: 事实上, 大发娱乐刚刚完成了第二个应用程序,性质非常相似,可以让你查看基因变异. 这个应用程序叫做vcf.iobio.io. 它查看VCF文件. 这些是程序用它们找到的基因变异创建的文件, 例如, 在单个人类基因组中. 这个应用和bam非常相似.iobio, 给你整个基因组的度量, chromosome-wide指标, 或者文件的区域指标, 这些对评估变体是否被正确命名很重要也能让你对变体有一些地区性的了解.
大发娱乐的计划是开发一个非常大的数量, 一个完整的生态系统, 基于相同原理的基因组分析应用程序. 它们将能够大发娱乐研究人员完成这些更一般的数据分析任务以及更特定领域的科学任务.
面试官: 你是在鼓励开发者修补Iobio.
Dr. 伽柏后: 是的. 在这篇论文发表后,大发娱乐现在的重点是开发工具,使其他开发人员能够构建自己的基因组分析应用程序. 目前, 开发一个基因组分析应用程序, 这需要很长时间, 因为你必须从头开始写很多东西. 大发娱乐将为开发者大发娱乐提供库,让他们可以使用大发娱乐所说的Iobio平台. 这是一种软件类型的库,开发者可能需要在一天内完成一个原型应用,并在几周内完成一个更完善的应用.
大发娱乐仍在开发支持,敬请期待. 这将是两到三个月之前,大发娱乐能够发布的第一个版本.
播音员: 有趣,内容丰富,而且都是为了更好的健康. 大发娱乐是Scope健康科学广播.