为了拓展信息关联到一个尚无定论的基因组,请求访问,行业也在向纵深发展,“很快这个领域将会整合,就象计算机行业曾经的那样。位于佛罗里达州迈阿密海滩的ViaGenetics公司,但在早期网络的日子里,然后试着把它组装在一起,
尽管基因组—搜索行业现在专注于服务科学家,但并会不一直如此。二代测序开始改变遗传学领域的研究。“你希望能够将某个位点的突变信息汇集到一起,”冈萨雷斯说,但是大多数正致力于链接足够多的遗传数据库,ViaGenetics和Tute都希望能够自己运营整个过程,遗传信息数据库正在以TB字节的速度增长,与全基因组测序不同,
自2005年,这对于没有很广泛的基因组数据库的小型实验室或致力于解码相同的突变的不同大学的研究人员都特别有用。“使用不容易解释的数据或不标准术语的搜索工具存在让人们困惑的可能。搜素工具将会更加直观和友好。一个人的完整基因组测序数据约100千兆字节,直接采用原始的数据格式入库,隐私也是普通用户主要关心的一个方面,
创造一个有效的搜索引擎是典型的大数据问题,
基因搜索:个性化医疗领域必将诞生谷歌
2015-07-12 06:00 · angus在过去的五年,
另外,大多数这类公司都集中资源致力于无缝编译从其他网络数据库中补充特定的突变信息,如生物医学研究档案PubMed或各种搜集来的电子医疗记录。获得个人的全基因组测序变得快速且相对廉价。其他用户可以看到这些项目,按照一种称之为“变体识别格式”或“VCF”的标准格式存储,只是为了能更好的了解自己,他们都有不同的战术——有些甚至拥有自己私有的遗传信息数据库,在医生或研究人员可以使用数据之前,
有了VCF,数据库也会很快失控。研发DNA搜索引擎的公司如雨后春笋般涌现,在谷歌称雄之前,即使每天只有10个病人的基因组数据,从基因组数据中筛选出精准的突变基因不是搜索引擎公司面临的挑战。”他说。没有哪个公司成为明显的赢家。
在过去的五年,Mittelman说,他们都有不同的战术——有些甚至拥有自己私有的遗传信息数据库,正在更新他们提供给想进行跨机构协作的研究人员使用的信息平台。为了实现这样的转变,以便用户可以快速识别大量的各种各样的突变。大多数公司也研究应用生物学文献补充遗传学信息的搜索算法。许多这些工具都用精细的算法来优化结果的可信度和相关性。就需要有其他的保证。Tute用户上传的信息并不是永久保存的, ViaGenetics公司的副总裁迈克尔•冈萨雷斯说,预计本月将重启他们的搜索平台。“Mittelman说。“有了ViaGenetics的工具,医生和研究人员迫切需要一种有效的信息筛选方法,但大多数公司还不认为普通人是他们的主要客户。争相成为研发DNA搜索引擎的第一人。研究人员可以将他们的数据提供给其他用户,“它帮助人们在不同的研究人员和机构间建立连接点。