X为了获得更好的用户体验,请使用火狐、谷歌、360浏览器极速模式或IE8及以上版本的浏览器
关于我们 | 帮助中心
欢迎来到天长市科技大市场,请 登录 | 注册
尊敬的 , 欢迎光临!  [会员中心]  [退出登录]
成果 专家 院校 需求
当前位置: 首页 >  科技成果  > 详细页

[00135561]一种高效的样品差异矩阵计算软件V1.0

交易价格: 面议

所属行业: 软件

类型: 非专利

交易方式: 资料待完善

联系人:

所在地:

服务承诺
产权明晰
资料保密
对所交付的所有资料进行保密
如实描述

技术详细介绍

课题来源与背景:本项目是甘蔗优良新品种选育及推广部分内容,编号为桂科AA17202042-6 研究目的与意义:对NGS重测序分析,得到群体的变异结果Variant Call Format(VCF)文件,生物信息分析人员往往第一时间想知道这些样品之间的差异情况如何,即想要以基于SNP的vcf的变异结果去结果构建样品它们之间的关系树,但全基因组群体SNP数据量常到达上几十M以上的数据集,若用各样品的序列去直接建树,则计算的时间往往上周甚至上月,若能从变异结果VCF数据集中直接计算出相关参数,则可以大大的减少相关的计算资料和等侍时间,为此,特为此开发这一软件,可以直接读入VCF格式的文件,兼容压缩格式,计算里面样品之间的差异情况给出样品之间的差异矩阵,其中这一个矩阵可以用PHYLIP/Mega等构树画树软件直接打开,使用邻接法(Neighbor-joining方法)则展示样品的关系树。 主要论点与论据:该程序功能明白易了解,就是快速从VCF里面计算出样品之间的差异矩阵,并展示出关系树行。而程序采用了使用一边读入数据一边处理并记录,及时释放相应的内存,因些低内存的目标就很快实现;其次就能兼容读压缩文件的功应用了gzstream.h,同时为了节省输出占用的空间,在输出文件时也以压缩形式输出。其中参数判断时也会自动判断输出文件是否以.gz结尾,若不是,则添加上去。 创见与创新:1 快速低内存。2 输出是压缩文件节省空间。3兼容读压缩格式。 社会经济效益及存在的问题:本程序实现了快速从VCF里面计算出样品之间的差异矩阵,并展示出关系树行(./bin/VCF2PDis),程序功能目的明确单一。 历年获奖情况:未进行报奖和获奖。 成果简介向社会公开:程序首先依次每次计算一个位点,计算各样品在该位点的差异信息,然后累加,释放空间,重新读入下一行。即因此程序实用了一边读入一边处理边并记录,不占用内存和IO。程序使用简单易用,一个输入,一个输出。功能单一,效率高(低内存高速度)。该程序能快速从VCF里面计算出样品之间的差异矩阵。

推荐服务:

Copyright  ©  2019    天长市科技大市场    版权所有

地址:滁州高新区经三路

皖ICP备2023004467