2022-04-15利用PGCGAP根据ids提取序列信息序列处理 生物信息使用场景 假设有一个 fasta 格式的序列文件 SRR9620252.faa ,我们想要提取其中的一些序列到一个新的文件中,我们拥有这些序列的 id (假设这些 id 存放在文件 ids.txt 中)。常规操作的话,可以复制 id,在
2021-11-12NCBI上传基因簇之tbl2asn的使用NCBI序列处理生信软件 生物信息向 NCBI 提交基因簇的时候需要提供 sqn 格式的文件,这个文件需要通过 tbl2asn 生成。 文件准备 tbl2asn 依赖三个文件来生成 sqn 文件: 文件 1:fasta 格式的基因组序列文件 Header 处的中括号部
2021-10-20在FASTA文件中搜索完全匹配的短序列序列处理 生物信息有时候需要在 FASTA 格式的文件中搜索短的保守序列,这个时候采用查找法比使用 blast 等序列比对更加人性化。但是要注意避坑,即 FASTA 文档中的序列一般是被打断为许多行的,如果要查找的目标序列恰好在断行处,是没有办法直接揪出它的
2021-10-09从GenBank文件中提取FeaturesBioPerlperl序列处理编程 生物信息二话不说,上代码,需要安装 BioPerl #!/usr/bin/perl use strict; use warnings; use Bio::SeqIO; # Author: Liu hualin # Date: Oct 9, 2021
2021-10-09按照Contig切割GenBank文件perl序列处理编程 生物信息当一个基因组含有多个 Contigs/Scaffolds 的时候,在 GenBank 文件中也会产生多个 LOCUS。某些软件会将 GenBank 文件作为输入,但仅支持一个 GenBank 文件中只包含一条 Contig/Scaffold