2024-08-28 NCBI上传基因簇之table2asn的使用 NCBI序列处理生信软件 生物信息 向NCBI提交基因簇的时候需要提供sqn格式的文件,之前我在文章《NCBI上传基因簇之tbl2asn的使用》中介绍过如何使用tbl2asn生成sqn文件,遗憾的是tbl2asn官方已经不再提供软件下载了,提供的新工具为table2asn,本
2022-04-15 利用PGCGAP根据ids提取序列信息 序列处理 生物信息 使用场景假设有一个fasta格式的序列文件SRR9620252.faa,我们想要提取其中的一些序列到一个新的文件中,我们拥有这些序列的id (假设这些id存放在文件ids.txt中)。常规操作的话,可以复制id,在fasta文件中打开搜索,
2021-11-12 NCBI上传基因簇之tbl2asn的使用 NCBI序列处理生信软件 生物信息 向NCBI提交基因簇的时候需要提供sqn格式的文件,这个文件需要通过tbl2asn生成。 文件准备tbl2asn依赖三个文件来生成sqn文件: 文件1:fasta格式的基因组序列文件 Header处的中括号部分可以不写。 1234567
2021-10-20 在FASTA文件中搜索完全匹配的短序列 序列处理 生物信息 有时候需要在FASTA格式的文件中搜索短的保守序列,这个时候采用查找法比使用blast等序列比对更加人性化。但是要注意避坑,即FASTA文档中的序列一般是被打断为许多行的,如果要查找的目标序列恰好在断行处,是没有办法直接揪出它的,所以在查找
2021-10-09 从GenBank文件中提取Features BioPerlperl序列处理编程 生物信息 二话不说,上代码,需要安装BioPerl 123456789101112131415161718192021#!/usr/bin/perluse strict;use warnings;use Bio::SeqIO;# Author: Li
2021-10-09 按照Contig切割GenBank文件 perl序列处理编程 生物信息 当一个基因组含有多个Contigs/Scaffolds的时候,在GenBank文件中也会产生多个LOCUS。某些软件会将GenBank文件作为输入,但仅支持一个GenBank文件中只包含一条Contig/Scaffold