向NCBI提交基因簇的时候需要提供sqn格式的文件,这个文件需要通过tbl2asn生成。
文件准备
tbl2asn依赖三个文件来生成sqn文件:
- 文件1:fasta格式的基因组序列文件
Header处的中括号部分可以不写。
1 | >Toyoncin_biosynthesis_gene_cluster [organism=Bacillus toyonensis] [strain=XIN-YC13] [topology=linear] [moltype=DNA] [tech=wgs] [gcode=11] [country=China] Bacillus toyonensis strain XIN-YC13 Toyoncin biosynthesis gene cluster, complete sequence |
- 文件2:描述基因特征的feature table文件(.tbl)
该文件可以用prokka对文件1进行注释而得到,但是需要自己加以修改,加上文件前几行以及gene相关的信息,各列之间用制表符分隔。
1 | >Feature Toyoncin_biosynthesis_gene_cluster |
- 文件3:描述作者信息的模板文件(.sbt)
可以在NCBI上生成该文件。
1 | Submit-block ::= { |
注意:文件1和文件2的序列描述信息必须一致,此例中均为“Toyoncin_biosynthesis_gene_cluster”。
文件生成
1 | tbl2asn -t template.sbt -p ./ -V vb -x .fna |
-t 模板文件
-p 输入文件所在路径
-V
-v 生成验证文件,保存错误信息
-b 生成gbf文件
-x 文件1(FASTA文件)的后缀名,根据实际情况填写
注意:如果用Prokka带的tbl2asn,生成的sqn和gbf文件中的日期通常是1-JAN-2019,需要自己手动改正为当前时间,这是因为Prokka里的tbl2asn是经过修改的。建议使用官方版的tbl2asn,可避免日期错误。