2022-02-26 使用eggNOG-mapper注释基因组 Functional genomicsWGS生信软件 生物信息 EggNOG-mapper简介(本文未完待续…)EggNOG-mapper (a.k.a. emapper.py or just emapper) is a tool for fast functional annotation of no
2022-01-07 使用DeepARG预测抗生素抗性基因ARGs ARGs生信软件 生物信息 介绍DeepARG 是一种机器学习解决方案,它使用深度学习来表征和注释宏基因组中的抗生素抗性基因。它由两种输入模型组成:短序列Reads和gene-like序列。 安装软件 通过conda安装 12345678910111213141
2022-01-03 计算蛋白质等电点并绘制全局pI图 WGS生信软件蛋白质组 生物信息 蛋白质组的全局 pIs细胞全局蛋白质组 pI 图的变化取决于氨基酸的总电荷,并对蛋白质的结构和特性具有重要意义。 普遍认为原核基因组具有两个最大的双峰形状,一个在酸性pH值下主要对应于溶解的蛋白质(细胞质蛋白或分泌蛋白),另一种在膜蛋白的碱
2021-12-10 利用GTDB-TK对细菌和古菌基因组进行物种分类 WGS生信软件 生物信息 GTDB-Tk 是一个软件工具包,用于根据基因组数据库分类 GTDBGenome Database Taxonomy GTDB 为细菌和古菌基因组分配客观分类学分类assigning objective taxonomic classifi
2021-12-02 宏病毒组分析流程1-VirSorter2 ST179宏病毒组生信软件 生物信息 安装软件 安装主程序及依赖 :::default VirSorter2 (version >=2.2.3) CheckV (version >=0.7.0) DRAMv (version >=
2021-11-25 利用NCycDB数据库从宏基因组中预测氮循环基因 Functional genomicsSY179宏基因组生信软件 生物信息 氮(N)循环是地球生态系统中重要的生物地球化学途径的集合,在生态学和环境研究中得到了广泛的关注。目前,鸟枪法宏基因组测序Shotgun metagenome sequencing已被广泛应用于探索负责 N 循环过程的基因家族。NCycDB是
2021-11-12 NCBI上传基因簇之tbl2asn的使用 NCBI序列处理生信软件 生物信息 向NCBI提交基因簇的时候需要提供sqn格式的文件,这个文件需要通过tbl2asn生成。 文件准备tbl2asn依赖三个文件来生成sqn文件: 文件1:fasta格式的基因组序列文件 Header处的中括号部分可以不写。 1234567
2021-11-02 R语言安装依赖包错误集锦 LinuxR语言软件 生物信息 devtools安装错误XML包 安装之 ERROR: configuration failed for package ‘XML’ CentOS解决方案 在Linux终端中运行如下命令即可: 1sudo yum install -y li
2021-11-02 在Linux服务器中安装网页版Rstudio LinuxR语言软件 生物信息 本文演示如何在CentOS7服务器上安装Rstudio server。 安装Rstudio访问Rstudio官网,选择对应的Linux发行版,下载Rstudio安装包。本文以最常见的CentOS7为例演示,前提是系统中已经安装了R。 12w
2021-10-20 在FASTA文件中搜索完全匹配的短序列 序列处理 生物信息 有时候需要在FASTA格式的文件中搜索短的保守序列,这个时候采用查找法比使用blast等序列比对更加人性化。但是要注意避坑,即FASTA文档中的序列一般是被打断为许多行的,如果要查找的目标序列恰好在断行处,是没有办法直接揪出它的,所以在查找