构建本地GenBank数据库
-
1.安装biosql
git clone https://github.com.cnpmjs.org/biosql/biosql.git
vi biosqldb-pg.sql
删除其中的两个规则rule_bioentry_i1 and rule_bioentry_i2
//创建biosql数据库
sudo -u postgres createdb biosqldb
sudo -u postgres psql biosqldb < biosqldb-pg.sql
perl -MCPAN -e 'install DBI';
//sudo perl -MCPAN -e 'install DBD::Pg'
sudo apt-get install libdbd-pg-perl2.安装NCBI Taxonomy
./load_ncbi_taxonomy.pl --dbname bioseqdb --driver Pg --dbuser postgres --download true
//下载速度比较慢 最好用大服务器下载
//另外,这个命令需要用密码才能连接本地pg 因此需要给本地的postgres 帐号修改密码
//
./load_ncbi_taxonomy.pl --dbname biosqldb --driver Pg --dbuser postgres --password postgres -
http://etetoolkit.org/docs/latest/tutorial/tutorial_ncbitaxonomy.html
使用ETE toolkit处理ncbi taxonomy -
nohup wget https://ftp.ncbi.nlm.nih.gov/genbank/*.seq.gz -l 1
下载genbank数据库
目录中有几个.txt.gz 文件 不用处理 -