<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[通过Hbase构建多组学融合数据库]]></title><description><![CDATA[<p dir="auto">nt:<br />
accid<br />
seq:seqt, <s>seqd(没有该字段)</s>, taxid,seqs<br />
accid:序列id 唯一标识<br />
seqt:序列标题<br />
<s>seqd:序列描述(没有该字段)</s><br />
seqs:核酸序列<br />
taxid:物种id</p>
<p dir="auto">可以支持的应用场景：<br />
1.通过accid直接查询到该序列的信息<br />
2.通过序列比对查询对应的物种<br />
不能很好支持的场景：<br />
3.通过物种id查询该物种的序列就需要遍历数据库 肯定很慢</p>
<p dir="auto">单独存放一张表 存储物种和序列的对应关系:<br />
tax:<br />
taxid<br />
tax:name,clade,son<br />
seq:accid<br />
clade 就是界门纲目科属种的描述  son为当前taxid的一级子节点<br />
通过这种方式来解决问题3   这样做也可以方便我们初始化物种树 而且可以很方便知道这个物种当前有哪些序列 可以方便我们只blast某一个子集 例如只搜索动物、微生物</p>
]]></description><link>http://an.forum.genostack.com/topic/265/通过hbase构建多组学融合数据库</link><generator>RSS for Node</generator><lastBuildDate>Sat, 13 Jun 2026 10:59:46 GMT</lastBuildDate><atom:link href="http://an.forum.genostack.com/topic/265.rss" rel="self" type="application/rss+xml"/><pubDate>Mon, 29 Mar 2021 11:49:45 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to 通过Hbase构建多组学融合数据库 on Tue, 30 Mar 2021 05:43:26 GMT]]></title><description><![CDATA[<p dir="auto"><a href="/assets/uploads/files/1617082991572-introduction-to-apache-hbase-part-2-_-by-igor-skokov-_-medium.pdf">Introduction to Apache HBase(part 2) _ by Igor Skokov _ Medium.pdf</a><br />
用hbase存储目录结构</p>
]]></description><link>http://an.forum.genostack.com/post/521</link><guid isPermaLink="true">http://an.forum.genostack.com/post/521</guid><dc:creator><![CDATA[anneng]]></dc:creator><pubDate>Tue, 30 Mar 2021 05:43:26 GMT</pubDate></item><item><title><![CDATA[Reply to 通过Hbase构建多组学融合数据库 on Tue, 30 Mar 2021 04:04:46 GMT]]></title><description><![CDATA[<p dir="auto"><a href="https://www.sitepoint.com/hierarchical-data-database/" rel="nofollow ugc">https://www.sitepoint.com/hierarchical-data-database/</a><br />
如何用数据库存储树状结构</p>
]]></description><link>http://an.forum.genostack.com/post/520</link><guid isPermaLink="true">http://an.forum.genostack.com/post/520</guid><dc:creator><![CDATA[anneng]]></dc:creator><pubDate>Tue, 30 Mar 2021 04:04:46 GMT</pubDate></item></channel></rss>