<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[De Novo测序前的准备]]></title><description><![CDATA[<p dir="auto"><a href="https://www.novogene.com/tech/service/Survey/qa/" rel="nofollow ugc">https://www.novogene.com/tech/service/Survey/qa/</a><br />
为什么一定要做Survey？<br />
Survey是评估基因组的有效手段，对于没有参考基因组的物种，在启动de novo 项目之前，对基因组特征评估是十分必要的，基因组大小及复杂状况直接影响到项目价格，周期以及后续的组装策略等。</p>
<p dir="auto">Q<br />
Survey评估和流式细胞仪评估有什么区别？<br />
两者都可以对基因组的大小进行评估，Survey评估中的K-mer分析是从数学角度上进行分析的，得到的信息更为全面和准确。而流式则是通过实验的手段，主要通过已知内参物种基因组大小来评估被测物种的基因组大小。由于内参选择不同，实验预估基因组大小与实际会有一些偏差。</p>
<p dir="auto">Q<br />
做了基因组Survey是否就一定不用做流式了呢？<br />
不是。我们一般建议老师在做Survey之前先做一下流式对基因组大小有个初步的预估。原因如下：K-mer分析中，我们把K-mer分布最多的峰为主峰，主峰前的1/2的峰称为杂合峰，把主峰后2倍的位置的峰称为重复峰。这时我们需要流式的结果来对我们的判断进行验证。根据不同峰计算的基因组大小不同，哪个和流式结果更加吻合哪个即是主峰。</p>
<p dir="auto">Q<br />
K-mer分析时，为何选的K-mer长度不一样？<br />
一般来说，用来估计基因组大小的K-mer我们选取17-mer，其原因是ATCG四种不通过的碱基组成的长度为17的核苷酸片段有417~17G，足以覆盖一般的正常基因组；如果选择15的话，则只有1G的可能。对于正常基因组可能覆盖度不够，导致估计不准确，当然对于较大基因组&gt;15G，我们会尝试采用19-mer进行评估。</p>
<p dir="auto">由于Reads上存在错误碱基，K-mer并非越大越好，若K-mer选择的越大，则包含这个错误位点的K-mer的个数就会越多。</p>
<p dir="auto">另外为了避免回文序列，K-mer分析选择K长度均为奇数。而对于高重复的重复，我们通常会选择一些长度较长的K-mer，这是因为较大的K-mer能够跨过一些高重复区域，对于组装具有较好的结果。</p>
]]></description><link>http://an.forum.genostack.com/topic/162/de-novo测序前的准备</link><generator>RSS for Node</generator><lastBuildDate>Sat, 13 Jun 2026 12:32:07 GMT</lastBuildDate><atom:link href="http://an.forum.genostack.com/topic/162.rss" rel="self" type="application/rss+xml"/><pubDate>Thu, 14 Jan 2021 08:20:51 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to De Novo测序前的准备 on Thu, 14 Jan 2021 08:31:01 GMT]]></title><description><![CDATA[<p dir="auto">基因组Survey基于小片段文库的低深度测序数据，通过K-mer分析，从而有效的评估基因组大小、<br />
GC含量、杂合度以及重复序列含量等信息，是全面了解某一物种基因组特征的有效方法，<br />
为后续的全基因组de novo 测序组装策略的制定提供理论依据。</p>
<p dir="auto">分析内容=标准分析+高级分析。<br />
通过K-mer分析，预估物种基因组大小，并对物种基因组，<br />
重复序列情况进行分析。对基因组进行初步组装，进行GC含量和<br />
外源污染分析。同时，基于初步组装的版本，可以进行SSR<br />
标记开发和同源注释。<br />
<img src="/assets/uploads/files/1610612593704-c65c2bbc-b36f-4ad1-bd36-2a7622f15487-image.png" alt="c65c2bbc-b36f-4ad1-bd36-2a7622f15487-image.png" class=" img-responsive img-markdown" /><br />
测序深度为50X，基于小片段数据，通过K-mer分析可以有效评估基因组大小、<br />
GC含量、杂合度以及重复序列含量等信息，除此之外还可以对数据进行初步组装、<br />
SSR标记的开发以及同源注释。</p>
<p dir="auto"><img src="/assets/uploads/files/1610612835896-9f980fcd-23be-4d49-97a4-674be6feb85a-image.png" alt="9f980fcd-23be-4d49-97a4-674be6feb85a-image.png" class=" img-responsive img-markdown" /></p>
<p dir="auto"><img src="/assets/uploads/files/1610612863795-8750545f-de06-4b2b-aac9-1186c0d410a1-image.png" alt="8750545f-de06-4b2b-aac9-1186c0d410a1-image.png" class=" img-responsive img-markdown" /></p>
<p dir="auto"><img src="/assets/uploads/files/1610612979563-abdfcc6b-bc2e-42d4-9912-5a6a5c082347-image.png" alt="abdfcc6b-bc2e-42d4-9912-5a6a5c082347-image.png" class=" img-responsive img-markdown" /></p>
<p dir="auto"><img src="/assets/uploads/files/1610613003921-0667f10b-5703-49f0-af46-a09eb183f9bd-image.png" alt="0667f10b-5703-49f0-af46-a09eb183f9bd-image.png" class=" img-responsive img-markdown" /></p>
<p dir="auto"><img src="/assets/uploads/files/1610613059358-e299e6d8-cddd-4ac8-be67-81d7b72959bc-image.png" alt="e299e6d8-cddd-4ac8-be67-81d7b72959bc-image.png" class=" img-responsive img-markdown" /></p>
]]></description><link>http://an.forum.genostack.com/post/310</link><guid isPermaLink="true">http://an.forum.genostack.com/post/310</guid><dc:creator><![CDATA[anneng]]></dc:creator><pubDate>Thu, 14 Jan 2021 08:31:01 GMT</pubDate></item></channel></rss>