西西河

主题:翻译一个用贝叶斯方法进行系统发育分析的软件的使用说明 -- 空格

共:💬18 🌺48 新:
全看分页树展 · 主题 跟帖
家园 2.3 指定一个模型

所有的命令都在MrBayes>提示符后面输入。有两个命令是必须的,lset和prset。因为这哥俩的作用是指定分析使用的是哪个进化模型。showmodel命令可以用来检查模型设定是否正确,通常会使用这个命令以策万全。另,lset命令指定模型的结构,prset命令按给定模型的参数定义先验概率的分布。接下来,我们会为线粒体序列的进化指定GTR+I+_模型(即通用时间可逆{General Time Reversible}模型,带可变位点比例,位点间速率呈gamma分布)并检查所有相关的先验。若您对分子进化的离散模型不甚了了,我们建议您看一些相关的介绍性文章,例如Felsenstein的(2004)这篇文章。

一般说来,使用help lset 命令来入门是一个好办法。忽略开头的帮助信息而关注于输出末尾的表格。该表格显示了当前的设置,一般说来会是下面这个样子的:

Model settings for partition 1:

Parameter Options Current Setting

---------------------------------------------------

Nucmodel 4by4/Doublet/Codon 4by4

Nst 1/2/6 1

Code Universal/Vertmt/Mycoplasma/

Yeast/Ciliates/Metmt Universal

Ploidy Haploid/Diploid Diploid

Rates Equal/Gamma/Propinv/

Invgamma/Adgamma Equal

Ngammacat <number> 4

Nbetacat <number> 5

Omegavar Equal/Ny98/M3 Equal

Covarion No/Yes No

Coding All/Variable/Noabsencesites/

Nopresencesites All

Parsmodel No/Yes No

------------------------------------------------

首先注意这个表的题目是Model settings for partition 1。在缺省的情况下,MrBayes为你数据块中的每类数据建立一个分区{partition}。如果你的数据只有一种类型。那么就会之有一个分区。改变分区的方法见本手册第三部分。

名为Nucmodel的设置项允许你设置DNA模型的各类参数。其中,Doublet选项针对的是核糖体DNA匹配成茎的区域;Codon选项是按照其密码子来分析DNA序列。在例子中,我们将用标准的核苷酸取代模型,其中缺省的 4by4 选项就已经是最合适的了。所以我们会保留Nucmodel的缺省设置。

取代模型的通用设置是由Nst选项的设置来确定的。在缺省的情况下,所有的取代具有相同的速率(Nst=1)。这对应的是F81模型。(或者,可以相当于设定prset参数强制稳定状态频率彼此相等的JC模型,详见下文)。我们所需要的是GTR模型(Nst=6)而不是F81模型。所以我们键入并执行lset nst=6 命令。MrBayes会声明已经修改了模型的设定。

Code设置只有当Nucmodel设定为codon时才有效。而Ploidy在目前的例子里同样用不到。需要修改的是Rates的设置,从缺省的Equal(意即取代在不同位点间无差别)改为Invgamma(位点间速率差异服从gamma分布同时保留一部分非变异位点)。实现此改变所要执行的命令是lset rates=invgamma 。同样地,MrBayes会声明模型的参数已经被重新设定过了。

上面两步可以合并为如下一行的执行方式:lset nst=6 rates=invgamma

我们保留了Ngammacat的设置为缺省的4。通常情况下,4个速率的域{categories}已经足够了。增加域的数目有可能会增加似然计算的精确度。然而,计算所需要的时间随设定的域数目的增加而线性增加,而且多数情况下对结果的影响是负的。<这段话前后逻辑有点不太明白>

其他的设置里,只有Covarion 和 Parsmodel 两个设置是与单取代模型有关系的。不过,因为我们的数据既不需要俭约{parsimony}模型也不需要协方差{covariotide}模型。所以这两个的设置就不用改了。如果你键入help lset 命令来检查目前的设置是否正确,所看到的应该是下面的表的样子:

Model settings for partition 1:

Parameter Options Current Setting

------------------------------------------------------------------

Nucmodel 4by4/Doublet Codon 4by4

Nst 1/2/6 6

Code Universal/Vertmt/Mycoplasma/

Yeast/Ciliates/Metmt Universal

Ploidy Haploid/Diploid Diploid

Rates Equal/Gamma/Propinv/Invgamma/Adgamma Invgamma

Ngammacat <number> 4

Nbetacat <number> 5

Omegavar Equal/Ny98/M3 Equal

Covarion No/Yes No

Coding All/Variable/Noabsencesites/

Nopresencesites All

Parsmodel No/Yes No

------------------------------------------------------------------

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河