Statistics
正态分布的转换
2020-04-12
gaoch
数据满足正态分布是进行很多统计分析的前提,如果不符合正态分布,则需要对数据进行转换。常用的转化方式有:
[…] 今天我们看一看什么条件下应该选用合适的转换方式。
# 生成正态分布数据 normal <- rnorm(100,mean = 5, sd = 2.5) plot(normal) # 从直方图可以看出数据符合正态分布 hist(normal) # 从QQ plot也可以 …
阅读全文 →
|
ANOVA + TurkeyHSD 分析及作图
2019-09-24
gaoch
先载入一个示例数据。该数据是研究摄入 VC 对小鼠牙齿生长作用的实验结果。VC 给药分成两种方式:VC-给予VC药片;OJ-给予相当量的橙汁。给药的量都包括0.5,1,2等三个梯度。
从散点图上看,不同给药量之间应该有显著差异。
data("ToothGrowth") head(ToothGrowth) ## len supp dose ## 1 4.2 VC 0.5 ## 2 …
阅读全文 →
|
常用假设检验方法的R语言实现
2019-09-23
gaoch
常用的统计方法见下表所示。
[…] Mann-Whitney-Wilcoxon检验也被称为Wilcoxon检验。 In statistics, the Mann–Whitney U test (also called the Mann–Whitney–Wilcoxon (MWW), Wilcoxon rank-sum test, or Wilcoxon–Mann–Whitney …
阅读全文 →
|
比较不同差异系数的结果
2018-11-20
gaoch
𝕧egdist 提供了多个计算差异度的算法。这些算法自然是各有各的适用范围。对于同一个数据集,其结果有什么直观上的差异呢?
library(vegan) library(pheatmap) library(cowplot) data("varespec") dist.methods <- c("manhattan", …
阅读全文 →
|
比较 stats::procmp() 和 vegan::rda() 两种方法
2018-11-02
Gao
上次提及 PCA 分析的方法有很多种。那不同方法之间的得到的结果会有差异吗?
最近采用 PCA 分析 RNA-seq 样本之间的差异,得到了下面的结果。
[…] 生成一个含有 1000 个基因, 27 个样品的数据集. 这 27 个样品来自于 3 个基因型(WT, Mutant1, Mutant2), 3 种处理(CK, Trt1, Trt2), 共分为 \(3 * 3 = 9\) …
阅读全文 →
|
Bray Curtis Dissimilarity
2018-10-17
gaoch
本文介绍 Bray Curtis Dissimilarity 的概念和计算方法。
Bray Curtis Dissimilarity(Bray-Curtis 相异度)是生态学中用来衡量不同样地物种组成差异的参数。
其定义和计算公式为:
$$BC_{ij}=1-2C_{ij}/(S_{i}+S_{j})$$
其中:
[…] 有两个水族箱:
[…] …
阅读全文 →
|