statistics

R

正态分布的转换

2020-04-12 gaoch
数据满足正态分布是进行很多统计分析的前提,如果不符合正态分布,则需要对数据进行转换。常用的转化方式有: […] 今天我们看一看什么条件下应该选用合适的转换方式。 # 生成正态分布数据 normal <- rnorm(100,mean = 5, sd = 2.5) plot(normal) # 从直方图可以看出数据符合正态分布 hist(normal) # 从QQ plot也可以 … 阅读全文 →

ANOVA + TurkeyHSD 分析及作图

2019-09-24 gaoch
先载入一个示例数据。该数据是研究摄入 VC 对小鼠牙齿生长作用的实验结果。VC 给药分成两种方式:VC-给予VC药片;OJ-给予相当量的橙汁。给药的量都包括0.5,1,2等三个梯度。 从散点图上看,不同给药量之间应该有显著差异。 data("ToothGrowth") head(ToothGrowth) ## len supp dose ## 1 4.2 VC 0.5 ## 2 … 阅读全文 →
R

常用假设检验方法的R语言实现

2019-09-23 gaoch
常用的统计方法见下表所示。 […] Mann-Whitney-Wilcoxon检验也被称为Wilcoxon检验。 In statistics, the Mann–Whitney U test (also called the Mann–Whitney–Wilcoxon (MWW), Wilcoxon rank-sum test, or Wilcoxon–Mann–Whitney … 阅读全文 →
R

比较不同差异系数的结果

2018-11-20 gaoch
𝕧egdist 提供了多个计算差异度的算法。这些算法自然是各有各的适用范围。对于同一个数据集,其结果有什么直观上的差异呢? library(vegan) library(pheatmap) library(cowplot) data("varespec") dist.methods <- c("manhattan", … 阅读全文 →
R

比较 stats::procmp() 和 vegan::rda() 两种方法

2018-11-02 Gao
上次提及 PCA 分析的方法有很多种。那不同方法之间的得到的结果会有差异吗? 最近采用 PCA 分析 RNA-seq 样本之间的差异,得到了下面的结果。 […] 生成一个含有 1000 个基因, 27 个样品的数据集. 这 27 个样品来自于 3 个基因型(WT, Mutant1, Mutant2), 3 种处理(CK, Trt1, Trt2), 共分为 \(3 * 3 = 9\) … 阅读全文 →
R

Bray Curtis Dissimilarity

2018-10-17 gaoch
本文介绍 Bray Curtis Dissimilarity 的概念和计算方法。 Bray Curtis Dissimilarity(Bray-Curtis 相异度)是生态学中用来衡量不同样地物种组成差异的参数。 其定义和计算公式为: $$BC_{ij}=1-2C_{ij}/(S_{i}+S_{j})$$ 其中: […] 有两个水族箱: […] … 阅读全文 →