文書の過去の版を表示しています。

1要因の分散分析対応なし

まずは、単純な群間比較。

データの準備

A組	B組	C組	D組
8	5	12	11
7	6	10	10
9	6	9	15
12	7	14	12
10	3	14	13

このままSPSSのように入力するとうまくいかないので、クラスを分ける変数を作成し以下のようなデータを作成する。IDは特に必要ないが、一応。

ID	クラス	スコア
1	A組	8
2	A組	7
…
12	C組	10
…

> id <- 1:20;
> class <- c("A","A","A","A","A","B","B","B","B","B","C","C","C","C","C","D","D","D","D","D");
> score <- c(8,7,9,12,10,5,6,6,7,3,12,10,9,14,14,11,10,15,12,13);
> df <- data.frame(ID=id, CLASS=class, SCORE=score);

各列のベクトルを作成し、データフレームにまとめる。CSVファイルから読む込む方が面倒はないが、ちょっと練習。

lm()関数で推定。CLASS変数はfactorなので、自動的にダミー変数に展開される。

> res.anova <- lm(SCORE ~ CLASS, df);
> summary(res.anova);

Call:
lm(formula = SCORE ~ CLASS, data = df)

Residuals:
   Min     1Q Median     3Q    Max
 -2.80  -1.35   0.00   1.00   2.80

Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept)   9.2000     0.8631  10.659 1.12e-08 ***
CLASSB       -3.8000     1.2207  -3.113  0.00669 **
CLASSC        2.6000     1.2207   2.130  0.04904 *
CLASSD        3.0000     1.2207   2.458  0.02577 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.93 on 16 degrees of freedom
Multiple R-squared:  0.7115,    Adjusted R-squared:  0.6573
F-statistic: 13.15 on 3 and 16 DF,  p-value: 0.0001383

回帰係数表を、記述統計出力に代用。Estimateに平均値が出力される。各郡の平均は、（Intercept）に各郡の推定値を加える。標準誤差はやや数値が異なる。一般線形モデルの場合と従来型の分散分析とは計算方法が異なるので、ここではあまり気にしない。

次に分散分析表

> anova(res.anova);
Analysis of Variance Table

Response: SCORE
          Df Sum Sq Mean Sq F value    Pr(>F)
CLASS      3 146.95  48.983   13.15 0.0001383 ***
Residuals 16  59.60   3.725

平方和の合計は出力されないが、足し算すれば良いだけ。単純な分散分析は、簡単。

1要因の分散分析 対応なし

1要因の分散分析対応なし