ユーザ用ツール

サイト用ツール


メモ:分散分析

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
メモ:分散分析 [2017/09/08 18:30] Wiki Editorメモ:分散分析 [2017/09/08 19:44] (現在) Wiki Editor
行 173: 行 173:
   > pf(F.クラスサイズ2, res.クラスサイズ1$Df[2], res.anova$Df[5], lower.tail=FALSE)   > pf(F.クラスサイズ2, res.クラスサイズ1$Df[2], res.anova$Df[5], lower.tail=FALSE)
   [1] 0.6352074   [1] 0.6352074
 +
 +単純主効果が有意な場合の多重比較。ものによっては、一方の水準毎に分割したデータで分散分析を行ってTukeyHSDなどで多重比較するだけでよいと説明しているところもあるが、SPSSと同様の結果を得るにはやや面倒な手続きが必要。
 +
 +  # 要因1「教室」と要因2「クラスサイズ」を掛け合わせて新しい変数を作成する
 +  # つまり、教室の各水準とクラスサイズの各水準を掛け合わせてデータを分割する
 +  
 +  # 教室の各水準とクラスサイズの各水準の値を組み合わせて変数を作成 
 +  DAT$CROSS <- paste("教", DAT$教室, "ク", DAT$クラスサイズ, sep="")
 +  # pasteで作成したCROSSという変数の型は文字列なのでfactorに変換する
 +  DAT$CROSS <- factor(DAT$CROSS)
 +  
 +  # このように2つの変数を掛け合わせて作成した新しい変数でデータを分割して、それぞれの多重比較を行う
 +  # ここでは教室が2水準で、それぞれクラスサイズが3水準あるので、カテゴリは6つになる。
 +  
 +  # pairwise.t.test関数を利用してDAT$CROSSについて1対毎にT検定を行う
 +  # ただし、ここでp値の調整オプションをつけてはいけない。Bonferroniの方法で調整を行う際の帰無仮説の数は
 +  #  6つの全てのカテゴリではなく、「教室」要因毎であれば「クラスサイズ」の3水準の多重比較なので、
 +  #  3(3-1)/2=3回の検定の繰り返しを調整しなければならない。pairewise.t.test関数でp.adjust.method="bonferroni"
 +  #  指定してしまうと、6(6-1)/2=15で調整してしまう。
 +  
 +    > pairwise.t.test(DAT$点数, DAT$CROSS, p.adjust.method="none")
 +  
 +          Pairwise comparisons using t tests with pooled SD 
 +  
 +  data:  DAT$点数 and DAT$CROSS 
 +  
 +         教1ク1    教1ク2    教1ク3    教2ク1    教2ク2 
 +  教1ク2 0.00032                                
 +  教1ク3 < 2e-16   1.8e-13                        
 +  教2ク1 0.00024   0.93866   2.8e-13                
 +  教2ク2 5.2e-05   0.63521   2.9e-12   0.69099        
 +  教2ク3 6.2e-10   0.00452   8.3e-07   0.00569   0.01736
 +  
 +  P value adjustment method: none 
 +  
 +  # ここで、単純に先ほど作成した「CROSS」の水準毎にt検定を行ってもよいように思うが、
 +  # t値を求める際の標準偏差としてプールされた標準偏差を利用する必要があるため、1対毎のt検定ではだめ
 +  # 交互作用がある場合の多重比較では全ての2要因をクロスして作成した全てのグループのプールされた標準偏差を
 +  # 利用するようだ。SPSSの出力を再現するには、この手順を踏む必要がある。
 +  
 +  # 結果を変数に保持したうえでBonferrniの方法でp値を調整する
 +  > 多重比較p値 <- pairwise.t.test(DAT$点数, DAT$CROSS, p.adjust.method="none")
 +  
 +  # 例えば、教室が「CALL教室」の場合のクラスサイズの各水準の多重比較ならば
 +  #  「教2ク1」「教2ク2」「教2ク3」の検定結果を取り出して、p値を調整する
 +  
 +  # 必要なp値を取り出してベクトルに格納
 +  > 対象p値 <- c(多重比較p値$p.value["教2ク2","教2ク1"], 多重比較p値$p.value["教2ク3","教2ク1"], 多重比較p値$p.value["教2
 +ク3","教2ク2"])
 +  # もしくは
 +  > 対象p値 <- c(多重比較p値$p.value[4:5,4], 多重比較p値$p.value[5,5])
 +  
 +  # Bonferroniの方法でp値を調整
 +  > p.adjust(対象p値, method="bonferroni")
 +  [1] 1.00000000 0.01705889 0.05208608
 +  
 +  # ついでのholmの方法も。Rの分散分析でよく使われるAnova君ではこの値が出力されるようだ。
 +  > p.adjust(対象p値, method="holm")
 +  [1] 0.69098604 0.01705889 0.03472406
 +
 + 以上が、外国語教育研究ハンドブックの対応のない2元配置の分散分析のRでの再現方法となる。
 +
 + 素直に「ANOVA君」を使えばよいのだが、計算方法(というか計算はRが勝手にやるが)の理解のためにRで手順を追って調べてみた。
 +
 +
 +
  
メモ/分散分析.1504863052.txt.bz2 · 最終更新: 2017/09/08 18:30 by Wiki Editor

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki