アルゴリズム (二元配置分散分析)
二元配置分散分析(Two-Way ANOVA)の理論
を因子AのレベルI と因子Bのレベル j でのk番目の観測値を表すものとすると、二元配置分散分析モデルは下記のように書くことができます。
ここで、は反応データ全体の平均、は因子Aのレベル I での偏差、 は因子Bのレベル j での偏差、は2つの因子間の交互作用で、 は誤差項です。そして、標本の変化は、3つの部分に分けられ、3つの仮説検定を行うことができます。
ですから、因子Aに関しては、帰無仮説はrの異なる母集団の平均が同じとし、対立仮説は、少なくとも1つの標本の平均が、他とは異なるということになります。
のとき、いくつかの p とq において, pは1と等しくなく、qはrと等しくありません。
ですから、因子Bに関しては、帰無仮説はsの異なる母集団の平均が同じとし、対立仮説は、少なくとも1つの標本の平均が、他とは異なるということになります。
のとき、いくつかの p とq において, pは1と等しくなく、qはsと等しくありません。
交互作用の項に対して、帰無仮説は、2つのファクター間の交互作用が無いということです。
のとき、いくつかの p とq において, pは1と等しくなく、qはrsと等しくありません。
これらの仮説を検定するため、標本全体を4つの部分に分け、標本の変化で推定します。
ここで
すると、次の値を得ることができます。
は合計二乗和、 は因子Aからの平均差の変化、 は因子Bからの平均の変化をそれぞれ表します。そして、 は交互作用の変化を、ははすべての個別の標本の変化を表します。そして、 F 検定はそれらの間の分散の有意差を検定するのに使います。
ある有意水準が与えられると、 F 統計量が重要な値を超える場合、またはF統計量のP値が有意水準以下の場合、帰無仮説 は棄却されます。
二元配置分散分析の計算は以下のようにまとめることができます。
分散の入力 |
自由度 (DF) |
平方和 (SS) |
平均平方 (MS) |
F 値 |
Prob > F |
因子A |
r - 1 |
|
|
/ |
|
Factor B |
s - 1 |
|
|
/ |
|
交互作用 |
(r- 1) (s - 1) |
|
|
/ |
|
Error |
rs (t - 1) |
|
|
|
|
合計 |
rst - 1 |
|
|
|
|
Originの二元配置分散分析は、いくつかのNAG関数を使っています。NAG関数 nag_dummy_vars (g04eac)は、必要な形の行列を作成し、NAG関数nag_regsn_mult_linear (g02dac) は、必要な形の線形回帰を実行します。線形回帰の結果は、二元配置ANOVA表を作成するのに使われます。詳細はNAG文書をご覧ください。
複数の平均比較
少なくとも1つのファクターレベルの平均が統計的に他のファクターレベルの平均と異なることを調べる二元配置ANOVAを実行すると、それに続けて、平均が異なるかどうかすべてのファクターでの可能な組合せで、平均の比較が行われます。Originでは、平均比較にさまざまな方法があり、これはNAG関数のnag_anova_confid_interval (g04dbc)を使って行っています。
複数の平均の比較法の2種類がOriginに含まれています。
シングルステップ法これは、Tukey-Kramer, Bonferroni, Dunn-Sidak, Fisher’s LSD, Scheffé, Dunnettを含む、平均がどの程度違うのかを示すために信頼区間を作成します。
ステップワイズ法Holm-Bonferroni 、Holm-Sidak 検定を含む仮説検定を実行します。
検出力解析
検出力分析は、サンプルデータに対する仮説の検出力だけでなく、実際の検出力を計算します。
二元配置ANOVAの検出力は、その敏感度の計測です。検出力は、ANOVAが実際の差があるときの標本の平均の差を検出するものです。帰無仮説および対立仮説に関して、検出力は検定する統計量 F が、実際に帰無仮説を棄却すべき(例:与えられた帰無仮説が真でない)ときに、帰無仮説を棄却するのに十分であるという確率です。
Originの二元配置ANOVAダイアログは、因子A および因子B に対する検出力を計算します。「交互作用」チェックボックスが選択されている場合、OriginはA*Bの交互作用に対して、検出力を計算することが出来ます。
検出力は次式で定義されます。
ここで f は、非中心の F-分布の偏りで、このF分布は自由度df および dfe と nc = SS/MSEを持ちます。SS はA, B, A*Bの二乗和で、 MSEは誤差の平均平方、 df は元のA, B, A*Bに関しての分子の自由度、 dfe は誤差の自由度です。全ての値(SS, MSE, df, dfe) は、ANOVA表で取得できます。probf( ) の値が、NAG関数nag_prob_non_central_f_dist (g01gdc)を使って取得されます。詳細はNAG文書をご覧ください。
上記は、簡単な一元配置ANOVAのアルゴリズムの概要であり、詳細な数学的な演算については、このマニュアルの対応する部分やNAG文書を参照してください。
|