アルゴリズム (二元配置分散分析)
二元配置分散分析(Two-Way ANOVA)の理論
を因子AのレベルI と因子Bのレベル j でのk番目の観測値を表すものとすると、二元配置分散分析モデルは下記のように書くことができます。
/math-0effb5dfe043214d3b87ff3ca0b1e4d4.png)
ここで、 は反応データ全体の平均、 は因子Aのレベル I での偏差、 は因子Bのレベル j での偏差、 は2つの因子間の交互作用で、 は誤差項です。そして、標本の変化は、3つの部分に分けられ、3つの仮説検定を行うことができます。
ですから、因子Aに関しては、帰無仮説はrの異なる母集団の平均が同じとし、対立仮説は、少なくとも1つの標本の平均が、他とは異なるということになります。
/math-c33acaa27b66cec3e5a477ef1a4ec7ec.png)
のとき、いくつかの p とq において, pは1と等しくなく、qはrと等しくありません。
ですから、因子Bに関しては、帰無仮説はsの異なる母集団の平均が同じとし、対立仮説は、少なくとも1つの標本の平均が、他とは異なるということになります。
/math-b0c76e650b839f11332fb55bc4916f4a.png)
のとき、いくつかの p とq において, pは1と等しくなく、qはsと等しくありません。
交互作用の項に対して、帰無仮説は、2つのファクター間の交互作用が無いということです。
/math-e7658574652ff84922c7e45311aa9711.png)
のとき、いくつかの p とq において, pは1と等しくなく、qはrsと等しくありません。
これらの仮説を検定するため、標本全体を4つの部分に分け、標本の変化で推定します。
/math-2c795d2f616da7e117502bbcf9cb9a87.png)
ここで
/math-47e7f804f075b9c157584ec06cce79cd.png)
/math-df8189819caf3b152811459af23977f2.png)
/math-af748babfd23e3bfd39704d86135daa5.png)
/math-07adec886e53b88c568666a7f5ad66d9.png)
/math-472bd2d14aa56baec128037732f9c276.png)
すると、次の値を得ることができます。
/math-74c3be6091d315b1d45889451f08c9f1.png)
/math-8c782727576bb980e6cef0ccfd682cdf.png)
/math-2ae3b31c7b66edb18f543169b3f2c9fa.png)
/math-6b23df9fc156465fe8f63b0c088432ec.png)
は合計二乗和、 は因子Aからの平均差の変化、 は因子Bからの平均の変化をそれぞれ表します。そして、 は交互作用の変化を、 ははすべての個別の標本の変化を表します。そして、 F 検定はそれらの間の分散の有意差を検定するのに使います。
/math-fd17c1de0001a4efd8b9a0c82993d061.png)
/math-44845adb89d0b9dd10565f5ff22f742a.png)
/math-57af428ccc9c055f5a80fdc87089b1c2.png)
ある有意水準 が与えられると、 F 統計量が重要な値 を超える場合、またはF統計量のP値が有意水準 以下の場合、帰無仮説 は棄却されます。
二元配置分散分析の計算は以下のようにまとめることができます。
分散の入力 |
自由度 (DF) |
平方和 (SS) |
平均平方 (MS) |
F 値 |
Prob > F |
因子A |
r - 1 |
/math-8d95f5934baa7c353f18fd77c675e92c.png) |
/math-d8cf712091994539169b7f92bcabdd67.png) |
/ /math-ff8dc369a4b279c7e064cb1ef6fc4ba1.png) |
/math-336e88336f1a211d0c3f3e2f533edff3.png) |
Factor B |
s - 1 |
/math-8abe5e40ad8ae7fd4ed12d2d27a1a7dd.png) |
/math-666cadb9e58dc0e560e052a20e3a510f.png) |
/ /math-ff8dc369a4b279c7e064cb1ef6fc4ba1.png) |
/math-b9560f30879a8b17bbee7eebd41b9efa.png) |
交互作用 |
(r- 1) (s - 1) |
/math-23d40e491f33023cbce6ed1898054a81.png) |
/math-bcd1cd8741b39cdd8c3e290f145ae5a1.png) |
/ /math-ff8dc369a4b279c7e064cb1ef6fc4ba1.png) |
/math-50ceeeecbb0c9e5fec9e00f101ebad0c.png) |
Error |
rs (t - 1) |
/math-349fb0475e9b16a6353bbc1aae235e6a.png) |
/math-ff8dc369a4b279c7e064cb1ef6fc4ba1.png) |
|
|
合計 |
rst - 1 |
/math-100f5db42fc55631c7b4e798218f6a8f.png) |
|
|
|
Originの二元配置分散分析は、いくつかのNAG関数を使っています。NAG関数 nag_dummy_vars (g04eac)は、必要な形の行列を作成し、NAG関数nag_regsn_mult_linear (g02dac) は、必要な形の線形回帰を実行します。線形回帰の結果は、二元配置ANOVA表を作成するのに使われます。詳細はNAG文書をご覧ください。
複数の平均比較
少なくとも1つのファクターレベルの平均が統計的に他のファクターレベルの平均と異なることを調べる二元配置ANOVAを実行すると、それに続けて、平均が異なるかどうかすべてのファクターでの可能な組合せで、平均の比較が行われます。Originでは、平均比較にさまざまな方法があり、これはNAG関数のnag_anova_confid_interval (g04dbc)を使って行っています。
複数の平均の比較法の2種類がOriginに含まれています。
シングルステップ法これは、Tukey-Kramer, Bonferroni, Dunn-Sidak, Fisher’s LSD, Scheffé, Dunnettを含む、平均がどの程度違うのかを示すために信頼区間を作成します。
ステップワイズ法Holm-Bonferroni 、Holm-Sidak 検定を含む仮説検定を実行します。
検出力解析
検出力分析は、サンプルデータに対する仮説の検出力だけでなく、実際の検出力を計算します。
二元配置ANOVAの検出力は、その敏感度の計測です。検出力は、ANOVAが実際の差があるときの標本の平均の差を検出するものです。帰無仮説および対立仮説に関して、検出力は検定する統計量 F が、実際に帰無仮説を棄却すべき(例:与えられた帰無仮説が真でない)ときに、帰無仮説を棄却するのに十分であるという確率です。
Originの二元配置ANOVAダイアログは、因子A および因子B に対する検出力を計算します。「交互作用」チェックボックスが選択されている場合、OriginはA*Bの交互作用に対して、検出力を計算することが出来ます。
検出力は次式で定義されます。
/math-e3a9b7f790e5b9b01d2fe974337ea4cf.png)
ここで f は、非中心の F-分布の偏りで、このF分布は自由度df および dfe と nc = SS/MSEを持ちます。SS はA, B, A*Bの二乗和で、 MSEは誤差の平均平方、 df は元のA, B, A*Bに関しての分子の自由度、 dfe は誤差の自由度です。全ての値(SS, MSE, df, dfe) は、ANOVA表で取得できます。probf( ) の値が、NAG関数nag_prob_non_central_f_dist (g01gdc)を使って取得されます。詳細はNAG文書をご覧ください。
上記は、簡単な一元配置ANOVAのアルゴリズムの概要であり、詳細な数学的な演算については、このマニュアルの対応する部分やNAG文書を参照してください。
|