アルゴリズム(Xエラーあり線形フィット)Ref-Linear-XErr
フィッティングモデル
データセット において、Xは独立変数、Yは従属変数で、 は、XとYのそれぞれ誤差です。 「線形フィット:Xエラーあり」は、データを下記式のモデルにフィッティングします。
フィット制御
計算法
- York法
- York法は、D. Yorkの計算手法で、Unified equations for the slope, intercept, and standard error of the best straight lineに述べられています。
- FV法
- Fitting straight lines with errors on both coordinates で述べているG. Fasano and R. Vio の計算方法を使います。
- Deming法
- Deming回帰法は変数誤差の最尤推定法で、X/Y 誤差は、独立で同一分布にしたがっていると仮定します。
- XおよびYエラーの相関
- XおよびYエラーの相関
(York法のみ)
- X/Yの標準偏差
- X/Yの標準偏差(Deming 法のみ)
値(York 法)
線形フィットを実行すると、分析レポートシートに計算された値が出力されます。 パラメータ表には、モデルの傾きと切片(括弧内の数字は生成された値を示す)が表示されます。
フィットパラメータ
フィット値と標準誤差
xとyの重み(誤差)に関する を定義します。
このとき、 は、XとYの誤差の相関係数 (すなわち、 と )、および、 です。
重み付け(誤差)無しの のフィット線の傾きは、 と の初期値になります。 が許容値になるまで、反復計算を行います。
X_Y付きの最も良いフィット線の推定パラメータ および の簡潔な方程式は、
U および V はX および Yの偏差です。
および、
パラメータの相関係数 と標準誤差 は、
パラメータとしての標準誤差は、次のように与えられます。
ここで は、
t値と信頼水準
回帰の前提から次式があります。
フィッティングパラメータが0ではないことを調べるためにt 検定を使うことができます。これは、 (真ならば、フィット直線が原点を通る) または であるかどうかを検定します。t 検定の仮説検定は次のようになります。
The t-values can be computed by:
計算されたt 値を使って、対応する帰無仮説を棄却するかどうかを決めることができます。通常、与えられた有意水準 に対して、 のときに を棄却できます。また、 p値または有意水準が t検定と一緒に出力されます。p値が より小さい場合、帰無仮説 を棄却することができます。
Prob>|t|
上記のt 検定の が真である確率
ここでtcdf(t, df) は、自由度 df を持つスチューデントt分布の下側の確率を計算します。
LCLとUCL
t値から各パラメータの 信頼区間を次式で計算することができます。
ここで と は、それぞれ上側信頼区間と下側信頼区間のことです。
CI 半幅
信頼区間の半値幅は以下の通りです。
ここでUCLとLCLは、それぞれ上側信頼区間と下側信頼区間です。
詳細については、以下の参考文献 1 をご覧ください。
フィット統計
自由度
nは、ポイントの全数です。
残差平方和
自由度あたりカイ二乗
ピアソンのr
単純な線形回帰では、xとyの相関係数は、r で表され、次の式に等しくなります。
これは次式のように計算されます。
Root MSE(SD)
誤差の平均平方の平方根または、残差標準偏差は、次式に等しくなります。
共分散行列と相関行列
線形回帰の共分散行列は次のように計算されます。
2つのパラメータ間の相関は、
値 (FV法)
Fitting straight lines with errors on both coordinates で述べているG. Fasano and R. Vio の計算方法を使います。
重みは、次のように定義されます。
重み付け(誤差)無しの のフィット線の傾きは、 です。
次のようにします。
合計 を最小化し、部分微分を0に設定して、値 と を得ることができます。
ここで
が許容値になるまで、 に反復計算が行われます。
それぞれのパラメータの標準誤差については、線形回帰モデルを参照してください。
詳細については、以下の参考文献 2 をご覧ください。
値 (Deming法)
線形フィットを実行すると、分析レポートシートに計算された値が出力されます。 パラメータ表には、モデルの傾きと切片(括弧内の数字は生成された値を示す)が表示されます。
フィットパラメータ
Deming回帰は、xとyに測定誤差が前提とされる場合に使います。
は、 と独立で同一の分布に従い、 は、 独立で同一の分布に従います。 の場合、 直交回帰です。
モデルの加重残差平方和は最小化され、
フィット値と標準誤差
パラメータを解くことができます。
ここで、
さらに:
パラメータの相関係数は:
パラメータとしての標準誤差は、次のように与えられます。
および、
t値と信頼水準
回帰の前提から次式があります。
フィッティングパラメータが0ではないことを調べるためにt 検定を使うことができます。これは、 (真ならば、フィット直線が原点を通る) または であるかどうかを検定します。t 検定の仮説検定は次のようになります。
t 値は、次の式で計算できます。
計算されたt 値を使って、対応する帰無仮説を棄却するかどうかを決めることができます。通常、与えられた有意水準 に対して、 のときに を棄却できます。また、 p値または有意水準が t検定と一緒に出力されます。p値が より小さい場合、帰無仮説 を棄却することができます。
Prob>|t|
上記のt 検定の が真である確率
ここでtcdf(t, df) は、自由度 df を持つスチューデントt分布の下側の確率を計算します。
LCL and UCL
t値から各パラメータの 信頼区間を次式で計算することができます。
ここで と は、それぞれ上側信頼区間と下側信頼区間のことです。
CI 半幅
信頼区間の半値幅は以下の通りです。
ここでUCLとLCLは、それぞれ上側信頼区間と下側信頼区間です。
詳細については、以下の参考文献 1 をご覧ください。
フィット統計
自由度
nは、ポイントの全数です。
残差平方和
式(33)を参照。
自由度あたりカイ二乗
ピアソンのr
単純な線形回帰では、xとyの相関係数は、r で表され、次の式に等しくなります。
これは次式のように計算されます。
Root MSE(SD)
誤差の平均平方の平方根は、次式に等しくなります。
Covariance and Correlation Matrix
線形回帰の共分散行列は次のように計算されます。
2つのパラメータ間の相関は、
残差プロット
残差と独立変数
残差散布図 vs.独立変数 では、それぞれのプロットは別のグラフに配置されます。
残差vs.予測値
残差散布図 vs. フィット結果
残差vs.データ順序
vs. 順番
残差のヒストグラム
残差のヒストグラム
残差のラグプロット
残差 vs. ラグ残差
正規残差確率プロット
残差の正規確率プロットは、分散が正規分布しているかどうかを調べるのに使用します。結果のプロットはおおよそ線形で、誤差範囲は正規分布していると仮定することができます。プロットはパーセンタイル対順序化された残差をベースにしており、パーセンタイルは次のように仮定されます。
ここで、n はデータセットの合計数で、i はi 番目のデータです。
なお、正規確率プロットとQ-Qプロットについてをご覧ください。
参考文献
- York D, Unified equations for the slope, intercept, and standard error of the best straight line, American Journal of Physics, Volume 72, Issue 3, pp. 367-375 (2004).
- G. Fasano and R. Vio, "Fitting straight lines with errors on both coordinates", Newsletter of Working Group for Modern Astronomical Methodology, No. 7, 2-7, Sept. 1988.
|