部分最小二乗(Partial Least Squares)

部分最小二乗(Partial Least Squares, PLS)は、主成分分析と重回帰分析の機能を兼ね備えています。最初に、独立変数と従属変数の間で可能な限り多くの共分散を説明する、潜在的な要因のセットを抽出します。次の回帰ステップで、独立変数の分解を使用して従属変数の値を予測します。

内容

  1. 1 目的
  2. 2 操作の流れ
    1. 2.1 分析データの準備
    2. 2.2 計算手法を選ぶ
      1. 2.2.1 SVD または Woldの反復法
      2. 2.2.2 交差確認
  3. 3 欠損値の扱い
  4. 4 部分最小二乗(Partial Least Squares)を実行する

目的

PLSを使用する主な理由は2つあります。

  • 推定
    PLSは、要因が多く、非常に共線状であるとき、予測モデルを構築するための一般的な手法です。
  • データの削減
    PLSは、高度に相関のある変数のセットを独立変数のセットに変換するために使用されます。

操作の流れ

分析データの準備

PLSは一般的に強く相関している変数同士で使用されます。PLSは、PCAの乗算回帰の組み合わせとして考えられるので、PCAに使用されるデータは、PLSでも使用することができます。

計算手法を選ぶ

SVD または Woldの反復法

これら2つの手法は、同じ結果を算出しますが、Woldの反復法の方がSVDよりわずかに速いです。SIMPLSは、論文での手法名です。SIMPLS は単にSVD や Woldの反復法の別名です。

交差確認

フィッティングモデルの検証は重要なステップです。交差確認で、モデルのパフォーマンスを検証することができます。Originは交差確認に、Leave-one-out メソッドを使用します。Originでは、予測された残差平方和(PRESS)とそのルート平均、交差確認による要因として最適な数を見つけるために使用されています。

欠損値の扱い

独立/従属変数に、欠損値がある場合、全てのケース(全行)が分析から除外されます。

部分最小二乗(Partial Least Squares)を実行する

  • メニューから統計:Multivariate Analysis:部分最小二乗(Partial Least Squares)
    または
  • スクリプトウィンドウでpls -dと打ち込んでください。


このセクションで説明している項目