内容 |
主成分分析は変数間の関係を調べます。これにより、例えば変数の数を回帰やクラスター分析などで減らすことができます。
主成分分析内の主成分は変数とそれに対するの最大分散との関係を線形で表わしています。Xをp個の変数を持つn個の観測値とし、この共分散の行列はSとなります。ここで変数間の線形の関係は次のようになります。
/math-ab9343ff9fcb3706ee7abdb2cb379b0e.png)
がi 番目の変数に、
は
の線形関係の係数となり、これらは列ベクトル
として示され、
で正規化されます。
の分散は
となります。
ベクトルは分散を最大にすることで見つけることができます。
は第一主成分と呼ばれています。第二主成分は次の物を最大化することで同じように見つけることができます。
と
は
を制約している主要因です。これは第二主成分が第一主成分とは直交関係にあることを示しています。残りの主成分は同様の方法で算出することができます。係数
は行列Sの固有ベクトルから計算できます。Originは欠損値を取り除くためにいくつかの手法を用いています。
欠損値がある観測データは分析から除外されます。SVD用の行列
は分析の行列タイプによりXから算出されます。
を行列Xとして各列の平均が各変数から引かれ、各列は
によってスケールされます。
を行列Xとして各列の平均が各変数から引かれ、各列は
によってスケールされます。
はi番目の標準偏差になります。SVDを
で実行します。
/math-d498c41ab09cd28f0ed57082a46e997c.png)
ここでVは
と共にあるp行列のnで、Pはp行列のpで、
は対角要素
を含む対角行列です。
/math-10d0f1ef59c0ff4f54dd64b9e67956eb.png)
です。
は主成分と関連しているスコアです。欠損値を含む観測値があった場合、これらの値と対応するスコアも欠損値になります。観測値は共分散や係数を計算する2つの変数の中で欠損値がどちらか一方にでもあるときに計算する場合のみ除かれます。
固有値と固有ベクトルは行列Sの共分散または係数から計算されます。
/math-1eb525b55da5f5a7b146d626ef443681.png)
Pはp行列のpで、Dは対角要素
がある対角行列です。
はi 番目の主成分の固有値です。下降順に固有値は保存されています。/math-bb91d01fd09e5459e2c215fa93bf2c63.png)
は行列Xから各列の平均を引いた値になります。バーレット検定は残りの固有値p-kを等しくしています。これは分析行列が共分散行列であるときのみ使用できます。
/math-f7c8bd18f6e041157a76f1fa02889635.png)
自由度
で
分散をおおよそで計算しています。
/math-465397770aeec65eb2b9adadcdd2c942.png)