判別分析

内容

  1. 1 目的
  2. 2 仮定
  3. 3 手順の流れ
    1. 3.1 分析データの準備
    2. 3.2 仮定の検証
    3. 3.3 判別手法を選ぶ
    4. 3.4 結果の確認と解釈
  4. 4 判別分析を実行する


判別分析は明確な違いがある観測値を識別し、新たな観測値を以前組み分けしたグループに配置するために使用されます。この方法は生物学の種の分類や、医学的な腫瘍の分類、顔認識のテクノロジー、またクレジットカードや保険業界でリスクを割り出すのに使用されます。

目的

判別分析には2つの大きな目的があります。

仮定

判別モデルには次の仮定があります。

手順の流れ

分析データの準備

仮定の検証

正規性検定共分散行列における相当性の検定プールされた郡内の相関行列を使用して仮定を検証できます。詳しくは仮定をご覧ください。

判別手法を選ぶ

Note: 線形判別関数(LDA)は判別関数内の線形で、二次式判別関数(QDA)は判別関数内の二次式になります。

結果の確認と解釈

判別関数を編集する情報、判別関数が良いかどうか判断する、または観測値を分類することについては結果の解釈ページをご覧ください。

結果の確認にはテストデータの結果、またはトレーニングデータの交差確認から判断できます。しかし上記の方法はサンプルサイズにより結果が変動しやすいので注意してください。サンプルサイズが小さい場合、結果の信頼性が損なわれる可能性があります。

Note: クロス検証は「ひとつを取り除くクロス検証」とも呼ばれています。N個の観測値がある場合、判別分析はN回実行されます。各回で1つのポイント以外のデータに付いて検証され、そのポイントについての推定がなされるからです。

判別分析を実行する

 

このセクションで説明している項目