クロス集計
カテゴリデータの分析にはクロス集計が多く使われています。これらの分析では、分割表を使った変数の度数分布を示します。表をベースにした分析は有意な関連性があるかどうかを決定し、関連性の強さと方向を作成して、一致対データの一致を計測して検定します。
必要なOriginのバージョン:Origin 2016 SR0以降
このチュートリアルでは、以下の項目について説明します。
これは、1992年5月に実行された、418人のうち209人から得られた人口に関連する世論調査データMontana Economic Outlook Pollです。年齢(35才より下,35-54才,55才以上)、性別(男性、女性)、経済状況(昨年より:悪い、同じ、良い)等。データから得たい情報は下記です。
解析から欠損値を取り除くため、カテゴリとして列を設定します。または、欠損値を数値とします。
Crosstab1 シートを見てください。
モザイクプロットと分割表から度数分布の情報を得ることが出来ます。モザイクプロットの中の個々の長方形範囲は、男性、女性、及び全体に対する”年齢”と"経済環境"を視覚的に比較できるように、X変数のそれぞれのレベルの中にあるY変数の割合に比例します。分割表から、より特化した情報を取得することが出来ます。分割表とモザイクプロットを併せると、次のことが分かります。
カイ二乗検定表は、行と列の値に結果を示します。 もし、Prob>カイ二乗が0.05より小さい場合、これは、行や列の変数、ここでは年齢と経済状況は明らかに相関しています。表の下にあるフットノートの結果に注目します。次のような結論になります。
関係性の測定表は、「経済状況」と「年齢」の関係の強さを示します。これは、3x3 のテーブル(3つの年齢層と3つの経済状況レベル)なので、レイヤ間を比較するために、 Contingency 係数 を選択します。(3つの統計の違いについてはこちらの機能紹介ページを参照してください)表から次のことがわかります。