記述統計

サマリー

Originは、基本統計(平均、中央値、分散など)、度数カウント、選択したデータの相関係数など、包括的な記述統計をサポートしています。強力なグラフ作成機能に加えて、Originの統計ツールはデータをまとめたり、分析するのに役立ちます。

学習する項目

このチュートリアルでは、以下の項目について説明します。

  • 列の統計ダイアログを使って、グループ化した記述統計を計算する
  • さらなる処理のために、新しいワークシートに統計結果をコピーする
  • 指定した列内のワークシートデータを属性ごとにソートする
  • 相関係数ツールを使ってデータセットを分析する

必要なOriginのバージョン: Origin 2015 SR0以降

グループに対する度数情報を検索する

離散度数ツールを使って、データの度数情報を素早く取得することができます。

  1. 新規ワークブックを作成します。メインメニューのデータ:ファイルからインポート:単一ASCIIファイルを選択し、\Samples\Statisticsフォルダのautomobile.datをインポートします。
  2. ワークシートautomobileの1列目と2列目を選択します。メインメニューの統計:記述統計:離散度数表を選択し、ダイアログを開きます。再計算モードはドロップダウンから自動を選択します。元データシートのカテゴリー値をコントロールするが動くように、データのソートカテゴリー順に変更します。OKをクリックします。
    Descriptive Statistics00.png
  3. 結果シートDiscretFreq1に、YearとMake列のデータ項目と度数カウントがそれぞれ出力されます。

各列には鍵マークが表示され、再計算モードがオンになっていますが、このワークシートデータに対して操作を加えることが可能です。例えば、メニューのワークシート:ソート(ワークシート)を選択して昇順降順カスタムと選択すると、データをソートできます。

グループ化したデータの記述統計を計算する

列の統計ツールを使用すると、各列のデータそれぞれの基本統計を計算できます。

  1. ワークシートautomobileに戻ります。 メインメニューの統計:記述統計:列の統計を選択し、ダイアログを開きます。
  2. 列の統計ダイアログで、入力タブの範囲1ブランチを開き、データ範囲の右側にあるButton Select Data Interactive.pngボタン をクリックします。 ダイアログが小さくなりますので、ワークシートに戻って列Cから列Gまでのデータ範囲をドラッグで選択してセットします。小さくなったダイアログにあるボタンをクリックし、ダイアログを元に戻します。 ダイアログボックスで、範囲1の下にある 入力データを調整した後、グループ制御ボックスの右上にある矢印をクリックし、B(Y): Make をグループデータとして選択します。再計算モードはドロップダウンから自動を選択します。
    DOC-2411 Descriptive Statistics on Grouped Data 001aa.png
  3. 出力設定ノードを開き、さらにグラフ配置ノードを開きます。グラフ中の同じ形式のプロットを配列にチェックを付け、プロットノードを開いてボックスチャートをチェックします。
    DOC-2411 Descriptive Statistics on Grouped Data 001b.png DOC-2411 Descriptive Statistics on Grouped Data 001c.png
  4. OK をクリックし、レポートシートに結果を表示します。
    Tutorial Descriptive Statistics on Grouped Data 04.png

レポートシート内の埋め込みボックスプロットを編集するためには、そのボックスプロットをダブルクリックして開きます。グラフを編集したら、開いたグラフウィンドウの右上にある戻るボタンをクリックし、レポートシートに編集したグラフを戻します。

統計計算結果を使って、さらに操作を続ける

統計結果をさらに分析したり、統計結果をプロットすることができます。

例えば、Makeが1992から2004までの自動車の属性値(馬力、0-60mph時間、重量、燃費)の平均を取得し、以下を実行します。

  1. ワークブックautomobile - automobile.datに戻り、DescStatsQuantities1シートを開きます。 列D(Y2)E(yEr±) を選択し、メインメニューのワークシート:列アンスタッキングを選択してダイアログを開きます。
  2. wunstackcol ダイアログで、再計算モードを自動に設定し、グループ化列ではコンテキストメニューボタンContext menu button.jpg をクリックしてA(X1) データを選択します。
  3. オプションノードを開き、その他の列を含めるのチェックボックスにチェックを付けます。 その他の列Context menu button.jpgボタンをクリックして表示されるコンテキストメニューから列A2:(X) Makeを選択します。そして、ルールを抽出に関しては最長グループ一致を選択します。その他の列値のためにルールを抽出では最長グループ一致を選択し、出力設定ノードではグループ情報の入れ先ロングネームを選択します。OKをクリックします。
    DOC-2411 Descriptive Statistics on Grouped Data 006a.png
  4. 結果を視覚化するために、グラフを作図します。結果シートUnstackCols1を開き、ワークシート全体を選択してメインメニューの作図: 複数区分/軸: 積み上げグラフを選択して作図します。
  5. 積上げ:plotstackダイアログボックスでプロットタイプ散布図に設定します。 OKをクリックします。
  6. 表示されたグラフで、上X軸の目盛りラベルを45度回転させます。 X 軸ラベル上でダブルクリックして開くダイアログでアイコンを選択した状態で下図のよう設定します。OKをクリックします。
    Tutorial Descriptive Statistics Axis Dialog.png
    同じ要領で、下のラベルも同じように回転させます。
  7. レポートシートとグラフは下図のようになります。
    Tutorial Descriptive Statistics on Grouped Data 0055.png

異なるインジケータ間の関係を分析する

相関係数を使って、自動車のデータの列間の関係を調べることができます。また、散布図行列と信頼楕円をプロットして、相関を視覚的に見ることができます。

  1. ワークブックautomobile - automobile.datautomobile シートを開き、最後の5列を選択します。
  2. メインメニューの統計:記述統計:相関係数を選択し、ダイアログを開きます。 開いたcorrcoef ダイアログで相関タイプピアソンにします。
  3. プロットノードを開き、信頼楕円の追加チェックボックスにチェックを入れます。散布図チェックボックスは自動的に選択されます。 OKをクリックします。
  4. ScatterMatrix1CorrCeof1 シートは以下のようになリます。Engine DisplacementPowerには、正の強い相関があり、Gas MileageEngine Displacementには負の強い相関があることがわかります。
    Tutorial Descriptive Statistics on Grouped Data 007.png

カテゴリー値をコントロールする

  1. 以下のステップでは元データを変えることなく、グラフに表示されている値の順番を変更します。ワークブックの列Bで右クリックしてコンテキストメニューでカテゴリーとして設定を選択します。列のカテゴリーセルにある「ソートなし」をダブルクリックしてカテゴリーダイアログを開きます。
    Desc stats control cat values.png
  2. カテゴリーの編集にチェックを入れ、矢印ボタンCate-sort-2.pngを使ってそれぞれの項目の位置を以下の図のように設定します。これにより、製造元がある国順(アメリカ→日本/韓国→ヨーロッパ)に並び替えます。OKをクリックしてダイアログを閉じます。
    Categ Sort-3.png
  3. 上記セクションで作成したレポートシートを確認すると、並び順に反映されていることが分かります。再計算モードで自動が選択されているため、度数離散表列の統計のワークシート(ボックスチャートを含む)に自動的に反映され、カテゴリーデータで指定した並び順になります。
    Tutorial Descriptive Statistics on Grouped Data 004.png
  4. 列アンスタッキングを行った結果とグラフも自動的に更新されます。
    Tutorial Descriptive Statistics on Grouped Data 008.png
Note:結果が自動的に更新されていない場合、手動で更新させる方法もあります。標準ツールバーの再計算ボタンButton Recalculate Manual.pngをクリックすると、更新します。再計算が行われると、ボタンは緑色Button Recalculate Auto.pngになります。