列の統計ダイアログボックス


目次

  1. 1サポート情報
  2. 2 再計算
  3. 3 入力
    1. 3.1 空のデータセットを除外
    2. 3.2 テキストデータセットを除外
    3. 3.3 入力データ
  4. 4
    1. 4.1 モーメント
    2. 4.2 分位数
    3. 4.3 極値
  5. 5 計算制御
    1. 5.1 重み付け法
    2. 5.2 モーメントの分散除数
    3. 5.3 分位数の補間
  6. 6 出力
  7. 7 プロット

サポート情報

再計算

再計算オプションの詳細は、分析結果の再計算を参照してください。

入力

空のデータセットを除外

このチェックをつけると、空のデータセットを計算に使用しません。

テキストデータセットを除外

このチェックをつけると、テキストデータセットを計算に使用しません。

入力データ

インデックスまたは素データから入力データモードを指定します。

独立列

各列が別々のデータセットとして扱われます。それぞれのデータで独立した統計操作が実行されます。

単一データセットに合併する

全列が1つのデータセットとして扱われます。

範囲1

実行するデータ範囲を指定します。

データ範囲
入力するデータの範囲です。
グループ
グループ情報を含む複数のグループ列は、グループボックスに入力します。グループ値によって対応するセルのデータがどのグループからのものであるかを示します。 ツールバーGroup List Toolbar.pngの、上へ移動Button Group List Move Up.png下へ移動Button Group List Move Down.png削除Button Group List Remove.pngすべて選択Button Group List Select All.png選択Button Group List Add.pngボタンでグループ列の追加や削除、順序変更が可能です。
列の値がほとんどテキストの場合、グループ列はカテゴリとして設定されます。そのため、簡単に出力列を並び替えることができます。
重み範囲
重み付け情報を含む範囲です。各セルの値が対応するデータの重みを指定します。

モーメント

i\,番目のサンプルをx_i\,とし、i\,番目のサンプルをw_i\,とします。

N合計

Nで表されるデータポイントの総数

N 欠損

欠損値の数

平均

平均(アベレージ)スコア

\bar{x}=\frac 1w\sum_{i=1}^n x_iw_i.WEIGHT変数がない場合、式は\frac 1n\sum_{i=1}^n x_iになります。

標準偏差

s=\sqrt{\sum_{i=1}^n w_i(x_i-\bar{x})^2/d}

ここで、d=n-1 \,です。

Note: OriginProでは, d に4つ以上のオプションがあり、これは、 モーメントの分散除数項目で定義されます。

平均値のSE 平均の標準誤差です。

\frac s{\sqrt{w}}

平均の下側95%信頼区間

平均の95%信頼区間の下側限界

\bar{x}-t_{(1-\alpha /2)}\frac s{\sqrt{n}}

ここで、t_{(1-\alpha /2)} は、n-1 の自由度を持つスチューデントt -統計の (1-\alpha /2) 棄却値です。

平均の上側95%信頼区間

平均の95%信頼区間の上側限界

\bar{x}+t_{(1-\alpha /2)}\frac s{\sqrt{n}}

ここで、t_{(1-\alpha /2)} は、n-1 の自由度を持つスチューデントt -統計の (1-\alpha /2) 棄却値です。

分散

 s^2\

合計 \sum_{i=1}^n x_iw_i.WEIGHT変数がない場合、式は\sum_{i=1}^n x_iになります。
歪度

歪度は、分布の非対称性の度合いを測るものです。以下のように定義されています。

\gamma_1=\frac n{(n-1)(n-2)}\sum_{i=1}^n w_i^{\frac 32}(\frac{x_i-\bar{x}}s)^3 ,\mbox{for DF}

\gamma_1=\frac 1n\sum_{i=1}^n w_i^{\frac 32}(\frac{x_i-\bar{x}}s)^3,\mbox{for N}

\gamma_1=\frac 1d\sum_{i=1}^n w_i^{\frac 32}(\frac{x_i-\bar{x}}s)^3,\mbox{for WVR}

Note: WDFおよびWSが選択されていると、歪度は欠損値として返されます。

尖度

尖度は、分布のとがり具合を表します。

\gamma_2=\frac{n(n+1)}{(n-1)(n-2)(n-3)}\sum_{i=1}^n w_i^2(\frac{x_i-\bar{x}}s)^4-\frac{3(n-1)^2}{(n-2)(n-3)},\mbox{for DF}

\gamma_2=\frac 1n\sum_{i=1}^n w_i^2(\frac{x_i-\bar{x}}s)^4 -3,\mbox{for N}

\gamma_2=\frac 1d\sum_{i=1}^n w_i^2(\frac{x_i-\bar{x}}s)^4 -3,\mbox{for WVR}

Note: WDFおよびWSが選択されていると、尖度は欠損値として返されます。

未修正平方和

\sum_{i=1}^n w_ix_i^2

修正平方和

\sum_{i=1}^n w_i(x_i-\bar{x})^2

ばらつきの係数

\frac s{\bar{x}}

平均絶対偏差

\frac{ \sum_{i=1}^n w_i|x_i-\bar{x}|}w

SDの2倍

標準偏差の2倍です。

2s \,

SDの3倍

標準偏差の3倍です。

3s \,

幾何平均

\bar{x}_g=\left( \prod_{i=1}^n x_i\right) ^{\frac 1n}

Note: 幾何平均では重みは無視されます。

幾何SD

幾何学標準偏差 e^{std(\log x_i)} ここで、std は、重み付けされていない標準偏差です。

Note: 幾何標準偏差では重みは無視されます。

モード

モード(最頻値)は、データ範囲で最も頻繁に表示される要素です。最頻値が複数ある場合は、最小のものが選択されます。

重みの合計

w=\sum_{i=1}^n w_i

調和平均

調和平均です。


重みなし: \frac n{\frac 1{x_1} + \frac 1{x_2} + ...+ \frac 1{x_n}}=\left(\frac {\sum_{i=1}^n (x_i)^{-1}}n\right)^{-1}

重み付き: \frac {\sum_{i=1}^n w_i}{\sum_{i=1}^n \frac {w_i}{x_i}}=\left(\frac {\sum_{i=1}^n w_i x_i^{-1}}{\sum_{i=1}^n w_i}\right)^{-1}

任意のx_iまたは重みが負の場合、欠損値を返し、任意のx_iまたは重みが0の場合は0を返します。

分位数

分位数は、データからの値で、与えられたセットのデータポイントの所定の割合です。たとえば、任意のデータセットのデータポイントの25%が最初の四分位数より下にあり、データポイントの50%が2番目の四分位数または中央値より下にあります。

入力データセットを昇順で並べ替えます。x(i)\,を、並べ替えられたデータセットのi\,番目の要素とします

最小値

x_{(1)}\,

最小値のインデックス

元の入力データセットで最小値がある行の番号です。

第一四分位(Q1)

第1 (25%) 四分位、Q1です。計算方法については、分位数の補間を参照してください。

中央値

メディアンまたは第2 (50%)四分位、Q2です。計算方法については、分位数の補間を参照してください。

第3四分位(Q3)

第3 (75%) 四分位、 Q3です。計算方法については、分位数の補間を参照してください。

最大

x_{(n)}\,

最大値のインデックス

元の入力データセットで最大値がある行の番号です。

四分位範囲 (Q3-Q1)

Q_3-Q_1\,

範囲 (最大-最小)

最大 - 最小

カスタムパーセンタイル

カスタムパーセンタイルを計算する場合チェックを付けます。

パーセンタイルリスト

このオプションは、カスタムパーセンタイルにチェックが付いている場合にのみ利用できます。ここに入力された全ての値でのパーセンタイルが計算されます。

中央値の絶対偏差(MAD) 単変量データセットX1、X2、...、Xnの場合、MADはデータの中央値からの絶対偏差の中央値として定義されます。

MAD = median(|{X_i} - median(X)|)\,

つまり、データの中央値からの残差(偏差)で始まる場合、MADは絶対値の中央値です。

ロバスト変動係数

(MAD/norminv(0.75))/Median\,

極値

極値を返します。極値は、最も高い値と最も低い値です。
l = 
\begin{cases} 
 5,& \mbox{if }\ n\geq 10 \\
  n/2, & \mbox{otherwise }
\end{cases}

ここで、nはデータセットの長さです。

計算制御

重み付け法

入力データに対する重み付け方法を選択します。

直接重み付け

w_{i}=c_{i}\,\! ここで、c_{i}\,\!i 番目の重み付けデータセットです。

機械的

w_{i}=\frac 1{\sigma _{i}^2}\,\! ここで、\sigma_{i}\,\! は、指定されたエラーバー列の値です。

統計

w_{i}=\frac 1{x_{i}}\,\!。ここで、x_{i}\,\! は入力データです。

モーメントの分散除数

分散除数d の計算を制御します。

DF 自由度

d=n-1\,

N 欠損していない観測値の数

d=n\,

WDF 重みのあるDFの合計

d=w-1\,

WS 重みの合計

d=w\,

WVR d=w-\sum_{i=1}^n w_i^2/w

分位数の補間

Q1、Q2、Q3を求める方法を決めます。

i\,番目のパーセンタイル(分位)をyとし、p=i/100\, を設定します。そして、次のように定義します。

\begin{cases}
    (n+1)p=j+g, & \mbox{for Weighted Average Right } \\
    np=(j+g),& \mbox{for other methods }
\end{cases}

ここで、 j は、np, の整数部で、 g は、np の分数部であり、それぞれ異なる方法は i^{th}\,番目のパーセンタイル、 yを次に述べる方法で定義します。

平均化による経験分布 y = 
\begin{cases} 
 \frac 12(x_{(j)}+x_{(j+1)}),& \mbox{if }\ g=0 \\
  x_{(j+1)},& \mbox{if }\ g>0
\end{cases}
最近傍 np\,に最も近い番号の観測値

y = 
\begin{cases} 
 x_k,& \mbox{if }\ g\neq \frac 12 \\
  x_j,  & \mbox{if }\ g=\frac 12 \mbox{ and j is even} \\
  x_{(j+1)},& \mbox{if }\ g=\frac 12 \mbox{ and j is odd}
\end{cases} ここで k は、np+\frac 12\,の整数部です

経験分布 y= 
\begin{cases}
    x_{(j)}, & \mbox{if }\ g=0  \\
    x_{(j+1)},& \mbox{if }\ g>0
\end{cases}
加重平均(右) x_{((n+1)p)}\,に向けた加重平均

y=(1-g)x_{(j)}+gx_{(j+1)}\, ここで x_{(n+1)}\,は、x_{(n)}\,の値を取ります。

加重平均(左) x_{(np)}\,に向けた加重平均

y=(1-g)x_{(j)}+gx_{(j+1)}\, ここで x_0\,は、x_1\,の値を取ります。

Tukey Hinges 以下のようにする。

m = 
\begin{cases} 
 \frac n2,& \mbox{if n is even} \\
  \frac{(n+1)}2,& \mbox{if n is odd}
\end{cases}

k = 
\begin{cases} 
 \frac m2,& \mbox{if m is even} \\
  \frac{(m+1)}2,& \mbox{if m is odd}
\end{cases}

すると、次のようになります。

Minimun=x_{(1)}\,


Q_1= 
\begin{cases} 
 x_k,& \mbox{if m is odd} \\
  \frac 12(x_{(k)}+x_{(k+1)}),& \mbox{if m is even}
\end{cases} Q_2= 
\begin{cases} 
 x_m,& \mbox{if n is odd} \\
  \frac 12(x_{(m)}+x_{(m+1)}),& \mbox{if n is even}
\end{cases}

Q_3= 
\begin{cases} 
 x_{(n-k-1)},& \mbox{if m is odd} \\
  \frac 12(x_{(n-k)}+x_{(n-k+1)}),& \mbox{if m is even}
\end{cases}

Maximum=x_{(n)}\,

Note: 重みが指定されていると、重み付けされたパーセンタイルが計算されます。p番目の重み付けされたパーセンタイル y は、平均を持つ経験分布関数y= 
\begin{cases} 
  \frac 12(x_{(i)}+x_{(i+1)}),& \mbox{if }  \sum_{j=1}^i w_j=pw \\
  x_{(i+1)},& \mbox{if }  \sum_{j=1}^{i} w_j<pw<\sum_{j=1}^{i+1}w_j\\
  x_{(1)},& \mbox{if } \ pw<w_1 \\
  x_{(n)},& \mbox{if } \ pw<w_n \\
\end{cases}から計算されます。

出力

Origin 2022以降、グループ列の入力列のフォーマットは出力シート(例:DescStatsQuantities)で維持されます。たとえば、日時データの列に統計を実行する場合、出力シートでの列のフォーマットは自動で日時として設定されます(以前は、テキストとしてフォーマットされていました)。以前の動作に戻すには、@SCCSF = 0を設定します。システム変数の値を変更する方法については、FAQ-708 システム変数を永続的に変更するにはにあるシステム変数の変更を参照してください。

グラフ 結果のプロットの配置を制御します。
グラフを縦列に配置します。
出力グラフを配置する列数を指定します。
グラフ中に同じ形式のプロットを配列
チェックを付けると、同じグラフタイプのものは全て1つのグラフウィンドウにプロットします。
データセット識別子 元のデータセットの識別子を選択します。
識別子
リストから選択します。
  • 範囲
範囲シンタックスを使用します。
  • ブック名
ワークブックのロングネームを使用します。
  • シート名
ワークシート名を使用します。
  • 名前
存在する場合はロングネームを使用し、ない場合はショートネームを使用します。
  • ショートネーム
列ショートネームを使用します。
  • ロングネーム
列ロングネームを使用します。
  • 単位
列単位を使用します。
  • コメント
列コメントを使用します。
  • <カスタム>
カスタムフォーマットを使ってデータ識別子を指定します。これを使用するには、詳しく凡例テキストの編集をするを参照してください。
フラットシートに識別子を表示
結果のフラットシートでデータセット識別子を使用します。
レポート表 レポートワークシート表の出力場所です。
ブック
出力ワークブックです。
  • <なし>: レポートワークシートテーブルを出力しません。
  • <ソース>: 元データのワークブックを使います。
  • <新規>: 新しいワークブックを作成します。
  • <既存>: 既存のワークブックを使います。
ブック名
出力ワークブックです。ソース(編集不可)、新規、既存のもの(編集可)から選択します。
シート
出力ワークシートで、常に新しいシート <新規>に出力します。
シート名
出力シートの名前です。
結果ログ
結果ログにレポートを出力します。
スクリプトウィンドウ
スクリプトウィンドウにレポートを出力します。
ノートウィンドウ
出力するノートウィンドウを指定します。
  • <なし>: ノートウィンドウに出力しません。
  • <新規>: 新しいノートウィンドウに出力します。
値の出力先を指定します。
ブック
出力先のワークブックを指定します。
  • <なし>: 値を出力しません。
  • <ソース>: 元データのワークブックを使います。
  • <レポート>: レポート表ワークブックを作成します。
  • <新規>: 新しいワークブックを作成します。
  • <既存>: 指定した既存のワークブックを使用します。
ブック名
出力ワークブックです。ソース(編集不可)、新規、既存のもの(編集可)から選択します。
シート
  • <新規>: 新しいワークシートを作成します。
  • <ソース>: 元データのワークシートを使います。
  • <既存>: 指定した既存のワークシートを使用します。
シート名
出力シートの名前です。
オプショナルなレポートテーブル レポートワークシートに出力する項目を指定します。
ノート
ノート表
入力データ
入力データのテーブル
マスクされたデータ
マスクデータのテーブル
欠損データ
欠損値のテーブル

プロット

ヒストグラム 結果シートにヒストグラムを出力します。

ここにチェックを付けると、詳細の設定項目が表示されます。以下の項目があります。

  • データ高さドロップダウンでヒストグラムのY軸を決定します。
  • カウント: Y 軸でビンカウントを表示します。
  • 相対頻度: Y軸で合計カウントで割った個別のビンカウントを表示します。
  • 密度: Y軸は、ビン幅で割った相対頻度(特定のビン内の観測数)を表示します。
  • 自動ビン化チェックボックスはデフォルトで選択されています。自動ビン化のチェックを外すと、ビンサイズビンの数開始終了が表示されます。
Note: 入力データが複数の列の場合、自動ビン化 は列ごとに独立した設定を使用するため、ビン化と軸の範囲が大きく異なる場合があります。この場合、Originは各列に制限値(編集不可)を表示します。自動ビン化チェックボックスのチェックが付いていないと、これらの項目は、初期値で編集できます。

Auto Binning.png

ビンサイズ、開始、終了の値を設定すると、ビンの数が自動的に計算されます。

ビンの数ビンサイズは、増分値で変更することができます。

ビンの数 = (開始 - 終了) / ビンサイズ

ボックスチャート レポートシートにボックスチャートを出力します。入力データがグループ列を持つ場合、それに応じてボックスチャートもグループ化されます。グループ列がカテゴリーとして設定されていると、ボックスチャートは、グループ範囲に対するカテゴリータブ(列のプロパティ)で指定されたカテゴリー順を参照してプロットされます。