並列統計ダイアログボックス

Side-by-Side Statistics dialog.png


入力

入力データ範囲を指定します。

グループ

グループ情報を含む複数のグループ列を、グループ列ボックスに入力します。グループ値によって対応するセルのデータがどのグループからのものであるかを示します。 ツールバーGroup List Toolbar.pngの、上へ移動Button Group List Move Up.png下へ移動Button Group List Move Down.png削除Button Group List Remove.pngすべて選択Button Group List Select All.png選択Button Group List Add.pngボタンでグループ列の追加や削除、順序変更が可能です。
列の値がほとんどテキストの場合、グループ列はカテゴリとして設定されます。そのため、出力列の順序を簡単に変更できます。

計算する値

i\,番目のサンプルをx_i\,とし、i\,番目のサンプルをw_i\,とします。

N合計

Nで表されるデータポイントの総数

N 欠損

欠損値の数

平均

平均(アベレージ)スコア

\bar{x}=\frac 1w\sum_{i=1}^n x_iw_iWEIGHT変数がない場合、式は\frac 1n\sum_{i=1}^n x_iになります。

標準偏差

s=\sqrt{\sum_{i=1}^n w_i(x_i-\bar{x})^2/d}

ここで、d=n-1 \,

注意: OriginProでは、dモーメントの分散除数ブランチで定義されている4つのオプションがあります。

平均値のSE 平均の標準誤差です。

\frac s{\sqrt{w}}

平均の下側95%信頼区間

平均の95%信頼区間の下側限界

\bar{x}-t_{(1-\alpha /2)}\frac s{\sqrt{n}}

ここで、t_{(1-\alpha /2)} は、自由度n-1のスチューデントt -統計の (1-\alpha /2) 棄却値です。

平均の上側95%信頼区間

平均の95%信頼区間の上側限界

\bar{x}+t_{(1-\alpha /2)}\frac s{\sqrt{n}}

ここで、t_{(1-\alpha /2)} は、自由度n-1のスチューデントt -統計の (1-\alpha /2) 棄却値です。

分散

 s^2\

合計 \sum_{i=1}^n x_iw_i。WEIGHT変数がない場合、式は\sum_{i=1}^n x_iになります。
歪度

歪度は、分布の非対称性の度合いを測るものです。以下のように定義されています。

\gamma_1=\frac n{(n-1)(n-2)}\sum_{i=1}^n w_i^{\frac 32}(\frac{x_i-\bar{x}}s)^3 ,\mbox{for DF}

\gamma_1=\frac 1n\sum_{i=1}^n w_i^{\frac 32}(\frac{x_i-\bar{x}}s)^3,\mbox{for N}

\gamma_1=\frac 1d\sum_{i=1}^n w_i^{\frac 32}(\frac{x_i-\bar{x}}s)^3,\mbox{for WVR}

Note: WDFまたはWSメソッドが選択されると、歪度が欠損値として返されます。

尖度

尖度は、分布のとがり具合を表します。

\gamma_2=\frac{n(n+1)}{(n-1)(n-2)(n-3)}\sum_{i=1}^n w_i^2(\frac{x_i-\bar{x}}s)^4-\frac{3(n-1)^2}{(n-2)(n-3)},\mbox{for DF}

\gamma_2=\frac 1n\sum_{i=1}^n w_i^2(\frac{x_i-\bar{x}}s)^4 -3,\mbox{for N}

\gamma_2=\frac 1d\sum_{i=1}^n w_i^2(\frac{x_i-\bar{x}}s)^4 -3,\mbox{for WVR}

Note: WDFまたはWSメソッドが選択されると、尖度が欠損値として返されます。

未修正平方和

\sum_{i=1}^n w_ix_i^2

修正平方和

\sum_{i=1}^n w_i(x_i-\bar{x})^2

ばらつきの係数

\frac s{\bar{x}}

平均絶対偏差

\frac{ \sum_{i=1}^n w_i|x_i-\bar{x}|}w

SDの2倍

標準偏差の2倍です。

2s \,

SDの3倍

標準偏差の3倍です。

3s \,

幾何平均

\bar{x}_g=\left( \prod_{i=1}^n x_i\right) ^{\frac 1n}

Note幾何平均の重みは無視されます。

幾何SD

幾何学標準偏差 e^{std(\log x_i)} ここで、std は、重み付けされていない標準偏差です。

Note:幾何SDでは重みは無視されます。

モード

モード(最頻値)は、データ範囲で最も頻繁に表示される要素です。最頻値が複数ある場合は、最小のものが選択されます。

重みの合計

w=\sum_{i=1}^n w_i

調和平均

調和平均(subcontrary meanとも呼ばれる)


重みなし:\frac n{\frac 1{x_1} + \frac 1{x_2} + ... + \frac 1{x_n}}=\left(\frac {\sum_{i=1}^n (x_i)^{-1}}n\right)^{-1}

重みあり:\frac {\sum_{i=1}^n w_i}{\sum_{i=1}^n \frac {w_i}{x_i}}=\left(\frac {\sum_{i=1}^n w_i x_i^{-1}}{\sum_{i=1}^n w_i}\right)^{-1}

いずれかのx_iまたは重みが負の場合は、欠損値を返し、いずれかのx_iまたは重みが0の場合は0を返します。

最小

x_{(1)}\,

最小値のインデックス

元の入力データセットで最小値がある行の番号です。

第一四分位(Q1)

第1 (25%) 四分位、Q1です。計算方法については、分位数の補間を参照してください。

中央値

メディアンまたは第2 (50%)四分位、Q2です。計算方法については、分位数の補間を参照してください。

第3四分位(Q3)

第3 (75%) 四分位、 Q3です。計算方法については、分位数の補間を参照してください。

最大

x_{(n)}\,

最大値のインデックス

元の入力データセットで最大値がある行の番号です。

四分位範囲 (Q3-Q1)

Q_3-Q_1\,

範囲(最大-最小)

最大 - 最小

カスタムパーセンタイル

カスタムパーセンタイルを計算する場合チェックを付けます。

パーセンタイルリスト

このオプションは、カスタムパーセンタイルにチェックが付いている場合にのみ利用できます。ここに入力された全ての値でのパーセンタイルが計算されます。

中央絶対偏差 一変量データセット X1, X2, ..., Xn,において、MADはデータの中央値からの絶対偏差の中央値として定義されます。

MAD = median(|{X_i} - median(X)|)\,

つまり、まず各データ点とデータの中央値との差(偏差)を求め、それらの絶対値を取った上で、その中央値をMADとします。

ロバスト変動係数

(MAD/norminv(0.75))/Median\,

出力

入力行ごとの出力 各データ行の右側に、対応する統計結果を出力します。
グループのすべての組み合わせを出力 元データの右側に、グループのすべての組み合わせに対する統計結果を出力します。

Note:

  • 入力行ごとの出力オプションがチェックされている場合、このオプションは使用できません。
  • たとえば、 Group1: A1, A2Group2: B1,B2がある場合、出力される組み合わせは A1-B2, A1-B2, A2-B1,A2-B2になります。A1-B2がソースデータがない場合でも、行として出力されます。
グループを列として出力 グループ情報を列方向に出力します。