quantiles
概要
選択したデータの四分位を計算します。
コマンドラインでの使用法
1. quantiles ix:=Col(1);
2. quantiles ix:=Col(1) median:=mymedian;
変数
表示
名 |
変数
名 |
I/O
と
データ型 |
デフォルト
値 |
説明 |
入力 |
ix |
入力
vector
|
<active>
|
この変数は、計算される四分位に対する入力データの範囲を指定します。
|
最小値 |
min |
出力
double
|
<unassigned>
|
この変数は、データセットの最小値の出力を指定します。
|
Q1 |
q1 |
出力
double
|
<unassigned>
|
この変数は、データセットの値が順に並べられた場合の小さい方から25%までに区切られる1番目の四分位の出力を指定します。
|
メディアン |
median |
出力
double
|
<unassigned>
|
この変数は、データセットの値が順に並べられた場合の小さい方から50%までに区切られる2番目の四分位の出力を指定します。
|
Q3 |
q3 |
出力
double
|
<unassigned>
|
この変数は、データセットの値が順に並べられた場合の小さい方から75%までに区切られる3番目の四分位の出力を指定します。
|
最大値 |
max |
出力
double
|
<unassigned>
|
この変数は、最大値の出力を指定します。
|
四分位範囲 |
iqr |
出力
double
|
<unassigned>
|
この変数は、四分位範囲:IQR(Q3 Q1)の出力を指定します。
|
説明
四分位は与えられたデータセット内のデータポイントの与えられた比率以下に含まれるデータからの値です。例えば、データセットの下位25%のデータポイントが最初の四分位以下に存在し、データポイントの50%が2番目の四分位、または中央値(メディアン)に存在します。データが100個の部分に分けられるとき、パーセンタイルが計算されます。
この分析は、最小値、最大値、第一四分位、メディアン、第三四分位、四分位範囲などのデータの基本情報を出力します。
サンプル
1. アクティブデータセットの1列目を選択して反転表示します。
2. 右クリックして、「fill column with 」から「normal random numbers」を選びます。
3. コマンドウィンドウに quantiles と入力します。
4. Enterを押します。
すると、最小値、最大値、第一四分位、メディアン、第三四分位、四分位範囲などのデータの基本情報を得ることができます。
アルゴリズム
まず、与えられたデータをソートします。ソートしたデータ範囲は次のようになっているものとします。 , 
1. 最初の四分位は、 のように計算され、ここで は数式の整数部であり、 は、分数部です。 
2. メディアンまたは2番目の四分位は、 のように計算され、ここで は数式の整数部であり、 は、分数部です。 
3. 3番目の四分位は のように計算され、ここで は数式の整数部であり、 は、分数部です。 
4. 四分位範囲またはIQRは次の式で計算されます。
参考文献
David, H.A.1981.Order Statistics.2nd ed.Wiley, New York.
Tukey, J.W.Exploratory Data Analysis.Addison-Wesley, 1977.
関連のXファンクション
stats, moments, rowquantiles, rowstats
|