dist-fit
データの分布モデルを知ることは正しい解析やデータの推定をするのに役立ちます。分布フィットツールではユーザがデータの分布を調査するのに役立ち、分布のパラメータを推定することが可能です。
このチュートリアルでは、以下の項目について説明します。
建築業者は周辺エリアの過去の販売実績を基に、次年度いくつ家を建てるべきか決定しようとしています。次のことを知りたいと思っています。
この疑問を解決するために、建築業者は次のことを調べる必要があります。
分布フィットの結果を基にして、フィットモデルを比較、選択します。
確率(P-P)プロットとフィットの良さの検定より、対数正規分布とガンマ分布はこのデータに対してはどちらもよい分布であるといえます。ここでは対数正規分布を選択して、この後の例を進めていくこととします。
最も良い分布モデルが見つかったら、CDFとINV関数を使って、確率を計算していきます。
logncdf(80, 3.94262, 0.35614) =
logncdf(80, 3.94262, 0.35614) = 0.89136185728793
logninv(1-0.6, 3.94262, 0.35614) =
logninv(1-0.6, 3.94262, 0.35614) = 47.105650533425
上記の分布の選択セクションで対数正規分布を選択したので logncdf と logninv を使用して推定を実行しました。もしガンマ分布を選択していた場合、gamcdfとgaminv を使用します。この場合でも似たような結果を得ることが可能です。