偏相関係数は、1つまたはそれ以上の制御変数の影響を除外した後に、2つの不規則な変数間の線形な関係性を測定する為のツールです。
このチュートリアルでは、以下の項目について説明します。
我々は、2000年から2010年までの、国ごとの11の指標(医療費、GDP、人口等)を含んだ公のデータをワールドバンクから入手しました。インターネットの利用、携帯の利用、米国での医療費の関係性を学習します。
このチュートリアルは、チュートリアルデータプロジェクト(<Origin EXE フォルダ>\Samples\TutorialData.opj)と関連しています。
Mobile phone subscribersとTotal internet users及び、 Health expenditures per capita は強く相関していて、GDP per capitもこれら3つの値に影響することが分かっています。GDP per capitaの影響を除外した後に、3つの指標の関連性を測定します。
なぜこのように結果が異なるのでしょうか?他の3つの指標間の GDP per capita のピアソンのRに着目すると、GDP per capita が3つの値に影響していることが分かります。たとえ、Total internet users と Health expenditures per capita及び、Total internet users と Mobile phone subscribersの間に、相関性がなかったとしても、"誤った相関性”はGDP per capitaの影響により、ピアソンのRによって未だに表れてきます。偏相関係数は、相関する制御変数の影響を無くすことで、2つのファクターの真の関係性について検査する、便利な機能です。統計はさまざまな相互関係の現象が研究される実験のために有用です