アルゴリズム (phm cox)
i = 1, 2, ..., nで、 をi番目の観測値は、p 共変量 のベクターデータを持ち、これに対する故障時間または打ち切り時間にします。故障と打ち切りの過程は独立しているものとします。ハザード関数 は、共変量 z を持つ個々のデータが時間tで故障する確率で、時間tは、個々が生存する時間として与えられます。Con比例ハザードモデルは、次のような形式になっています。
/math-7fd25fca62158bf07a508af6b3048824.png)
ここで は、ハザード関数のベースラインで時間関数ではなく、 は、不明なパラメータのベクターデータで、 は分かっているオフセット値です。
時間 における個別の故障 のように、 で与えられる故障時間は、 明確な故障時間 と結びついており、 に対する周辺尤度は、次式で近似されます。
ここで、 は、時間 における観測した個々の故障の共変量の合計であり、 は、 より前のリスクにおける個々の故障です。これは、時間 以上に生存した個々のデータに加えて、時間 での故障または打ち切りのデータすべてとなります。 のMLE(最大尤度見積り)は、 で与えられ、Newton-Raphson反復法を使って(1)を最大化することで取得されます。この反復法は、段階的に行われ、下記の(2)と(3)で与えられる(1)の一階および二階微分を利用します。
j = 1, 2,..., p, ここで は、ベクターデータ の j番目の要素です。
/math-a28a80d6e7722fccef4fc3249adc4ca2.png)
同様に、
ここで h, j = 1, ..., p.p.
は、スコアベクターの j 番目の成分で、 は、観測情報行列 の(h, j)要素です。この行列の逆行列 は、 の分散-共分散行列を与えます。
共変量または共変量の線形の組合せは、時間と共に単調に増加または減少しており、1つ以上の は無限大となります。
もし は の層でさまざまに変化すると、k番目の層にあるデータの数は 、 k = 1, ... , )で、 を持ち、 を取得するために(1)を最大化するのではなく、次の周辺尤度を最大化します。
ここで は、(1)で簡単なサンプルとして扱われるk番目の層にある 観測値に対する尤度への寄与となります。 共変量係数が層にまたがって一定であると結論付けするとき、異なるベースラインハザード関数 があります。
故障時間 と関連しているベースライン生存関数は次のように見積もられます。
,
ここで /math-ca2e935da3c4ec9f78523b3db2309234.png)
そして、 は、時間 における故障の数です。 I番目の観測値の残差は次式で計算されます。
/math-a5cc248e45947fea428f4b34caff7093.png)
ここで/math-b77e639a3484da642fbbd419c433f190.png)
逸脱は、 (logarithm of marginal likelihood)と定義されます。個々の共変量が十分であるかをテストする2つの方法があります。: ネストしたモデルの共変量間の差は、適切な の分布で比較されます。または、パラメータ推定の正規性がz検定を形作るために使われます。推定値を標準誤差で除算するか、帰無仮説下のモデルに対するスコア関数がz検定を形作るために使われます。
|