上級編 4. Short Rate Models
4.4 Hull-White モデル
4.4.1 モデルの特定
イントロダクションで示したHull-Whiteモデルの確率微分方程式を再記します。
\[ dr(t)=a(t)\left[\theta (t)-r(t)\right] dt+\sigma_r (t)dW(t) \tag{4.1} \]モデルを特定するに為には、3種類のパラメータの関数形を特定する必要があります。すなわち、
- \(a(t)\) : 中心回帰強度
- \(θ(t)\) : 中心回帰レベル
- \(σ(t)\) : 瞬間短期金利の Volatility
パラメータの内、θ(t) は、現時点のイールドカーブに完全にフィットするように決定されます。一方、\(a(t)\) と \(σ(t)\) は、現時点の Volatility の期間構造にできるだけフィットさせる様に、最小2乗法などを使って導出します。
しかし \(a(t)~と~σ(t)\) は、現時点の Volatility 期間構造にうまくフィットさせても、その時間変化(すなわち将来の期間構造)をうまく表現できない難点があります(Hull-White自身もそれを認めています)。従って、実務では、Hull-Whiteモデルは、Volatilityの期間構造へのフィットにあまりこだわらず、\(a\) と \(σ\) は定数と仮定して使う場合が多いようです。
ここでは、まず θ(t) の特定方法について説明し、\(a\) と \(σ\) については、Calibrationの方法と一緒に、ずっと後に解説する予定です。
4.4.2 モデルの特定:中心回帰レベル \(θ(t)\) の特定
モデルから導出されるゼロクーポン債価格(の確率過程)が、Arbitrage Free になるような、中心回帰レベル θ(t) の関数形の導出方法を見てみます。Hull-Whiteは、θ(t) について、解析的に求める方法と、3項Tree を構築する際に Tree の Node 毎にフィットさせる方法の 2 通りを提示しています。ここではまず θ(t) を解析的に導出する方法を解説します。かなり難解なプロセスです。かつ苦労して導出しても、θ(t) には(後で述べますが)ある大きな欠点があるので、直接使う場面はあまり無いかもしれません。従って、この解析プロセスは飛ばし、結果の式だけ使わせて頂くという事でもいいかと思います。ただ、SRM が Arbitrage Free の条件を満たすとはどういう事か、その考え方を把握して頂ければと思います。
< Arbitrage Freeの条件 >
まず、Arbitrage Free の市場では、ゼロクーポン債価格の確率過程は、リスク中立測度の下、次のようになるはずです。
- T満期のゼロクーポン債の、t 時における価格の期待値は、現時点における t 時フォワード価格と一致する。
- ゼロクーポン債価格の微小変化は、リスクフリー金利相当だけドリフトする。
これを数式で記述すると、
\[ \begin{align} & \frac{P(0,T)}{P(0,t)} = E^{Q_{RN}} \left[P(t,T)/P(t,t) \right]=E^{Q_{RN}} [P(t,T)] \\ & dP(t,T)=r(t)P(t,T)dt+\sigma_P (t,T)P(t,T) dW^{Q_{RN}}, \tag{4.2} \\ ~\\ & 但し、 \sigma_P (t,T)~は~T~満期のゼロクーポン債の~t~時における~Volatility。 \\ & ~~~~~~~~~~E^{Q_{RN}}(~)は リスク中立測度を使った期待値演算 \end{align} \]であれば、Hull-Whiteモデルを Vasicekモデルのように解析して行き、最終的に導出されたゼロクーポン債価格(の分布)が、上記のArbitrage Freeの確率過程に一致するように、θ(t)を決めればよさそうです。
< θ(t)の導出 >
Hull-White は、“Pricing Interest Derivatives Securities” 1990の論文の中で、非常に難解な手順でそれを導出しています。(Black-Scholesが、オプション価格式を導出したのと同じ方法。すなわちモデルとなる確率偏微分方程式から、ゼロクーポン債価格の偏微分方程式を導出し、それを解く形で導出)
ここでは、全く別の方法で θ(t) を求めたいと思います。その導出方法は、J. Hull “Technical Note No.31, Option future and Other Derivatives” 及び Andersen-Piterbarg ”Interest Rate Modeling Chapter 4.5” を参考にして、Heath-Jarrow-Morton("HJM")モデルの枠組みを利用します。HJM については、これまで何の解説もしていませんが、説明の中で必要最低限の説明をします。
すこし長くなるので、全体を見失わない為に、そのプロセスの概略を示しておきます。
- Vasicek モデルの解析でやったように、SRMの確率微分方程式からゼロクーポン債価格を導出するのではなく、全く逆のルートを辿る。
- まずゼロクーポン債価格のリスク中立測度下での確率過程を仮定する。また、その初期値として、現時点のイールドカーブを与える。
- ゼロクーポン債価格の確率過程から、瞬間フォワード金利の確率過程を導出する。すると瞬間フォワード金利の確率過程は、ガウス過程を取る確率微分方程式で表現できる。これは HJM フレームワークの考え方。
- 瞬間フォワード金利の確率過程から、瞬間短期金利 r(t) を求め、さらにそれを微分して、\(dr(t)\) の拡散過程の式にする。
- 但し、その際、瞬間フォワード金利の確率過程における拡散係数 (Volatility関数) に制約をかける必要がある。(ここが、やや難解)
- すると、導出された dr(t) の式の形が、Hull-Whiteモデルと同じような形に変形できる。
- 最後に、そのドリフト項と、Hull-Whiteモデルのドリフト項をマッチングさせると、θ(t) が特定できる。
では、具体的にこのプロセスを見てきましょう。
(i) リスク中立測度下でのゼロクーポン債価格の確率過程
まず、リスク中立測度下でのゼロクーポン債価格の確率過程を仮定します。
リスク中立測度下では、ゼロクーポン債価格と、Money Market Account(リスクフリー金利で複利運用した場合の預金口座の残高”MMA”)との相対価格が、マルチンゲールになります。これは、ゼロクーポン債価格のリターンの期待値と MMA のリターンの期待値(すなわちリスクフリー金利)が一致する事を意味します。先ほど、それを数式で示しましたが、その確率微分方程式を再記します。
\[ dP(t,T)=r(t)P(t,T)dt+\sigma_P (t,T)P(t,T) dW^{Q_{RN}}, \tag{4.2} \]ここでは、ゼロクーポン債価格が幾何ブラウン運動する(対数正規分布する)と仮定しています。前のセクションで、Vasicekモデルから導出されたゼロクーポン債価格の分布が対数正規分布であったように、ガウス分布を仮定するSRMと、対数正規分布するゼロクーポン債価格の確率過程とは、お互い整合的です。
\(\sigma_p (t,T)\) は、償還時すなわち t=T 時に 0 になります。すなわち \(σ_p (T,T)=0\)。これは、償還時の価格が元本の100%で確定するので、容易に推察できると思います。また、ゼロクーポン債価格のVolatilityは、その満期までの期間に大きく依存します。従って、t が T に近づくにつれて、その値は小さくなっていくことが想定されます。さらに、同じ観測時点 t において、満期 T が異なる2つのゼロクーポン債価格の Volatility を比較すると、満期の長い方が大きくなることが想定されます。ここでは、その具体的な関数形は特定しませんが、そのような特性を持った関数形である事を念頭において下さい。後でここから導出される SRM の Volatility(拡散項の係数) と整合するように特定されます。
(ii) 瞬間フォワード金利の確率過程に変換
次に、上式から、\(P(t、T)\) の対数の確率過程を、伊藤の公式(伊藤のレンマ)を使って導出します。すると、下記のようになります。
\[ d \ln P(t,T)=\left( r(t)-\frac{1}{2} σ_p (t,T)^2 \right)dt+ σ_p (t,T)dW(t) \tag{4.3} \](上級編なので、伊藤の公式や、それを使うとなぜこのような式になるかの説明はしません。ネットで多くの解説が検索できるので、そちらを参考にして下さい)
さらに、t 時における期間 \([T,T+τ]\) に対応するフォワード金利を \(F(t,T,T+τ)\) と表記すると、その金利は、下記のように T 満期と T+τ 満期のゼロクーポン債価格から導出できます。(例えば、τ が3カ月であれば、3カ月LIBOR のフォワード金利を表現できます。)
\[ F(t,T,T+τ)=-\frac{\left( \ln P(t,T+τ)-\ln P(t,T)\right)}{\tau} \tag{4.4} \]ここから、両辺をtで微分し、4.3式を代入すれば下記のようになります。
\[ dF(t,T,T+\tau )= \left[ \frac{\left( σ_p (t,T+\tau )^2- σ_p (t,T)^2\right)}{2\tau} \right] dt -\left[ \frac{\left(σ_p (t,T+\tau )-σ_p (t,T)\right)}{\tau}\right]dW(t) \tag{4.5} \](拡散項の係数がマイナスになっているのは、債券価格が上昇すると金利はマイナス方向に動くことを意味しています)
ここで、τ → 0 とすると、4.5 式の左辺は、瞬間フォワード金利の微分になり、右辺の [ ] 括弧内はそれぞれ
\[ \frac 1 2 \frac{\partial σ_p (t,T)^2}{\partial T},~~~~~~~\frac{\partial σ_p (T)}{\partial T} \]と表記できます。この表記を使って、瞬間フォワード金利の確率過程を記述すると下記のようになります。
\[ \begin{align} df(t,T) &=\frac 1 2 \frac{\left(\partial σ_P (t,T)^2\right)}{\partial T}dt -\frac{\partial σ_p (t,T)}{\partial T }dW(t) \\ & =σ_P (t,T) \frac{\partial σ_P (t,T)}{\partial T} dt - \frac{\partial σ_p (t,T)}{\partial T} dW(t) \tag{4.6} \\ \end{align} \]これで、ゼロクーポン債価格の確率過程から、瞬間フォワード金利の確率過程が求まりました。
この式から、瞬間フォワード金利 \(f(t,T)\) の確率過程は、ガウス分布する事が判ります。また、ゼロクーポン債価格の確率過程のドリフト項にあったリスクフリー金利は消えています。また、この段階では、中心回帰を示す関数形にはなっていません。
ここで、拡散項の係数は、カーブ上の T 点に位置する瞬間フォワード金利の Volatility になりますが、それを \(σ_f(t,T)\) と表記すると、下記の関係式が求まります。
\[ σ_f (t,T)=\frac{\partial σ_p (t,T)}{\partial T}~~~または~~~ \int_t^T σ_f(t,u)du = σ_P (t,T) \tag{4.7} \]即ち、瞬間フォワード金利の確率過程における Volatility 関数は、ゼロクーポン債価格の Volatility 関数を、満期 T で微分した値になります。この表記を使って、上式を書き直すと、次の様になります。
\[ df(t,T)=\left[ σ_f (t,T) \int_t^T σ_f (t,u)du \right] dt+σ_f (t,T)dW(t) \tag{4.8} \]この式を解釈する上で、いくつか注意しておく点があります。
- 拡散項の符号を途中で勝手にマイナスからプラスに変えています。金利の変動方向とゼロクーポン債価格の変動方向は逆になるからです。ブラウン運動は正負対称なので、この符号はどちらでも拡散項の意味は変わりません。
- フォワード金利の Volatility が、ゼロクーポン債価格の Volatility 関数 の T での偏微分から求まっている点に注意。という事は、\(σ_P (t,T)\) は、T に対して滑らかな関数であると仮定している事になります。
- この表記では明白ではないですが、HJM フレームワークでは瞬間フォワード金利の Volatility 関数 \(σ_f (t,T)\) を、事象によって値が変動する適合過程と仮定しています。従って、HJMの論文での表記は \(σ_f (t,T,ω)\) と Volatility 関数が事象に依存している形になっています。これが為、ここから導出される瞬間短期金利(さらにはゼロクーポン債価格)の確率過程が、非マルコフ過程になると説明されています。
この瞬間フォワード金利の確率過程をモデル化(確率偏微分方程式で表現)したものは、Heath-Jarrow-Mortonモデルと呼ばれています。HJMモデルでは、イールドカーブ上の無限個の瞬間フォワード金利の確率過程を記述しています。HJM については、説明し出すと長くなるので、ここでは詳しく解説しません。
(iii) 瞬間短期金利 r(t) を導出
瞬間フォワード金利の確率過程からさらに、t 時の瞬間短期金利 r(t) を求めます。上記式で、初期値として現時点の瞬間フォワード金利のカーブ \(f(0,t)\) が与えられれば、そこからスタートし \(df(・,t)\) を時間軸にそって、0 から t まで積分します。すると \(f(t,t)\) に到達します。これは t 時におけるイールドカーブの一番手前の瞬間フォワード金利であり、それはまさに t 時における瞬間短期金利 r(t) になります。
では4.8式を積分してみましょう。
(Vasicek モデルの解説でも述べましたが、右辺第3項が伊藤積分になっているので、この式は r(t) の値を特定するのではなく、r(t) の分布が特定されるだけです。)
ここから、両辺を t で微分すれば、瞬間短期金利の確率過程が求まりそうです。さらに、そのドリフト項を、Hull-White モデルと比較すれば、θ(t) に該当する式が求まりそうです。
しかし、ここで壁に当たります。
この r(t) は、t 点の瞬間フォワード金利 \(f(u,t)\) が、時点 0 から t まで確率変動して辿った結果、その到達点として導出された最後の瞬間の \(f(t,t)\) を示しています。別の時点、例えば \(t_2\) の \(r(t_2)\) を観測すると、今度は \(t_2\) 点の瞬間フォワード金利 \(f(∙,t_2)\) が時点 0 から \(t_2\) まで確率変動して辿った結果、その到達点として導出された最後の瞬間の \(f(t_2,t_2)\) を示します。すなわち、 \(r(t_1)~と~r(t_2)\) は、異なる確率変数である \(f(u,t_1)~と~f(u,t_2)\) の到達点を表しているだけで、同じ確率変数を、異なる時間で観測したものではありません。
従って、ここから瞬間短期金利の確率過程 \(dr(t)\) を求めようとしても、t 時の一瞬後に、\(f(t,t)\) は存在しておらず、別の確率変数の値を探さなければなりません。それがどういう値になっているかは、\(f(t+δ,t+δ)\) が、どういう確率過程を辿ってきたか見ないと判らないはずで、\(f(u,t+δ)\) を u=0から t+δ まで積分しないといけないという事です。
さらに、この瞬間短期金利からゼロクーポン債価格 \(P(t,T)\) を求めようとすると、r(t) を t から T まで積分する必要があります。
\[ P(t,T)=e^{-\int_t^T r(u)du} \]しかし、右辺の被積分関数 r(t) は 1 個の関数形ではなく、実際には t→T 間のすべての微小時間 du ごとに、\(f(・,u)\) を 0 から u まで積分して求めた関数列なので、
\[ P(t,T)=e^{-\int_t^T \int_0^u f(s,u)ds~ du} \]という式を意味しています。右辺の積分をみると t から T までの積分の被積分関数に t 以前の情報が必要になっています。
様々な文献では、この事を、HJMモデルから導出された”瞬間短期金利の確率過程は Non-Markov(非マルコフ過程)である” と呼んでいます。私自身は、そもそも、HJM モデルから、dr(t) は導出できない(定義できない)ので、dr(t)を非マルコフ過程とか言う前に、そもそも確率過程と言えるのか疑問に思っています。数学者では無いので、この私の直感が正しいのかどうか定かではありません。専門家の方で、どなたかご教示頂けると幸いです。
(iv) マルコフ性を取り戻す
さて、私の疑問は置いておき、そもそも dr(t) がマルコフ過程として導出できないと、Hull-Whiteモデル(これは中心回帰するウィーナー過程で、マルコフ過程です。)と整合させる事はできず、従って θ(t) も導出できません。
そこで、この dr(t) にマルコフ性を持たせる為に、数学的なテクニックを使います。この手法は、Caverhill (“When is the short rate Markovian? ”)や、Ritchken-Sankarasubramanian らによって示されています。
彼らは、瞬間フォワード金利の Volatility 関数 \(σ_f (t,T)\) を、観測時点 t にのみ依存する関数と、フォワード金利のイールドカーブ上のポイント T にのみ依存する Deterministicな関数(確率的な事象に依存しない関数)に分離することで、マルコフ性を持たせる事が出来ると述べています。
すなわち、下記のように瞬間フォワード金利のVolatility関数を、2つの関数の積とします。
\[ σ_f (t,T)=g(t)×h(T) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ \tag{4.10} \]さらに具体的な関数形として次の様な形を想定します。
\[ \begin{align} &g(t)=σ_r (t) e^{\int_0^t a(u)du} \tag{4.11} \\ &h(T)= e^{-\int_0^T a(u)du} \tag{4.12} \\ &\sigma _f (t,T)=g(t)×h(T)=σ_r (t) e^{-\int_t^T a(u)du} \tag{4.13} \\ \end{align} \]右辺の積分に突然登場した被積分関数 a(u) は、中心回帰強度パラメータを想定しています。ここから解析を進めると、実際にそうなります。
なぜ、このように関数を分離するとマルコフ性が取り戻せるのか、さらに、なぜこのような具体的な関数形になるのかは、ここでは説明しません。 ここでは、これによって導出された瞬間フォワード金利の確率過程が、Hull-White モデルと整合的になるので、予定調和的に決められている、とだけ述べておきます。とりあえずそれを受け入れましょう。
(この HJM モデルからマルコフ性を持つ Short Rate Model を導出する数学的テクニックは、私自身、理解するのに非常に苦労しました。未だにきちんと理解できているかどうか、自信はありませんが、後で、自分なりの直感的な解釈を説明したいと思います。)
この Volatility 関数が意味する所は、t 時の瞬間フォワード金利の Volatility は、すべての瞬間フォワード金利で共通の g(t) と、カーブ上の点 T に依存し、T が長くなるにつれて減衰していく関数 h(T) から成るという事です。
このVolatility関数を、4.9式の σ_f (t,T) に代入すると下記のようになります。
\[ \begin{align} r(t) &=f(0,t) +\int_0^t \left(e^{-\int_u^t a(s)ds} σ_r (u) \int_u^t e^{-∫_u^s a(τ)dτ} σ_r (s) ds\right)du +\int_0^t e^{-∫_u^t a(s)ds} σ_r(u) dW(u) \\ & =f(0,t) +e^{-\int_0^t a(s)ds} \int_0^t \left( \left(e^{\int_0^u a(s)ds} σ_r(u)\right)^2 \int_u^t e^{-∫_u^s a(τ)dτ} ds \right)du \\ &~~~~~~+e^{-\int_0^t a(s)ds} \int_0^t e^{\int_0^u a(s)ds} σ_r (u)dW(u) \tag{4.14} \\ \end{align} \]あるいは、g(t)とh(T)の表現を使うと
\[ r(t)=f(0,t)+h(t) \int_0^t g(u)^2 \int_u^t h(s)ds~ du+h(t) \int_0^t g(u)dW(u) \tag{4.15} \]という式になります。
(v) 瞬間短期金利の確率過程の導出
4.15 式の両辺を t で微分すると、r(t) の確率過程 \(dr(t)\) が導出でき、下記式のようになります。(はたして t で微分できるのか、という私の疑問はさておいて)
\[ \begin{align} dr(t)& =\frac{∂f(0,t)}{∂t}dt +\left[ \frac{dh(t)}{dt} \int_0^t g(u)^2 ∫_u^t h(s)ds~ du +h(t) \frac{∂}{∂t} ∫_0^t g(u)^2 ∫_u^t h(s)ds~ du\right]dt \\ & +\left[\frac{dh(t)}{dt} ∫_0^t g(u)dW(u) \right]dt+h(t)g(t)dW(t) \\ & =\left[ \frac{∂f(0,t)}{∂t}+\frac{dh(t)}{dt} \frac{1}{h(t)}\left(h(t)∫_0^t g(u)^2 ∫_u^t h(s)ds~ du +h(t) ∫_0^t g(u)dW(u) \right)+h(t) \frac{∂}{∂t}∫_0^t g(u)^2 ∫_u^t h(s)ds~du \right]dt \\ & +h(t)g(t)dW(t) \\ & =\left[\frac{∂f(0,t)}{∂t}+\frac{dh(t)}{dt} \frac{1}{h(t)} \left[r(t)-f(0,t)\right]+h(t)^2 ∫_0^t g(u)^2 du \right]dt+h(t)g(t)dW(t) \\ \end{align} \]これに、\(h(T)=e^{-∫_0^T a(s)ds},~~g(t)=σ_r (t)e^{∫_0^t a(s)ds}\) を代入して整理すると、下記のような SRMの式になります。
\[ \begin{align} dr(t)& =a(t)\left[\frac{1}{a(t)}\frac{∂f(0,t)}{∂t}+f(0,t)+\frac{1}{a(t)}∫_0^t e^{-2∫_u^t a(s)ds}σ_r (u)^2 du-r(t) \right]dt \\ & +σ_r (t)dW(t) \tag{4.16} \end{align} \]なんと、g(t)h(T) の定義で使われた \(a(t)~と~σ_r (t)\) が、見事にHull-Whiteモデルにおける中心回帰強度と拡散係数のパラメータとして収まりました。
(vi) θ(t) の特定
あとは、この式と 4.1式のHull-Whiteモデルとを比較するだけです。すると θ(t) は、下記のようになります。
\[ θ(t)=\frac{1}{a(t)} \frac{∂f(0,t)}{∂t}+f(0,t)+\frac{1}{a(t)} ∫_0^t e^{-2∫_u^t a(s)ds} σ_r (u)^2 du \tag{4.17} \]なんとか、Arbitrage Freeとなる中心回帰レベル θ(t) が求まりました。
特に、\(a(t)~と~σ_r(t)\) を定数 \(a、~~σ_r\) とおけば、θ(t) は、下記のようになります。
\[ θ(t)=\frac{1}{a} \frac{∂f(0,t)}{∂t}+f(0,t)+\frac{σ_r^2}{2a^2} \left(1-e^{-2at}\right) \tag{4.18} \]式の意味を解説すると、
- 第1項は、t 点におけるカーブの傾きに \( 1/a\) のファクターを掛けた値
- 第2項は当初の瞬間フォワード金利カーブの t 点の値
- 第3項は、t 時点の瞬間フォワード金利の分散に \(1/2a^2\) のファクターを掛けた値。
すなわち、dr(t) のドリフトは、当初瞬間フォワード金利カーブの t 点の値を、若干修正した値に向かって中心回帰していくことを意味しています。
上記の θ(t) でやっかいなのは、第1項にある当初瞬間フォワード金利カーブの微分です。瞬間フォワード金利カーブは、特殊なInterpolation法を使わない限り、至る所で微分不可能になるので、このままでは使える状況が限定されます。(上級編 Interpolation法の種類と特徴参照)
中心回帰レベルから、この微分項を取り除く為、確率変数を r(t) からシフトさせた新たな確率変数を導入する方法があります。3項Tree や有限差分法などの、数値解を導出する方法で必要になりますが、それは別のセクションで説明したいと思います。