ゆるふわクオンツの日常

ポートフォリオ問題をHJB方程式で解いてみる

f:id:dw_dw_dt:20201003062236j:plain

さて今回は、細かいところはすっ飛ばして、

最適制御についてやっていきたいと思います。
(無限期間の典型的なやつについてです。)

基本方針

最適制御問題
 \max_{u_{t}}E[\int_t^∞ F(s,X_{s},u_{s}) ds ]
 s.t. dX_{s}=μ(s,X_{s},u_{s})ds+σ(s,X_{s},u_{s})dW_{t}

このu_{s}を制御(control)と呼び、上記の最大化を達成する u_{s}^{*}のことを特に最適制御(optimal control)と呼ぶ。

解き方は、3ステップから成っており

step.1
まず最適制御された時の値である価値関数 V(t,x)(これは初期値 t,x_{t}のみに依存)を定義します。

 V(t,x_{t})=\max_{u_{t}}E[ \int_t^∞ F(s,X_{s},u_{s}) ds ]

step.2
続いて、価値関数が満たすべきHJB方程式と呼ばれる数式に変形します。

最適性の原理より

 V(t,x_{t})=\max_{u_{t}}E[ \int_t^{t+dt} F(s,X_{s},u_{s}) ds+V(t+dt,X_{t}+dX_{t})]

ここで右辺の2項目は伊藤の公式を使うことで

 V(t+dt,x_{t}+dX_{t})=V(t,x_{t})+V_{t}(t,x_{t})dt+V_{x}(t,x_{t})dX_{t}+\frac{1}{2}V_{xx}(t,x_{t})(dX)^2

となるので、代入することで価値関数は以下と一致することになります。

 \max_{u_{t}}E[ \int_t^{t+dt} F(s,X_{s},u_{s}) ds+V(t,x_{t})+V_{t}(t,x_{t})dt+V_{x}(t,x_{t})dX_{t}+\frac{1}{2}V_{xx}(t,x_{t})(dX)^2]

整理することで

HJB方程式
 \max_{u} F(t,x_{t},u_{t}) + V_{t}(t,x_{t}) + μ(t,x_{t},u_{t})V_{x}(t,x_{t})+\frac{1}{2}σ(t,x_{t},u_{t})^2V_{xx}(t,x_{t}) =0

が得られる。

step.3
guess and verify(答えの関数形をカンで見つけ出す)でHJB方程式を解く(具体例参照).

これにて解決、最適制御が求まったということになります。

ファイナンスの教科書の文脈では

最適制御問題(ファイナンスでよく出てくるver)
 \max_{u_{t}}E[\int_t^∞ e^{-r(s-t)}f(X_{s},u_{s}) ds ]
 s.t. dX_{s}=μ(X_{s},u_{s})ds+σ(X_{s},u_{s})dW_{t}

によって与えられる最適化問題が考える対象となることが多いです。

割引項を明示的に書いて、

確率微分方程式のドリフトとボラが時間に依存しなくなった感じですね。

step.1 & 2
この場合、価値関数は

 V(x_{t})=\max_{u_{t}}E[ \int_t^{t+dt} e^{-r(s-t)}f(X_{s},u_{s}) ds+e^{-rdt}V(x_{t}+dX_{t}) ]

となり、指数関数の近似と、伊藤の公式を用いることで

 e^{-rdt}V(x_{t}+dX_{t})=(1-rdt)(V(X_{t})+V'(X_{t})dX_{t}+\frac{1}{2}V''(X_{t})(dX)^2))

となることから以下のHJB方程式が得られます.

HJB方程式
 \max_{u_{t}} f(x_{t},u_{t}) + μ(x_{t},u_{t})V'(x_{t})+\frac{1}{2}σ(x_{t},u_{t})^2V''(x_{t})-rV(x_{t}) =0

step.3 はもう少し具体的な形がわからないと何もできないので、

以下で具体的なケースを考えてみましょう!

具体例(ベキ効用関数;マートン問題)

問題設定
安全資産(イメージとしては銀行預金)が  dB_{t}=αB_{t}dt, B_{0}=b_{0}
危険資産(イメージとしては株)が  dS_{t}=μS_{t}dt+σS_{t}dW_{t}, S_{0}=s_{0}
安全資産と危険資産の一部を常に消費 C(t)に回し、効用関数が U(x)=\frac{1}{1-γ} C_{t}^{1-γ}である経済主体を考える。
この時、経済主体の期待効用 E[ \int_{0}^{∞} e^{-rt} \frac{1}{1-γ} C_{t}^{1-γ} dt ]を最大化する危険資産と安全資産の保有比率を求めよ。

それでは考えていきましょう。

経済主体の保有資産を X_{t}=B_{t}+S{t}とし、

株の保有比率を π_{t}=\frac{S_{t}}{X_{t}}とすると、制約条件として以下を得る。

 dX_{t}=(1-π_{t})αX_{t}dt+π_{t}μX_{t}dt-C_{t} dt+π_{t}σX_{t}dW_{t}

この場合HJB方程式は以下となる.

 \max_{π_{0},C_{0}} \frac{1}{2} π_{0}^{2}σ^{2}x^{2}V''(x)+(((1-π_{0})α+π_{0}μ)x-c_{0})V'(x)-rV(x)+\frac{1}{1-γ} c_{0}^{1-γ}=0

この方程式はうまい具合にπ_{0},C_{0}が別れているので、

それぞれ以下によって求まります。

 π_{0}=argmax_{π} \frac{1}{2} π^{2}σ^{2}x^{2}V''(x)-(α-μ)πxV'(x)
 c_{0}=argmax_{c} -cV'(x)+\frac{1}{1-γ} c^{1-γ}

これらをさらに見やすくすると

 π_{0}=\frac{α-μ}{σ^{2}x} \frac{V'(x)}{V''(x)}ー①
 c_{0}=V'(x)^{-\frac{1}{γ}}ー②

で、ここからどうやって具体的な V(x)を求めていくかが step.3 のguess and verifyです。

効用関数の形から V(x)の形を以下の形だと(カンで)推測する。

 V(x)=A\frac{1}{1-γ} x^{1-γ}ー③

以上の①〜③をHJB方程式に代入し、

係数比較することでAが以下を満たせばすべてうまくいくことがわかります。

 A = (\frac{1}{γ}(r-(1-γ)α-\frac{(α-μ)^2}{2σ^2} \frac{1-γ}{γ}))^{-γ}

これより、以下の通り解を得ます。

 π_{t}=\frac{α-μ}{σ^{2}} \frac{1}{γ}
 c_{t}=(\frac{1}{γ}(r-(1-γ)α-\frac{(α-μ)^2}{2σ^2} \frac{1-γ}{γ}))X_{t}

で、このように推測された解は必要条件は満たしているけど十分性はどうなの?

というところが気がかりですが、

偉い人によってその辺りは十分性(verification theorem)も満たしていることが知られています。

ま、つまり π_{t}が問題の答えで、

時間に依存することなく株と債券の保有比率が決まるという結果になります。

今回の関連書籍

数少ない確率制御の本です。