ポートフォリオ問題をHJB方程式で解いてみる

f:id:dw_dw_dt:20201003062236j:plain

さて今回は、細かいところはすっ飛ばして、

最適制御についてやっていきたいと思います。
（無限期間の典型的なやつについてです。）

基本方針

最適制御問題
$\max_{u_{t}}E[\int_t^∞ F(s,X_{s},u_{s}) ds$ ]
$s.t. dX_{s}=μ(s,X_{s},u_{s})ds+σ(s,X_{s},u_{s})dW_{t}$

この $u_{s}$ を制御（control）と呼び、上記の最大化を達成する $u_{s}^{*}$ のことを特に最適制御（optimal control）と呼ぶ。

解き方は、3ステップから成っており

step.1
まず最適制御された時の値である価値関数 $V(t,x)$ （これは初期値 $t,x_{t}$ のみに依存）を定義します。

$V(t,x_{t})=\max_{u_{t}}E[ \int_t^∞ F(s,X_{s},u_{s}) ds$ ]

step.2
続いて、価値関数が満たすべきHJB方程式と呼ばれる数式に変形します。

最適性の原理より

$V(t,x_{t})=\max_{u_{t}}E[ \int_t^{t+dt} F(s,X_{s},u_{s}) ds+V(t+dt,X_{t}+dX_{t})$ ]

ここで右辺の2項目は伊藤の公式を使うことで

$V(t+dt,x_{t}+dX_{t})=V(t,x_{t})+V_{t}(t,x_{t})dt+V_{x}(t,x_{t})dX_{t}+\frac{1}{2}V_{xx}(t,x_{t})(dX)^2$

となるので、代入することで価値関数は以下と一致することになります。

$\max_{u_{t}}E[ \int_t^{t+dt} F(s,X_{s},u_{s}) ds+V(t,x_{t})+V_{t}(t,x_{t})dt+V_{x}(t,x_{t})dX_{t}+\frac{1}{2}V_{xx}(t,x_{t})(dX)^2$ ]

整理することで

HJB方程式
$\max_{u} F(t,x_{t},u_{t}) + V_{t}(t,x_{t}) + μ(t,x_{t},u_{t})V_{x}(t,x_{t})+\frac{1}{2}σ(t,x_{t},u_{t})^2V_{xx}(t,x_{t}) =0$

が得られる。

step.3
guess and verify（答えの関数形をカンで見つけ出す）でHJB方程式を解く（具体例参照）.

これにて解決、最適制御が求まったということになります。

ファイナンスの教科書の文脈では

最適制御問題（ファイナンスでよく出てくるver）
$\max_{u_{t}}E[\int_t^∞ e^{-r(s-t)}f(X_{s},u_{s}) ds$ ]
$s.t. dX_{s}=μ(X_{s},u_{s})ds+σ(X_{s},u_{s})dW_{t}$

によって与えられる最適化問題が考える対象となることが多いです。

割引項を明示的に書いて、

確率微分方程式のドリフトとボラが時間に依存しなくなった感じですね。

step.1 & 2
この場合、価値関数は

$V(x_{t})=\max_{u_{t}}E[ \int_t^{t+dt} e^{-r(s-t)}f(X_{s},u_{s}) ds+e^{-rdt}V(x_{t}+dX_{t})$ ]

となり、指数関数の近似と、伊藤の公式を用いることで

$e^{-rdt}V(x_{t}+dX_{t})=(1-rdt)(V(X_{t})+V'(X_{t})dX_{t}+\frac{1}{2}V''(X_{t})(dX)^2))$

となることから以下のHJB方程式が得られます.

HJB方程式
$\max_{u_{t}} f(x_{t},u_{t}) + μ(x_{t},u_{t})V'(x_{t})+\frac{1}{2}σ(x_{t},u_{t})^2V''(x_{t})-rV(x_{t}) =0$

step.3 はもう少し具体的な形がわからないと何もできないので、

以下で具体的なケースを考えてみましょう！

具体例(ベキ効用関数；マートン問題)

問題設定
安全資産（イメージとしては銀行預金）が $dB_{t}=αB_{t}dt, B_{0}=b_{0}$
危険資産（イメージとしては株）が $dS_{t}=μS_{t}dt+σS_{t}dW_{t}, S_{0}=s_{0}$
安全資産と危険資産の一部を常に消費 $C(t)$ に回し、効用関数が $U(x)=\frac{1}{1-γ} C_{t}^{1-γ}$ である経済主体を考える。
この時、経済主体の期待効用 $E[ \int_{0}^{∞} e^{-rt} \frac{1}{1-γ} C_{t}^{1-γ} dt$ ]を最大化する危険資産と安全資産の保有比率を求めよ。