Rei Frontier Tech Blog

人工知能を活用した位置情報分析プラットフォーム「SilentLog Analytics」を運営する、レイ・フロンティア株式会社のエンジニアメンバーで運営する技術ブログです。

層の理論:その3

レイ・フロンティア株式会社のデータアナリストの齋藤です.
前回の続きを書いていきます.

前層(続)

前層と層の関係を調べるため,\(X\)の開被覆\(\mathfrak{W}\)に対し以下のような条件を仮定します:

仮定1.\(\mathfrak{W}\)は次の条件(W1),
(W2)をみたす:
(W1) 任意の\(x \in X\)に対して,$$\mathfrak{W}_x = \{ W \in \mathfrak{W} ; x \in W \}$$は\(x\)の基本近傍系をなす.
(W2) \(W_1 , W_2 \in \mathfrak{W}\)ならば\(W_1 \cap W_2 \in \mathfrak{W}\).

定義10.(芽)\( (F, \rho ) \)を\(X\)の開被覆\(\mathfrak{W}\)上の前層とする.\(\mathfrak{W}_x\)に包含関係による順序をいれると有向集合になる.\(\rho _{W_2} ^{W_1}\)に関して帰納極限をとり,
$$\mathscr{F}_x = \mathrm{ind-}\lim\{F(W) ; W \in \mathfrak{W}_x\}$$とおく.\(\mathscr{F}_x\)は自然にAbel群の構造をもつ.\(\mathscr{F}_x\)を前層\( (F, \rho) \)の\(x\)における芽(germ)という.\(F(W)\)により\(\mathscr{F}_x\)への標準的写像による\(f\in F(W)\)の像を\(f_x\)と書き,\(f\)の\(x\)における芽という.

$$\mathscr{F} = \bigsqcup \{\mathscr{F}_x ; x \in X\}$$とおきます.ここで,\(\sqcup\)は\(x \not= y\)のとき\(\mathscr{F}_x\)と\(\mathscr{F}_y\)は互いに素であるとして合併をとることを意味します.\(\mathscr{F}\)に$$\{ \{ f_x ; x \in X \} ; f \in F(W) , W \in \mathfrak{W} \}$$を開基とする位相を導入します.\( \pi : \mathscr{F} \to X \)を\( \pi(f_x) = x\)によって定めます.\(\pi\)は全射であり,\(\mathscr{F}\)の位相の入れ方により,\(\pi\)は局所位相同型です.\( (\mathscr{F}, \pi ) \)は\(X\)上の層となっています.この層を前層\( (F, \rho ) \)に同伴する層,あるいは\( F\)の芽のなす層と呼びます.
帰納極限の性質により,次の命題が成り立ちます:

命題3.\( (F, \rho ) , (F^\prime, \rho^\prime ) , (F^{\prime \prime }, \rho^{\prime \prime} ) \)を前層とし,\((\mathscr{F},\pi),(\mathscr{F}^\prime,\pi^\prime),(\mathscr{F}^{\prime \prime},\pi^{\prime \prime })\)をそれぞれに同伴する層とする.\(\mu : F \to F^\prime \)なる前層の準同型があれば,\(h_\mu :\mathscr{F} \to \mathscr{F}^\prime\)なる層の準同型が自然に定義でき,次の性質をもつ:
(1) \(\mu = \mathrm{id} \)ならば\(h_\mu =\mathrm{id}\).
(2) \(\mu_1 : F \to F^\prime\),\(\mu_2 : F^{\prime \prime }\to F\)が前層の準同型ならば,$$h_{\mu_1 \circ \mu_2} = h_{\mu_1} \circ h_{\mu_2}.$$
いま,逆に\(X\)上に層\(\mathscr{F}\)が与えられたとすれば,\(X\)の開集合\(W\)に\(\Gamma(W;\mathscr{F})\)を対応させると,\(X\)上の前層\(\Gamma(\quad ;\mathscr{F})\)が定まります(実際,\(W_1 \supset W_2 \)のとき\(\Gamma(W_1 ;\mathscr{F}) \to \Gamma(W_2 ;\mathscr{F})\)を切断の制限写像とすればよい).\(\Gamma(\quad ;\mathscr{F})\)を\(\mathscr{F}\)の切断の前層といいます.前層\(\Gamma(\quad ;\mathscr{F})\)に同伴する層はもとの層\(\mathscr{F}\)と同型です.

\(\mathfrak{W}\)を条件(W1),(W2)をみたす\(X\)の開被覆とします.\(F\)を\(\mathfrak{W}\)上の前層とし,\(\mathscr{F}\)で\(F\)に同伴する層を表します.\(f \in F(W)\)に対し,$$\sigma_W(f)(x) = f_x, \qquad x \in W$$で\(\sigma_W(f) \in \Gamma(W;\mathscr{F})\)を対応させることにより,$$\sigma_W : F(W) \to \Gamma(W;\mathscr{F})$$なる前層の準同型が定義されます.

命題4.任意の\(W \in \mathfrak{W}\)に対し,上のように定めた\(\sigma_W\)が単射であるための必要十分条件は,次のようである:
(S1) \(W,W_\alpha \in \mathfrak{W}, \alpha \in A\)で\( W = \cup \{W_\alpha ; \alpha \in A\}\)なるものと\(f \in F(W)\)に対し,$$任意の \alpha \in Aに対し
\rho _{W_\alpha} ^W f = 0 ならば f = 0.$$
(証明) \(f \in F(W)\)が\(\sigma_W(f) = 0\)をみたすとする.条件(W1)により,任意の\(x \in W\)に対して\(x\)の近傍\(W_x \subset W , W_x \in \mathfrak{W}\)が存在して,\(\rho _{W_x} ^W f = 0\)となる.\(W = \cup \{ W_x ; x \in W \}\)であるから,条件(S1)により\(f = 0\).逆も同様に示される.■

命題5.条件(S1)を仮定する.任意の\(W \in \mathfrak{W}\)に対し,\(\sigma_W\)が全射となるための必要十分条件は,次のようである:
(S2) \(W , W_\alpha \in \mathfrak{W} , \alpha \in A\)で\(W = \cup \{ W_\alpha ; \alpha \in A \}\)なるものと\(f_\alpha \in F(W_\alpha) \)に対し,張り合わせの条件$$任意の\alpha, \beta \in A に対し,\rho _{W_\alpha \cap W_\beta} ^{W_\alpha} f_\alpha = \rho _{W_\alpha \cap W_\beta} ^{W_\beta} f_\beta$$が成立すれば,\(f \in F(W)\)が存在して,任意の\(\alpha \in A\)に対して$$\rho _{W_\alpha} ^{W} f = f_\alpha$$をみたす.
(証明) (S2)を仮定する.\(s \in \Gamma(W;\mathscr{F}) \)とする.任意の\(x \in W\)に対して,\(x\)の近傍\(W_x \in \mathfrak{W} , W_x \subset W\)と\(f^x \in F(W_x)\)が存在して,$$\sigma_{W_x}(f^x) = s|_{W_x}$$が成立する.\(\sigma_{W_x}\)は単射であると仮定したので,\(s\)が切断であることにより,\(f^x \in F(W_x)\)は張り合わせの条件をみたす.ゆえに,(S2)より\(f \in F(W)\)が存在して,\(\rho _{W_x} ^W f = f^x\).したがって,$$\sigma_W(f)(x) = f_x = (f^x)_x = s(x)$$である.逆も同様.■

(W1),(W2)をみたす被覆\(\mathfrak{W}\)上で定義された前層\(F\)が条件(S1),(S2)をみたすとき,\(F\)は層である,ということもあります.このとき,\(\mathscr{F}\)を前層\(F\)に同伴する層とすれば,\(W \in \mathfrak{W}\)に対し,同型\(\sigma_W : F(W) \to \Gamma(W;\mathscr{F})\)により,\(F(W)\)と\(\Gamma(W;\mathscr{F})\)を同一視します.このようにして,\(F\)と\(\mathscr{F}\)は完全に対応しているので,このような呼び方による混乱は生じません.条件(S1),(S2)を局所化(localization)の条件といいます.(S1)は,「局所的にゼロならば,大域的にもゼロ」あるいは「局所的に一致すれば大域的にも一致」を意味します.(S2)は,局所的に与えられた切断が張り合わせの条件をみたせば,それらを張り合わせて大域的な切断が作れる,ということを意味します.

層係数コホモロジー

定義11.(軟弱層)\(X\)上の層\(\mathscr{F}\)が軟弱(flabby)であるとは,\(X\)の任意の開集合\(W\)に対し,制限写像$$\Gamma(X;\mathscr{F}) \to \Gamma(W;\mathscr{F})$$が全射となることとする.

系1.\(W_1\)と\(W_2\)を\(W_1 \supset W_2\)なる\(X\)の開集合とすれば,軟弱層\(\mathscr{F}\)に対し,$$\Gamma(W_1;\mathscr{F}) \to \Gamma(W_2;\mathscr{F})$$は全射である.

定理1.\(\Phi\)を\(X\)上の台の族,\(\mathscr{F},\mathscr{F}^\prime , \mathscr{F}^{\prime \prime}\)を\(X\)上の層とし,\(\mathscr{F}^\prime\)は軟弱であると仮定する.もし,$$0 \rightarrow \mathscr{F}^\prime \xrightarrow{i} \mathscr{F} \xrightarrow{h} \mathscr{F}^{\prime \prime} \rightarrow 0 \qquad \cdots (\ast)$$が完全であれば,$$0 \rightarrow \Gamma_\Phi(X;\mathscr{F}^\prime) \xrightarrow{i} \Gamma_\Phi(X;\mathscr{F}) \xrightarrow{h} \Gamma_\Phi(X;\mathscr{F}^{\prime \prime}) \rightarrow 0$$も完全である.
(証明) 命題2があるので,\(\Gamma_\Phi(X;\mathscr{F}) \to \Gamma_\Phi(X;\mathscr{F}^{\prime \prime})\)が全射であることを示せばよい.\(s^{\prime \prime} \in \Gamma_\Phi(X;\mathscr{F}^{\prime \prime })\)に対して,次の対\( (s, V) \)を考える:
\(V\)は\(X\)の開集合で,\(s \in \Gamma_{\Phi \cap V}(V; \mathscr{F})\)は条件$$h(s) = s^{\prime \prime}|_V, \mathrm{supp} s \subset \mathrm{supp} s^{\prime \prime}$$をみたす.
列\( (ast) \)は完全であるから,これらの対の全体\( \{ (s, V) \} \)は空ではない.いま,\(V_1 \supset V_2\)かつ\(V_2\)上で\(s_1 = s_2\)となるとき\( (s_1, V_1) \geq (s_2, V_2) \)と順序を定義すれば,\( \{ (s, V) \} \)は帰納的順序集合をなす.
Zornの補題により存在が保証される,\(\mathrm{supp} s^{\prime \prime }\)の補集合上のゼロ切断より大きな極大元を\( (s,V) \)とする(\(\mathrm{supp} s^{\prime \prime } = X\)ならば任意の極大元をとればよい).\(V = X\)となることを背理法によって示そう.
\(V \not= X\)とする.すなわち,\(x \not\in V\)が存在すると仮定する.\( (\ast )\)の完全性により,\(x\)の近傍\( V(x) \)と\(s_1 \in \Gamma(V(X); \mathscr{F})\)をみつけて\(h(s_1) = s^{\prime \prime } |_{V(x)}\)としてよい.したがって,\(V \cap V(x)\)上では\(h(s_1 - s) = 0\)が成り立つ.命題2により,\(s^\prime \in \Gamma(V\cap V(X); \mathscr{F}^\prime )\)が存在して,\(i(s^\prime ) = s - s_1\)となる.\(\mathscr{F}^\prime \)は軟弱層と仮定したから,\(s^\prime \)の拡張\(s_1^\prime \in \Gamma(X ; \mathscr{F}^\prime)\)が存在する.いま,$$\tilde S(x) = \begin{cases} s(x) & x \in V \\ s_1(x) + i(s_1^\prime )(x) & x \in V(x) \end{cases}$$とおけば,\(\tilde s \in \Gamma(V \cup V(x) ; \mathscr{F})\)かつ\(h(\tilde s) = s^{\prime \prime}\)となる.\(\mathrm{supp} \tilde s \subset \mathrm{supp} s^{\prime \prime} \cap ( V \cup V(x))\).これは\( (s,V) \)の極大性に反する.■

系2.
(i) 層の完全列$$0 \rightarrow \mathscr{F}^\prime \rightarrow \mathscr{F} \rightarrow \mathscr{F}^{\prime \prime} \rightarrow 0$$において,\(\mathscr{F}^\prime\)と\(\mathscr{F}\)がともに軟弱層であれば,\(\mathscr{F}^{\prime \prime}\)も軟弱層である.
(ii) 層の系列$$0 \rightarrow \mathscr{F}^0 \rightarrow \mathscr{F}^1 \rightarrow \mathscr{F}^2 \rightarrow \cdots \rightarrow \mathscr{F}^m \rightarrow 0$$が層の完全列であれば,\(\mathscr{F}^j (0 \leq j \leq m-1)\)の軟弱性より\(\mathscr{F}^m\)の軟弱性がしたがう.
(証明)
(i)次の可換図式により明らか:
f:id:reifrontier:20180202181833p:plain:w300
(ii) \(\mathscr{Z}^j = \mathrm{Ker} (\mathscr{F}^j \to \mathscr{F}^{j+1}) = \mathrm{Im} (\mathscr{F}^{j-1} \to \mathscr{F}^j)\)とおけば,\(\mathscr{Z}^1 = \mathscr{F}^0 , \mathscr{Z}^m = \mathscr{F}^m\)で,$$0 \rightarrow \mathscr{Z}^j \rightarrow \mathscr{F}^j \rightarrow \mathscr{Z}^{j+1} \rightarrow 0$$は完全である.まとめれば,次の可換図式となる:
f:id:reifrontier:20180202183336p:plain:w600
短い完全列の各々に(i)を適用すれば,すべての\(\mathscr{Z}^j\)は軟弱.とくに,\(\mathscr{Z}^m = \mathscr{F}^m\)も軟弱である.■

系3.層の完全列$$0 \rightarrow \mathscr{F}^0 \rightarrow \mathscr{F}^1 \rightarrow \mathscr{F}^2 \rightarrow \cdots \qquad \cdots ( \ast \ast )$$において,各\(\mathscr{F}^j , j = 0,1,2,\ldots \)がすべて軟弱層ならば,Abel群の列$$0 \rightarrow \Gamma_\Phi(X;\mathscr{F}^0) \rightarrow \Gamma_\Phi(X;\mathscr{F}^1) \rightarrow \Gamma_\Phi(X;\mathscr{F}^2) \rightarrow \cdots$$も完全である.
(証明) 完全列\( (\ast \ast ) \)を,系2(ii)の証明と同様に,短い完全列\( 0 \rightarrow \mathscr{Z}^j \rightarrow \mathscr{F}^j \rightarrow \mathscr{Z}^{j+1} \rightarrow 0 \)に分解する.系2(ii)により,\(\mathscr{Z}^j\)はすべて軟弱である.よって,短い完全列の各々に定理1を適用すればよい.■

定義12.(軟弱分解)層\(\mathscr{F}\)の軟弱分解(flabby resolution)とは,$$0 \rightarrow \mathscr{F} \rightarrow \mathscr{L}^0 \rightarrow \mathscr{L}^1 \rightarrow \mathscr{L}^2 \rightarrow \cdots \qquad \cdots (\star )$$なる層の完全列で,各\(\mathscr{L}^j , j = 0,1,2,\ldots \)が軟弱層であるものをいう.
\( (\star )\)を$$0 \rightarrow \mathscr{F} \rightarrow \mathscr{L}^\ast$$と略記することがある.

さて,\(X\)上の任意の層\(\mathscr{F}\)に対して\(\mathscr{F}\)の軟弱分解が存在することを示してみましょう.
\(\mathscr{C}^0(W;\mathscr{F})\)を,開集合\(W\)から\(\mathscr{F}\)への任意の写像\(s\)で,\(\pi \circ s = \mathrm{id}\)をみたすものの全体とします.ただし,\(\pi : \mathscr{F} \to X\)は層の射影です.\(W \mapsto \mathscr{C}^0(W;\mathscr{F})\)は前層で,局所化の条件(S1),(S2)を満たしています.これに同伴する層を\(\mathscr{C}^0(\mathscr{F})\)と書くと,$$\mathscr{C}^0(W;\mathscr{F}) = \Gamma(W;\mathscr{C}^0(\mathscr{F}))$$で,\(\mathscr{C}^0(\mathscr{F})\)は軟弱層です.
\(\mathscr{C}^0(\mathscr{F})\)の定義により,\(\mathscr{F} \to \mathscr{C}^0(\mathscr{F})\)なる自然な単射が存在します.この余核を\(\mathscr{Z}^0(\mathscr{F})\)で表します.すなわち,$$0 \rightarrow \mathscr{F} \rightarrow \mathscr{C}^0(\mathscr{F}) \rightarrow \mathscr{Z}^0(\mathscr{F}) \rightarrow 0$$は完全列です.帰納的に,$$0 \rightarrow \mathscr{Z}^{j-1}(\mathscr{F}) \rightarrow \mathscr{C}^0(\mathscr{Z}^{j-1}(\mathscr{F})) \rightarrow \mathscr{Z}^j(\mathscr{F}) \rightarrow 0$$が完全列になるように層\(\mathscr{Z}^j(\mathscr{F}) , j = 1,2,\ldots \)を定めて$$\mathscr{C}^j(\mathscr{F}) = \mathscr{C}^0(\mathscr{Z}^{j-1}(\mathscr{F})) ,\quad j = 1,2,\ldots$$とおけば\(\mathscr{C}^j(\mathscr{F})\)はすべて軟弱層であって,$$0 \rightarrow \mathscr{F} \rightarrow \mathscr{C}^0(\mathscr{F}) \rightarrow \mathscr{C}^1(\mathscr{F}) \rightarrow \mathscr{C}^2(\mathscr{F}) \rightarrow \cdots \qquad \cdots ( \star \star )$$は完全列です.\( ( \star \star ) \)を\(\mathscr{F}\)の標準的軟弱分解(canonical flabby resolution)といい,\(0 \rightarrow \mathscr{F} \rightarrow \mathscr{C}^\ast (\mathscr{F})\)で表します.

定理2.\( (\ast) \)を層の完全列とすれば,次の層の複体の完全列(きちんとした定義は後に述べる)が自然に定義される:$$0 \rightarrow \mathscr{C}^*(\mathscr{F}^\prime) \rightarrow \mathscr{C}^*(\mathscr{F}) \rightarrow \mathscr{C}^*(\mathscr{F}^{\prime \prime}) \rightarrow 0$$
(証明) 次の図式を考える:
f:id:reifrontier:20180205143109p:plain:w500
全ての列と第一行と第二行は完全であるから,9-lemmaにより第三行の完全性が出る.以下,これを繰り返せばよい.■


次回に続きます.

層の理論:その2

レイ・フロンティア株式会社のデータアナリストの齋藤です.
前回の続きを書いていきます.

層(続)

定義4.(台)\(s \in \Gamma(W; \mathscr{F})\)とする.このとき,$$\mathrm{supp} s = \{ x \in W ; s(x) \not= 0(x) \}$$とおき,切断\(s\)の台という.
補題4より,\(\mathrm{supp} s \)は\(W\)の閉集合です.
いま,\(S\)を\(W\)の閉部分集合とします.このとき,$$\Gamma_s(W;\mathscr{F}) = \{s \in \Gamma(W;\mathscr{F}) ; \mathrm{supp} s \subset S\}$$とおきます.自然な写像のなす列と,$$0 \rightarrow \Gamma_s(W;\mathscr{F}) \rightarrow \Gamma(W; \mathscr{F}) \rightarrow \Gamma(W \setminus S ; \mathscr{F})$$は完全列です.\(W\)と\(W^\prime\)をともに\(S\)の開近傍としたとき,\(\Gamma_S(W;\mathscr{F})\)と\(\Gamma_S(W^\prime ; \mathscr{F})\)は同型です.

ここで,新たに記号を導入します:

定義5.\(S\)を\(X\)の局所閉集合とする.\(\mathfrak{R}(S)\)で\(S\)の開近傍の全体を表し,包含関係で順序づけ,有向集合とする.$$\Gamma[S; \mathscr{F}] = \mathrm{ind-}\lim{W \in \mathfrak{R}(S)} \Gamma_S(W; \mathscr{F})$$とおく.
任意の\(W \in \mathfrak{R}(S)\)に対し,標準的写像$$\Gamma_S(W;\mathscr{F}) \to \Gamma[S;\mathscr{F}]$$は同型です.もし\(S\)が開集合ならば,\(S\in \mathfrak{R}(S)\)で\(\Gamma_S(S;\mathscr{F}) = \Gamma(S;\mathscr{F})\)であるので,$$\Gamma(S;\mathscr{F}) \to \Gamma[S;\mathscr{F}]$$は同型です.\(\Gamma[S;\mathscr{F}]\)を\(\mathscr{F}[S]\)と書くこともあります.

もう一つ,記号を導入します:

定義6.\(Y\)を\(X\)の部分集合とする.$$\mathscr{F}(Y) = \mathrm{ind-}\lim_{W \supset Y} \Gamma(W;\mathscr{F})$$とおく.ここで\(W\)は\(Y\)を含む開集合の全体にわたる.
\(Y\)が開集合ならば$$\mathscr{F}(Y) = \Gamma(Y; \mathscr{F})$$ですが,一般の部分集合\(Y\)に対しては\(\mathscr{F}(Y)\)から\(\Gamma(Y;\mathscr{F})\)への自然な(制限)写像は必ずしも同型とは限りません.

定義7.(台の族)次の3つの条件をみたす\(X\)の部分集合の族\(\Phi\)を台の族(family of supports)という:
(1) \(A \in \Phi\)は閉集合.
(2) \(A \in \Phi, A_1 \subset A\)で\(A_1\)が閉ならば\(A_1 \in \Phi\).
(3) \(A_1,A_2 \in \Phi\)ならば\(A_1\cup A_2 \in \Phi\).
例えば,$$\Phi_X = \{ A; A はXの閉集合\}$$とおけば,\(\Phi_X\)は\(X\)の台の族となっています.いま,\(\Phi\)を台の族とします.\(X\)の部分集合\(S\)に対して,$$\Phi |_S = \{ A \in \Phi ; A \subset S\}$$は\(X\)の台の族です.$$\Phi \cap S = \{ A \cap S ; A \in \Phi \}$$とおくと,\(\Phi \cap S\)は\(S\)の中で台の族をなしています.\(S \subset X\)に対し,$$\Phi_S = \Phi_X |_S = \{ A ; A \subset S かつ A は X で閉\}$$とおきます.\(S\)が\(X\)の閉集合ならば,\(\Phi_S = \Phi_X \cap S\)が成り立ちます.

\(\mathscr{F}\) を\(X\)上の層とし,\(\Phi\)を台の族とするとき,$$\Gamma_\Phi(X;\mathscr{F}) = \{ s \in \Gamma(X;\mathscr{F}) ; \mathrm{supp} s \in \Phi\}$$とおきます.\(\Phi\)は台の族であるということから,\(\Gamma_\Phi(X;\mathscr{F})\)はAbel群となります.
\(S \subset X\)を閉集合としたとき,次の式が成り立ちます:$$\Gamma_S(X;\mathscr{F}) = \Gamma_{\Phi_S}(X;\mathscr{F})$$とくに,$$\Gamma(X;\mathscr{F}) = \Gamma_{\Phi_X}(X;\mathscr{F})$$です.\(\mathscr{F}^\prime \xrightarrow{i} \mathscr{F}\)が層の準同型であるとすれば,\(s^\prime \in \Gamma_\Phi(X;\mathscr{F}^\prime)\)に\(i \circ s^\prime \in \Gamma_\Phi(X;\mathscr{F})\)を対応させることにより,Abel群の準同型$$\Gamma_\Phi(X;\mathscr{F}^\prime) \xrightarrow{i} \Gamma_\Phi(X;\mathscr{F})$$が定まります.このとき,次の命題が成立します:

命題2.\(\Phi\)を\(X\)の台の族とする.$$0 \rightarrow \mathscr{F}^\prime \rightarrow \mathscr{F} \rightarrow \mathscr{F}^{\prime \prime}$$が\(X\)上の層の完全列であれば,誘導されるAbel群の準同型の列$$0\rightarrow \Gamma_\Phi(X;\mathscr{F}^\prime) \rightarrow \Gamma_\Phi(X;\mathscr{F}) \rightarrow \Gamma_\Phi(X;\mathscr{F}^{\prime \prime})$$も完全である.

前層

定義8.(前層)\(X\)を位相空間,\(\mathfrak{W}\)をその開被覆(open covering)とする.すなわち,$$X = \cup\{W; W \in \mathfrak{W} \}$$であるとする.次の性質を満足する\( (F, \rho )\)の組を,\(\mathfrak{W}\)上の(Abel群の)前層(presheaf)という:
(1) 任意の\(W_1 \in \mathfrak{W}\)に対し,Abel群\(F(W)\)が対応する.
(2) \(W_1 \supset W_2\)なる\(W_1, W_2 \in \mathfrak{W}\)に対し,Abel群の準同型$$\rho _{W_2} ^{W_1} : F(W_1) \to F(W_2)$$が対応する.
(3) \(\rho _W ^W = \mathrm{id}\).
(4) \(W_1 \supset W_2 \supset W_3\)なる\(W_1, W_2, W_3 \in \mathfrak{W}\)に対し,次の図式が可換である:
f:id:reifrontier:20180202140519p:plain:w200
\(\mathfrak{W}\)が\(X\)のすべての開集合よりなる被覆の場合は,\(\mathfrak{W}\)上の前層を\(X\)上の前層といいます.
\(F(W)\)が環で,\(\rho _{W_2} ^{W_1}\)が環の準同型であるとき,\( (F,\rho) \)を\(\mathfrak{W}\)上の環の前層といいます.\( (G, \rho )\)が\(\mathfrak{W}\)上の環の前層とします.このとき,\(\mathfrak{W}\)上のAbel群の前層\( (F,\rho ) \)が\(G\)-加群の前層であるとは,各\(F(W)\)が\(G(W) \)-加群で,なおかつ\(\rho _{W_2} ^{W_1} : F(W_1) \to F(W_2)\)が次の意味で加群の準同型となることをいいます:
任意の\(f \in F(W_1)\)と\(g \in F(W_1)\)に対し,$$\rho _{W_2} ^{W_1}(gf) = \rho _{W_2} ^{W_1}(g)\rho _{W_2} ^{W_1}(f)$$

前層の例をいくつか挙げておきます:

例1.\(X\)を位相空間,\(M\)をAbel群とする.\(X\)の開集合\(W\)に対して\(F(W)=M\)とおき,\(W_1 \supset W_2\)に対しては\(\rho_{W_2}^{W_1} = \mathrm{id}\)とすれば,\(X\)上のAbel群の前層が定義される.これを定数前層(constant presheaf)といい,\(M = M_X\)で表す.もし\(M\)が環構造をもてば,定数前層\(M_X\)は環の前層の構造をもつ.

例2.\(X\)を位相空間とする.\(F(W) = \mathbb{C}^W = (W上の\mathbb{C}値関数の全体) \)とおき,\(\rho_{W_2}^{W_1}\)を通常の制限写像とする.こうして定義される\(X\)上の環の前層を,任意関数の前層という.

例3.\(m = 0,1,2,\ldots , \infty \)とする.\(\mathbb{R}^n\)の開集合\(u\)に対し,\(C^m(u)\)で\(m\)回連続微分可能な関数の全体のなす環を表す.\(\rho_{u_2}^{u_1}\)は通常の制限写像であるとすれば,\(\mathbb{R}^n\)上の環の前層が定まる.これを\(C^m\)で表そう.
また,\(\mathscr{D}^\prime (u)\)で\(u\)上のSchwartz超関数の全体,\(\rho_{u_2}^{u_1}\)をSchwartz超関数の制限写像とすると,\(\mathscr{D}^\prime\)は\(\mathbb{R}^n\)の\(C^\infty\)-加群の前層をなす.

例4.\(u\)を\(\mathbb{R}^n\)の開集合としたとき,\(W\)に\(L^p(u) = (p乗\text{Lebesgue}可積分関数の全体) \)を対応させ,\(\rho_{u_2}^{u_1}\)を制限写像とすると,\(\mathbb{R}^n\)上に前層が定まる.

以下,Abel群の前層を単に前層と呼びます.

定義9.(準層の準同型)開被覆\(\mathfrak{W}\)上の前層\( (F, \rho )\)と\( (F^\prime , \rho^\prime )\)が与えられたとき,\( (F, \rho )\)から\( (F^\prime , \rho^\prime )\)への準同型\(\mu\)とは,各\(W \in \mathfrak{W}\)に対して定まったAbel群の準同型$$\mu_W : F(W) \to F^\prime(W)$$の組であって,\(W_1 \supset W_2\),\(W_1, W_2 \in \mathfrak{W}\)に対して次の図式が可換であるものをいう:
f:id:reifrontier:20180202143359p:plain:w200
\( (F, \rho )\)と\( (F^\prime , \rho^\prime )\)が環の前層のとき,\(\mu\)が環の前層の準同型であるとは,上の条件の他に,\(\mu_W\)が環の準同型でもあるときにいいます.同様に,環の前層を係数にもつ加群の前層の準同型も定義されます.
\(F(W)\)が\(F^\prime(W)\)の部分群で,\(\rho_{W_2}^{W_1}\)が\(\rho_{W_2}^{\prime W_1}\)の制限であれば,\(\mu_W\)を標準的単射として\( (F, \rho) \to (F^\prime , \rho^\prime )\)なる前層の準同型が定まります.このとき,\( (F, \rho) \)は\( (F^\prime, \rho^\prime )\)の部分前層であるといいます.

例5.\(m \leq m^\prime\)ならば,\(C^{m^\prime}\)は\(C^m\)の部分前層である.


次回に続きます.

層の理論:その1

レイ・フロンティア株式会社のデータアナリストの齋藤です.

層の定義と、その基本的な性質について述べます.

定義1(層)位相空間\(X\)上の(Abel群の)層(sheaf)とは,次のような組\((\mathscr{F}, \pi)\)のことをいう:
(1) \(\mathscr{F}\)は位相空間.
(2) \(\pi: \mathscr{F} \to X\)は全射かつ局所位相同型.すなわち,任意の\(p \in \mathscr{F}\)に対してある開近傍\(U\)が存在して,\(\pi(U)\)が\(X\)の開集合で,$$\pi |_U : U \to \pi(U)$$が位相同型である.
(3) 任意の\(x \in X\)に対して,$$\mathscr{F}_x = \pi^{-1}(x)$$はAbel群.
(4) 次の意味で,群の演算は連続である:$$\mathscr{F} + \mathscr{F} = \{ (p_1, p_2) \in \mathscr{F} \times \mathscr{F} ; \pi(p_1) = \pi(p_2) \}$$とおくと,加法\( (p_1, p_2) \mapsto p_1 + p_2\)は\(\mathscr{F} + \mathscr{F}\)から\(\mathscr{F}\)への写像であるが,これが連続である.
\(\pi\)を射影(projection)といい,\(\mathscr{F}_x = \pi^{-1}(x)\)を\(x\)上の茎(stalk)といいます.定義1の(2)により,射影は開写像であることが分かります.
\mathscr{F}を\(X\)上の層,\(Y \subset X\)を部分空間としたとき,\( (\pi^{-1}(Y), \pi |_{\pi^{-1}(Y)} ) \)は\(Y\)上の層を与えます.ここで,\(\pi^{-1}(Y)\)には\(\mathscr{F}\)の開集合としたの位相を与えます.これを\(\mathscr{F}|_Y\)と書き,層\(\mathscr{F}\)の\(Y\)への制限といいます.
定義1において,「Abel群」を「環」でおきかえ,(4)で加法および乗法\( (p_1, p_2) \mapsto p_1 p_2\)の連続性を仮定すれば,環の層が定義できます.いま\( (\mathscr{G}, \sigma) \)を環の層として,Abel群の層\( (\mathscr{F}, \pi) \)が\(\mathscr{G} \)-加群の層であるとは,
(1) 任意の\(x \in X\)に対して,\( \mathscr{F}_x\)が\(\mathscr{G}_x\)-加群.
(2) \(\mathscr{G} + \mathscr{F} = \{ (q,p) \in \mathscr{G} \times \mathscr{F} ; \sigma(q) = \pi(p) \} \)から\(\mathscr{F}\)への写像\( (q,p) \mapsto q \cdot p \)は連続.
をみたすことをいいます.

以下,混乱のない限り層といえばAbel群の層のことをさします.

定義2(層の準同型)\( (\mathscr{F}^\prime, \pi^\prime) \)と\( (\mathscr{F}, \pi)\)が\(X\)上の層であるとする.連続写像\( i : \mathscr{F}^\prime \to \mathscr{F}\)が(層の)準同型(homomorphism)であるとは,
(1) 次の図式が可換である:
f:id:reifrontier:20180201161219p:plain:w200
ただし,\(\mathrm{id}\)は恒等写像を表す.
(2) \(i\)を\(\mathscr{F}^\prime _x \)に制限して,\( i_x : \mathscr{F}^\prime _x \to \mathscr{F}_x\)を定めると,これはAbel群の準同型である.
の2条件を満たすことをいう.
\(\mathscr{F}^\prime \subset \mathscr{F}\)かつ恒等写像\(\mathscr{F}^\prime \hookrightarrow \mathscr{F}\)が層の準同型であるとき,\(\mathscr{F}^\prime\)は\(\mathscr{F}\)の部分層(subsheaf)であるといいます.\(\mathscr{F}^\prime \subset \mathscr{F}\)が\( \mathscr{F}\)の部分層であるには,
(1) \(\mathscr{F}^\prime\)は\(\mathscr{F}\)の開集合.
(2) \(\pi(\mathscr{F}^\prime) = x\).
(3) \(\mathscr{F}^\prime_x \equiv \pi^{-1}(x) \cap \mathscr{F}^\prime \)は\(\mathscr{F}_x\)の部分群.
の3条件を満たすことが必要十分です.\(\mathscr{F}^\prime\)が\(\mathscr{F}\)の部分層であるとき,$$\mathscr{F}^{\prime \prime } _x = \mathscr{F}_x / \mathscr{F}^\prime_x$$とおき,\(h_x : \mathscr{F}_x \to \mathscr{F}^{\prime \prime}_x\)を標準的全射とし,さらに$$\mathscr{F}^{\prime \prime} = \bigsqcup_{x \in X}\mathscr{F}^{\prime \prime}_x \ ,\ (直和) $$とおき,\(h : \mathscr{F} \to \mathscr{F}^{\prime \prime}\)を\(h_x\)の拡張として定義します.\(\mathscr{F}^{\prime \prime}\)に\(h\)による商位相をいれると,\(\mathscr{F}^{\prime \prime }\)はまた\(X\)上の層となっています.\(\mathscr{F}^{\prime \prime}\)を\(\mathscr{F}^\prime / \mathscr{F}\)と書き,商層(quotient sheaf)といいます.
環の層,環の層を係数とする加群の層に対しても,準同型が同様に定義できます.環の層の部分層,商層なども同様に定義されます.

定義2(層の切断)\( (\mathscr{F}, \pi) \)を位相空間\(X\)上の層とする.\(Y \subset X\)に対して,\(Y\)から\(\mathscr{F}\)への連続写像\(s\)で,\(\pi \circ s = \mathrm{id}\)となるものを\(Y\)上の\(\mathscr{F}\)の切断(section)といい,その全体を\(\Gamma(Y;\mathscr{F}) \)と表す.切断に,\(Y\)の各点上で茎\(\mathscr{F}_x\)の演算を施すことにより,\(\Gamma(Y;\mathscr{F})\)はAbel群となる.
\(x \in X\)を固定し,\(p \in \pi^{-1} (x)\)を任意にとります.\(\pi\)は局所位相同型だから,\(p\)の近傍\(U\)があり,\(\pi|_U:U \to \pi(U) = W\)は位相同型となります.したがって,\(W\)は\(x\)の開近傍であり,\(s = (\pi|_U)^{-1} \in \Gamma(W; \mathscr{F})\)は\(s(x) = p\)を満たします.このことから次の3つの補題が証明されます:

補題1\(W \subset X\)を開集合とする.\(s \in \Gamma(W;\mathscr{F})\)ならば,\(s : W \to \mathscr{F}\)は開写像である.
補題2任意の\(p \in \mathscr{F}\)に対し,\(\pi(p)\)のある近傍で定義された切断で\(p\)を通るものが存在する.
補題3\( \{ s(W) ; s \in \Gamma(W;\mathscr{F}) , W は X の開集合 \}\)は\(\mathscr{F}\)の開集合の基底をなす.
\(s \in \Gamma(W;\mathscr{F}\)であれば,\(s - s \)も\(W\)上の\(\mathscr{F}\)の切断であり,\(s\)によらず定まります.これを\(\mathscr{F}\)のゼロ切断(zero section)といい,\(0 : W \to \mathscr{F}\)で表します.\(0(x)\)とは,Abel群\(\mathscr{F}_x = \pi^{-1}(x)\)のゼロ元に他なりません.

\(i : \mathscr{F}^\prime \to \mathscr{F}\)が層の準同型であるとします.このとき,\(\mathrm{Im} i = i(\mathscr{F}^\prime) \)は\(\mathscr{F}\)の部分層です.また,\(\mathrm{Ker} i \subset \mathscr{F}^\prime\)は,\(i\)で\(\mathscr{F}\)のゼロ切断の像\(\{ 0(x); x \in X \} \)にうつる\(\mathscr{F}^\prime \)の元から成ります.切断の像は開集合なので,\(\mathrm{Ker} i\)は開集合の連続写像による逆像だから開集合であり,したがって\(\mathscr{F}^\prime\)の部分層となっています.

層の準同型からなる完全列を考えることもできます.$$\mathscr{F}^\prime \xrightarrow{i} \mathscr{F} \xrightarrow{h} \mathscr{F}^{\prime \prime}$$が(第二項において)完全であるとは,$$\mathrm{Im} i = \mathrm{Ker} h$$であることと定義します.$$ 0 \rightarrow \mathscr{F}^\prime \xrightarrow{i} \mathscr{F} \xrightarrow{h} \mathscr{F}^{\prime \prime} \rightarrow 0$$が完全列であるための必要十分条件は,\(\mathscr{F}^\prime\)が\(\mathscr{F}\)の部分層(と同型)であり,\(\mathscr{F}^{\prime \prime}\)が商層\(\mathscr{F} / \mathscr{F}^\prime \)(と同型)であることです.

切断に話題を戻します.\(Y^\prime \subset Y\)であれば,\(Y\)上の\(\mathscr{F}\)の切断\(s \in \Gamma(Y;\mathscr{F})\)を\(Y^\prime\)に制限することにより,\(Y^\prime\)上の\(\mathscr{F}\)の切断$$S|_{Y^\prime} \in \Gamma(Y^\prime ; \mathscr{F})$$が定まります.これを,\(s\)の\(Y^\prime\)への制限(restriction)といいます.
次の補題が成り立ちます:

補題4\(W_1, W_2 \subset X\)を開集合とする.\(s_j \in \Gamma(W_j ; \mathscr{F}) , j = 1,2\)として,$$W_0 = \{ x \in W_1 \cap W_2 ; s_1(x) = s_2(x) \}$$とおけば,\(W_0\)は\(X\)の開集合である.
(証明) \(W = W_1 = W_2\)と仮定してよい.\(s = s_1 - s_2 \in \Gamma(W; \mathscr{F})\)とおけば,$$W_0 = s^{-1} \{ 0(x) ; x \in W \}$$は開集合の連続写像による逆像なので開集合である.■

層は一般にはHausdorffの分離公理を満たすとは限りませんが,次の命題が成立します:

命題1層\(\mathscr{F}\)がHausdorffの分離公理を満たすための必要十分条件は,任意の\(W_1, W_2 \subset X \)と\(s_j \in \Gamma(W_j ,\mathscr{F}) , j = 1,2 \)に対し,上に定めた\(W_0\)が\(W_1 \cap W_2\)の閉集合となることである.


次回に続きます.

Brown運動と確率積分:その3

レイ・フロンティア株式会社のデータアナリストの齋藤です。
前回の記事の続きを書いていきます。

確率積分

Brown運動\( (B_t(\omega) )_{t \geq 0}\)と関数\( f : \mathbb{R} \to \mathbb{R}\)について、積分\(\int_0^t f(B_s(\omega) )\, dB_s(\omega) \)を定義することを考えます。Brown運動の全変動は確率1で無限大なので、積分\(\int_0^t f(B_s(\omega) )\, dB_s(\omega) \)を通常のStieltjes積分として捉えることはできません。たとえば、$$\int_0^1 B_s\, dB_s$$をRiemann-Stieltjes積分の類似物として定義することを試みてみましょう。区間\([0,1]\)を\(n\)等分し、分点を\(t_k = k/n ,\ k = 0,1,\dots ,n\)とおき、Riemann和$$S^{(n)} := \sum_{k = 1}^n B_{s_k} (B_{t_k} - B_{t_{k-1}}) ,\ s_k \in [t_{k-1}, t_k]$$を考えます。Stieltjes積分では\(s_k \in [t_{k-1}, t_k]\)をどのようにとっても\(S^{(n)}\)は\(n \to \infty\)で同じ値に収束します。しかし、左側の点をとり\(s_k = t_{k-1}\)とした和を\(\underline{S}^{(n)}\)、右側の点をとり\(s_k = t_k\)とした和を\(\overline{S}^{(n)}\)とおけば、$$\begin{align} \overline{S}^{(n)} - \underline{S}^{(n)} &= \sum_{k =1}^n (B_{t_k} - B_{t_{k-1}})^2 \\ & \to 1 \qquad \text{ in } L^2 \qquad(\because 命題4の証明より)\end{align}$$となってうまくいきません。確率積分ではStielthes積分とは異なり、被積分関数\(f(B_{s_k})\)について\(s_k\)をどこにとるのかを決めなければいけません。ここでは、左側の点をとったものを確率積分として採用します:

定義2.(伊藤の確率積分)\( (B_t)_{t \geq 0}\)をBrown運動とする。関数\(f(B_t)\)と区間\([0,t]\)の分割の列\(\Delta_n = \{ 0 \leq t_1^{(n)} < t_2^{(n)} < \cdots \},\ n = 1,2,\dots \)について、和$$S_t^{(n)} := \sum_{t_k^{(n)} \in \Delta_n} f(B_{t_{k-1}^{(n)}})(B_{t_k^{(n)}} - B_{t_{k-1}^{(n)}})$$が条件\(\sum_{n = 1 }^\infty < \infty\)のもとで\(n \to \infty\)としたときある確率変数に収束するならば、それを\(f\)のBrown運動\( (B_t) \)に関する(伊藤の)確率積分(stochastic integral)といい、$$\int_0^t f(B_s)\, dB_s$$と書く。
実際はもっと広いclassのもとで定義できますが、ここでは割愛します。
簡単な例を計算してみましょう。$$\int_0^t B_s\, dB_s$$を求めてみます。\(\sum_{n = 1 }^\infty < \infty\)なる分割の列\(\Delta_n = \{ 0 \leq t_1^{(n)} < t_2^{(n)} < \cdots \},\ n = 1,2,\dots \)を任意にとります。恒等式$$B_{t_k^{(n)}}^2 - B_{t_{k-1}^{(n)}}^2 = 2 B_{t_{k-1}^{(n)}} (B_{t_k^{(n)}} - B_{t_{k-1}^{(n)}}) + (B_{t_k^{(n)}} - B_{t_{k-1}^{(n)}})^2$$において\(k\)について和をとってから\(n \to \infty\)とすれば、定理3により、$$B_t^2 - B_0^2 = \lim_{n \to \infty}\sum_{t_k^{(n)} \in \Delta_n}B_{t_{k-1}^{(n)}} (B_{t_k^{(n)}} - B_{t_{k-1}^{(n)}}) + t$$ゆえに$$\int_0^t B_s\, dB_s = \frac{1}{2} B_t^2 - \frac{1}{2} t$$と求まります。\(t\)についての項が加わっているという点で、通常のStieltjes積分とは異なっています。

伊藤の公式

上の例で、確率積分では通常のStieltjes積分とは異なる計算結果が得られることを見ました。このことは、直感的には次のように理解されます: 
\(f\)をなめらかな関数とし、\(f(B_t)\)の微小変化をTaylor展開によって$$df(B_t) = f^\prime (B_t) dB_t + \frac{1}{2} f^{\prime \prime} (B_t) (dB_t)^2 + \frac{1}{6} f^{\prime \prime \prime} (B_t) (dB_t)^3 + \cdots$$と近似することを考えます。ここで、\( (dB_t)^2 = dt\)として、\(dt\)より小さい微小項を無視すれば、\(df(B_t) = f^\prime (B_t) dB_t + \frac{1}{2} f^{\prime \prime} (B_t) dt \)となります。これを積分で書き、\(f(x) = x^2\)とすれば上の例の計算結果が直ちに出ます。2次変分を用いて直接計算できたのは、Taylor展開(計算に用いた恒等式に他なりません)がそもそも2次までしかないからです。
これを定理の形で述べたものが、伊藤の公式と呼ばれるものです:

定理4.(伊藤の公式)\(f \in C^2(\mathbb{R})\)とし、確率過程\(X_t\)が$$X_t(\omega) = X_0(\omega) + \lambda B_t(\omega) + A_t$$の形であるとする。ただし、\( (B_t) \)はBrown運動、\(\lambda\)は定数、\(A_t\)は\(A_0 = 0\)かつ任意の有界区間上で有界変動とする。このとき、確率1で$$f(X_t) - f(X_0) = \int_0^t \lambda f^\prime (X_s)\, dB_s + \int_0^t f^\prime (X_s)\, dA_s + \frac{1}{2} \int_0^t \lambda^2 f^{\prime \prime} (X_s)\, ds,\ t \geq 0$$が成立する。
\(A_t\)は有界変動なので\(dA_t \sim dt\)だと思えば、これは上の直感的な議論と同様の考え方で導出できます。一般には\(X_t - X_0\)がいくつかの確率積分と有界変動関数の和の場合にも同様のことが示されます。ここでは伊藤の公式を証明抜きで認めることにして、経済学への一つの応用例を紹介します。
\(\alpha > 0, \beta > 0\)とし、\(X_t = \alpha B_t + (\beta - \alpha^2/2)t\)とおきます。\(f(x) = e^x\)について伊藤の公式を適用すれば、$$\begin{align} \exp (X_t) - \exp(X_0) &= \int_0^t \alpha \exp (X_s)\, dB_s + \int_0^t \exp (X_s) (\beta - \alpha^2/2)\, ds + \frac{1}{2} \alpha^2 \exp (X_s)\, ds \\ &= \int_0^t \alpha \exp (X_s)\, dB_s + \int_0^t \beta \exp (X_s)\, ds . \end{align}$$\(S_t := \exp (X_t)\)とおき、微分形に書き直せば、$$\frac{dS_t}{S_t} = \alpha dB_t + \beta dt$$という表示を得ます。\(S_t\)は幾何Brown運動(geometric Brownian motion)といわれるものです。\(S_t\)を株価とみれば、左辺は微小時間での株価の伸び率を意味し、上の方程式は株価の伸び率にランダムな変動が加わっていると解釈できます。これはBlack-Scholesモデルと呼ばれ、確率微分方程式(stochastic differential equation)の一種です。多数の要因によって影響を受けることが不規則な運動をもたらすというBrown運動の発送は株価変動と相性がよく、金融工学において伊藤の公式は基本的な道具となっています。

参考文献

[1] 舟木直久(1997), "確率微分方程式", 岩波書店
[2] 西尾真喜子(1978), "確率論", 実教出版
[3] Henry P. McKean Jr.(1969), "Stochastic Integrals", Academic Press
[4] 河野敬雄(1995), "Brown運動とその周辺", http://www.math.kobe-u.ac.jp/publications/rlm01.pdf

Brown運動と確率積分:その2

レイ・フロンティア株式会社のデータアナリストの齋藤です。
前回の記事の続きを書いていきます。

Brown運動のHölder連続性

\( (B_t)_{t \geq 0}\)をBrown運動とします。
前記事で触れたように、Brown運動のsample pathは確率1で連続ですが無限の全変動をもちます。その他にも、確率1でいたるところ微分不可能であり、もっと詳しくいうと、1/2次Hölder連続よりもやや悪いくらいの連続性をもつことが知られています。本記事ではこれを示します。

次の定理を示します:

定理2.(Brown運動のHölder連続性)Brown運動\( (B_t)_{t \geq 0}\)に対して、$$\lim_{h \to 0} \sup_{\substack{0 \leq |s-t| \leq h \\ 0 \leq s,t \leq 1}}\frac{|B_s(\omega) - B_t(\omega)|}{\sqrt{2h\log 1/h}} = 1 \ \text{a.s.}$$が成り立つ。
(証明) まず下からの評価を示す。\(g(h) := \sqrt{2h\log 1/h}\)とおく。\(\forall \varepsilon > 0\)に対して、$$\begin{align} &P \left( \max_{1 \leq k \leq 2^n} \{ B_{k/2^n}(\omega) - B_{(k-1)/2^n}(\omega) \} \leq (1 - \varepsilon ) g(1/2^n) \right) \\ &= \left( 1 - \int_{(1 - \varepsilon) \sqrt{2 \log 2}\sqrt{n}} p(1,x)\, dx \right)^{2^n}\ (\because 定義1(iii)より)\\ & = (1 - I_n)^{2^n}\ (積分を I_n とおいた)\\ &< \exp(-2^n I_n) . \end{align}$$ここで、部分積分により、実数\(a > 0\)に対して、$$\int_a^\infty e^{-x^2/2}\, dx = \int_a^\infty \left( -\frac{1}{x} \right) \cdot \left( e^{-x^2/2} \right)^\prime\, dx = \frac{e^{-a^2/2}}{a} - \int_a^\infty \frac{1}{x^2} e^{-x^2/2}\, dx$$より、$$\frac{e^{-a^2/2}}{a} \geq \int_a^\infty e^{-x^2/2}\, dx \geq \frac{e^{-a^2/2}}{a} - \frac{1}{a^2} \int_a^\infty e^{-x^2/2}\, dx$$したがって$$\frac{e^{-a^2/2}}{a} \geq \int_a^\infty e^{-x^2/2}\, dx \geq \frac{e^{-a^2/2}}{a + 1/a} \qquad \cdots (\ast)$$を得る。これを用いると、十分大きな\(n\)について$$2^nI_n \geq Const. \times \frac{2^n}{\sqrt{n}}\exp(-(1 - \varepsilon)^2 \log 2 \times n) \geq 2^{\delta n} ,\ \delta > 0$$がいえる。\(exp(-2^{\delta n})\) は収束級数の一般項なので、Borel-Cantelliの補題により、$$P\left( \max_{1 \leq k \leq 2^n} \{ B_{k/2^n}(\omega) - B_{(k-1)/2^n}(\omega) \} \leq (1 - \varepsilon ) g(1/2^n)\ \text{i.o.} \right) = 0.$$これは$$\liminf_{n \to \infty} \max_{1 \leq k \leq 2^n} \frac{ B_{k/2^n}(\omega) - B_{(k-1)/2^n}(\omega) }{g(1/2^n)} > 1 - \varepsilon \quad \text{a.s.}$$を意味するが、$$\lim_{h \to 0} \sup_{\substack{0 \leq |s-t| \leq h \\ 0 \leq s,t \leq 1}}\frac{|B_s(\omega) - B_t(\omega)|}{\sqrt{2h\log 1/h}} \geq \liminf_{n \to \infty} \max_{1 \leq k \leq 2^n} \frac{ B_{k/2^n}(\omega) - B_{(k-1)/2^n}(\omega) }{g(1/2^n)}$$であり、\(\varepsilon > 0\)は任意だったので、下からの評価はいえた。
次に上からの評価を示す。\(\forall \varepsilon > 0\)について、\(\delta\)を\( (1 + \varepsilon)^2 > (1 + \delta)/(1 - \delta)\)をみたすように十分小さくとる。このとき、$$\begin{align}&P \left( \max_{\substack{1 \leq k = j - i \leq 2^{\delta n} \\ 0 \leq k < j \leq 2^n}} |B_{j / 2^n}(\omega) - B_{i / 2^n}(\omega)| \geq (1 + \varepsilon) g(k/2^n) \right) \\ &\leq \sum_{\substack{1 \leq k = j - i \leq 2^{\delta n} \\ 0 \leq k < j \leq 2^n}} 2 \int_{(1 + \varepsilon) \sqrt{2 \log (2^n / k)}}^\infty p(1,x)\, dx \quad (\because 定義 1 (iii)) \\&\leq Const. \times \frac{2^{(1 + \delta) n}2^{-(1 - \delta)(1 + \epsilon)^2 n}}{\sqrt{n}}\quad (\because 不等式(\ast))\\ &\leq \frac{2^{-\gamma n}}{\sqrt{n}},\quad \gamma > 0 \qquad (\because \delta のとり方から) \end{align}$$がいえる。\(2^{-\gamma n}/\sqrt{n}\)は収束級数の一般項なので、Borel-Cantelliの補題により、確率1で\(n_0 = n_0(\omega)\)が存在して、\(\forall n \geq n_0, \forall (j - i) = k \leq 2^{\delta n}\)に対して、$$|B_{j / 2^n}(\omega) - B_{i / 2^n}(\omega)| \leq (1 + \varepsilon)g(k/2^n)$$が成り立つ。いま、実数\(s,t\)を\(0 \leq s \leq t, 2^{-(n+1)(1-\delta)}\leq t - s \leq 2^{-n(1 - \delta)}\)となるようにとる。\(s,t\)を「2進数展開」し、$$\begin{align} & s = i/2^n - 1/2^{p_1} - 1/2^{p_2} - \cdots \quad (i,p_1,p_2, \dots は正整数, n < p_1 < p_2 < \cdots) \\& t = j/2^n + 1/2^{q_1} + 1/2^{q_2} - \cdots \quad (j,q_1,q_2, \dots は正整数, n < q_1 < q_2 < \cdots) \end{align}$$と表現すれば、\(i,j\)は\(s\leq i/2^n \leq j/2^n \leq t , 0 < k = j - i \leq (t - s) 2^n < 2^{\delta n}\)をみたす。\(s,t\)の最初の\(m\)項で打ち切った部分和を\(s_m , t_m\)とおけば、三角不等式により$$\begin{align}|B_t(\omega) - B_s(\omega)| &\leq \sum_{m = 1}^\infty |B_{t_{m+1}}(\omega) - B_{t_m}(\omega)| + |B_{i / 2^n}(\omega) - B_{j/2^n}(\omega)| + \sum_{m = 1}^\infty |B_{s_{m+1}}(\omega) - B_{s_m}(\omega)|\\ &\leq \sum_{p = n+1}^\infty (1 + \varepsilon) g(1/2^p) + (1 + \varepsilon) g(k/2^n) + \sum_{q = n+1}^\infty (1 + \varepsilon) g(1/2^q) \end{align}$$となる。十分大きい\(n\)に対して、$$\begin{align} \sum_{p = n+1}^\infty g(1/2^p) &= \sum_{p = n+1}^\infty \sqrt{2 \log 2 \cdot p/2^p} \\ &\leq \sum_{p=n+1}^\infty Const. \times \left( \sqrt{2 \log 2 \cdot p/2^p} - \sqrt{2 \log 2 \cdot (p-1)/2^{p-1}} \right)\\ &= Const. \times \sqrt{2 \log 2 \cdot n/2^n} \\ &= Const. \times g(1/2^n) \\ &< \varepsilon g(2^{-(n+1)(1-\delta)}) \end{align}$$したがって、$$|B_t(\omega) - B_s(\omega)| < (1 + 3 \varepsilon + 2 \varepsilon^2) g(t-s)$$を得る。これは$$\lim_{h \to 0} \sup_{\substack{0 \leq |s-t| \leq h \\ 0 \leq s,t \leq 1}}\frac{|B_s(\omega) - B_t(\omega)|}{\sqrt{2h\log 1/h}} \leq 1 + 3 \varepsilon + 2 \varepsilon^2$$を意味し、\(\varepsilon > 0\)は任意だったため上からの評価もいえた。■

定理2から、各\(t \in (0,\infty)\)に対して\(\frac{B_{t+h} - B_t}{h}\)は\(h \to 0\)で発散することがわかります。これまでの考察から、Brown運動は確率1で、「連続であるが、いたるところ微分不可能であり、任意の区間で無限に変動する」という、「普通の連続関数」とは異質なふるまいをすることがわかります。

Brown運動の微小変化

確率解析の理論においては、次の定理も重要です:

定理3.(Brown運動の2次変分)\(T > t > 0\)を固定し、\(\Delta_n = \{ 0 \leq t_1^{(n)} < t_2^{(n)} < \cdots \}, n = 1,2,\dots \)を区間\([0,T]\)の分割の列とし、\(\Delta_n(t) = \{ t_k^{(n)} \in \Delta_n ; t_k^{(n)} \leq t \} , |\Delta_n| = \sup_k |t_k^{(n)} - t_{k-1}^{(n)}| < \infty\)とする。このとき、$$\sum_{n = 1}^\infty |\Delta_n| < \infty$$ならば$$\lim_{n \to \infty}\sum_{t_k^{(n)} \in \Delta_n(t)}|B_{t_k^{(n)}}(\omega) - B_{t_{k-1}^{(n)}}(\omega)|^2 = t \qquad \text{a.s.}$$である。
(証明)$$V_n := \sum_{t_k^{(n)} \in \Delta_n(t)}\left( |B_{t_k^{(n)}} - B_{t_{k-1}^{(n)}}|^2 - (t_k^{(n)} - t_{k-1}^{(n)}) \right)$$とおく。定義1(iii)より、$$(E[V_n^2] = 2 \sum_{t_k^{(n)} \in \Delta_n(t)}(t_k^{(n)} - t_{k-1}^{(n)}) \leq 2 |\Delta_n| \sum_{t_k^{(n)} \in \Delta_n(t)}(t_k^{(n)} - t_{k-1}^{(n)}) \leq 2 t |\Delta_n|$$と計算できるから、仮定より、$$E\left[ \sum_{n=1}^\infty V_n^2 \right] = \sum_{n=1}^\infty E[V_n^2] \leq 2 t \sum_{n=1}^\infty |\Delta_n| < \infty . $$したがって、$$\sum_{n = 1}^\infty V_n^2 < \infty \qquad \text{a.s.}$$ゆえに、$$\lim_{n \to \infty} V_n = 0 \qquad \text{a.s.}.$$これと\(\sum_{t_k^{(n)} \in \Delta_n(t)}(t_k^{(n)} - t_{k-1}^{(n)}) \to t\)から結論が得られる。■

この結果は、標語的に言えば\(\int_0^t (dB_t)^2 = t\)ということで、微分の形で書けば$$(dB_t)^2 = dt$$となり、「Brown運動は時間変化の1/2乗くらいのひろがりをもつ」ということを意味します。このことは、今までに示してきた、

  • 共分散\(E[B_tB_s]\)が\(O(t)\)となること(命題1)
  • Brown運動の性質が時間を\(c^2\)倍に縮めて変異を\(c\)倍に伸ばすと保持されること(命題2)
  • 拡散方程式\(u_t = 1/2 u_{xx}\)の解が自然に得られること(命題3)
  • 各\( (B_t(\omega) )\)は1/2次くらいのHölder連続性をもつこと(定理2)

など様々な事実から類推されることですが、厳密には確率積分の理論によって定式化され、伊藤の公式とし知られています。

次回に続きます。

Brown運動と確率積分:その1

レイ・フロンティア株式会社のデータアナリストの齋藤です。
本記事から数回にわたって、Brown運動という数学モデルを紹介します。

Brown運動とは

Brown運動とは、もともとは液体中の微粒子が不規則に運動する現象のことをさします。植物学者ブラウン(Robert Brown)が浸透圧によって破裂した花粉から飛び出した粒子を観察した際に発見されたのがBrown運動のはじまりですが、1905年のアインシュタイン(Albert Einstein)の論文によって粒子の不規則な運動は水分子の衝突によるものであると説明され、原子と分子が存在する根拠にもなりました。
数学モデルとしてのBrown運動は、1923年にウィーナー(Norbert Wiener)によって確立されました。Brown運動は日本人数学者伊藤清が1942年に生み出した確率微分方程式の理論においても中心的な役割を果たし、現在では物理学、生物学、経済学など様々な分野に応用されています。
本記事では、数学モデルとしてのBrown運動の構成を提示し、独立増分性から導かれる性質をいくつか導いていきます。

Brown運動の定義と構成

Brown運動は、数学的には連続で独立増分をもちGauss分布にしたがう確率過程として定式化されます。より厳密に定義を述べると、以下のようになります:

定義1.(Brown運動)確率空間\( (\Omega, \mathcal{F}, P)\)上で定義された実数値確率過程\( B = (B_t)_{t \geq 0} \)がBrown運動(Brownian motion)であるとは、次の条件をみたすときにいう:
 (i) \(B_0 = 0\ \mathrm{a.s.} \)である。
 (ii) \(\mathrm{a.a.}\ \omega \in \Omega \)に対し、\( B_t (\omega) \)は\(t\)について連続である。
 (iii) \( 0 = t_0 < \forall t_1 < \cdots < \forall t_n ,\ \forall n \in \mathbb{N}\)に対し、増分\( \{ B_t - B_{t-1 }\}_{1 \geq i \geq n}\)は互いに独立で、それぞれ平均\(0\)、分散\(t_i - t_{i-1}\)のGauss分布にしたがう。
確率空間が与えられたとき、その空間にBrown運動が存在するかどうかは自明ではありませんが、現在では様々な構成法が知られています。たとえば、Kolmogorovの拡張定理を用いて無限次元のGauss仮定として構成する方法や、random walkをscale変換して無限に細かくしていく方法などがあります。本記事では、有界区間におけるBrown運動をGauss分布にしたがうランダムな係数をもつFourier級数として構成する方法をご紹介します。

定理1.(Brown運動の構成)\(\xi_0, \xi_1, \dots \)を独立な標準正規分布\( \mathscr{N}(0,1) \)にしたがう確率変数の列とする。このとき、\( t \in [0,\pi]\)に対して$$B_t(\omega) := \frac{t}{\sqrt{\pi}}\xi_0 (\omega) + \sqrt{\frac{2}{\pi}} \sum_{k=0}^\infty \sum_{j = 2^k + 1}^{2^{k+1}} \xi_j(\omega) \frac{\sin jt}{j}$$とおけば、\(B_t\)は\(t \in [0,\pi]\)のときBrown運動となる。
(証明)まず、\(B_t(\omega)\)が\(t\)に関してa.s. 一様収束することを示す。\(X_{m,n}(t) := \sum_{j = m+1}^n \xi_j \frac{\sin jt}{j}\)とおけば、\(X_{m,n}(t) = \mathrm{Im}(\sum_{j = m+1}^n \xi_j \frac{\exp ijt}{j})\)ゆえ、$$|X_{m,n}(t)|^2 = \left| \sum_{j = m+1}^n \xi_j \frac{\exp (ijt)}{j} \right|^2 = \sum_{j=m+1}^n \frac{\xi_j^2}{j^2} + 2\sum_{p=1}^{n-m+1} \left| \sum_{h = m+1}^{n - p} \frac{\xi_h \xi_{h+p}}{h(h+p)} \right| .$$\(T_{m,n}^2 := \sup_{t \in [0,\pi]}|X_{m,n}(t)|^2\)とおけば、$$E[T_{m,n}^2] \leq \sum{j=m+1}^n \frac{1}{j^2} + 2 \sum_{p =1 }^{n-m+1} \sqrt{\sum_{h = m+1}^{n-p} \frac{1}{h^2(h+p)^2}} \leq \frac{n-m}{m^2} + 2\frac{(n-m)\sqrt{n-m}}{m^2} .$$したがって、$$\sum_{k=0}^\infty E[T_{2^k,2^{k+1}}] \leq \sum_{k=0}^\infty \sqrt{E[T_{2^k,2^{k+1}}^2]} \leq \sum_{k=0}^\infty \sqrt{\frac{2^k}{2^{2k}} + 2\frac{2^k\sqrt{2^k}}{2^{2k}}} < \infty .$$\(\sum_{k=0}^\infty T_{2^k, 2^{k+1}}\)は正項級数なので、これにより概収束することがいえ、それは\(\sum_{k=0}^\infty X_{2^k, 2^{k+1}}(t)\)、さらに\(B_t = \frac{t}{\sqrt{pi}}\xi_0 + \sqrt{\frac{2}{\pi}} \sum_{k=0}^\infty X_{2^k,2^{k+1}}(t)\)が\(t\)に関して一様収束することをも意味する。
これで定義1の(ii)がいえた。(i)は\(t=0\)を代入すればよい。
最後に(iii)を示す。正整数\(l\)と、\(l\)個の実数\(0 = t_0 \leq t_1 \leq \cdots \leq t_l \leq \pi\)を任意にとる。\(B_t\)はGauss分布にしたがう確率変数の線形和だからGauss分布にしたがう。よって\( \{ B_{t_k} - B_{t_{k-1}} \}_{1 \leq k \leq l}\)の結合分布は\(l\)次元Gauss分布にしたがう。
\(B_t, B_sB_t\)の部分和はどちらも2乗可積分なので一様可積分である。よって\(\sum_{k=0}^\infty\)と\(E\)の順序を交換できて、$$\begin{align}E[B_t] &= 0 \quad ゆえに\ E[B_{t_k} - B_{t_{k-1}}] = 0,\ k = 1,\dots l \\ E[B_t B_s]&= \frac{ts}{\pi} + \frac{2}{\pi} \sum_{j = 0}^\infty \frac{\sin jt \sin js}{j^2} .\end{align}$$ここで、$$\begin{align} \int_0^\pi t \sin nt\, dt &= -\frac{\pi}{n} \cos n\pi \\ \int_0^\pi \min \{s,t\} \sin nt\, dt &= \frac{1}{n^2} \sin ns - \frac{s}{n} \cos n\pi \\ &= \frac{1}{n^2} \sin ns + \frac{s}{\pi} \int_0^\pi t \sin nt\, dt \end{align}$$なので、区間\([0,\pi]\)での正弦級数をとることにより$$\frac{ts}{\pi} + \frac{2}{\pi} \sum_{j=0}^\infty \frac{\sin jt \sin js}{j^2} = \min\{s,t\}$$を得るから、$$\begin{align} E[(B_{t_k} - B_{t_{k-1}})(B_{t_j} - B_{t_{j-1}})] &= \min\{t_k,t_j\} - \min\{t_k,t_{j-1}\} - \min\{t_{k-1},t_j\} + \min\{t_{k-1},t_{j-1}\} \\ &= \begin{cases} t_k - t_{k-1} & (j = k)\\ 0 & (j \not= k) \end{cases}.\end{align}$$となる。これにより(iii)もいえる。■

定理1で構成したのは有界区間\([0,\pi]\)上でのBrown運動ですが、区間を\([0,\infty)\)に拡張することもできます。実際、定理1によって構成されたBrown運動を独立で可算個用意し、それを\(\{ (B_t^{(i)})_{t \in [0,\pi]} \}_{i \in \mathbb{N}}\)とおけば、$$B_t := \sum_{i=1}^{\lfloor t/\pi \rfloor}B_{\pi}^{(i)} + B_{t - \lfloor t/\pi \rfloor \pi}^{(\lfloor t/\pi \rfloor + 1)} , \ t \geq 0$$によって定義された\( (B_t)_{t\geq 0}\)は区間\([0,\infty)\)でBrown運動になります。
以降、Brown運動\(B_t\)といえば以上の方法によって構成された確率過程のことをさすものとします。しかし、具体的な式を前提にすることはせず、定義1で仮定した性質(i),(ii),(iii)のみを出発点とします。Brown運動を特徴づけるうえでもっとも重要なものは(iii)で、多数の粒子から絶え間なく影響を受けることで不規則な運動が産まれるという発送がおd区立増分とGauss性によって実現されています。

Brown運動の基本的な性質

Brown運動の基本的な性質を示します。

命題1.\(t,s > 0\)に対して、$$E[B_t B_s] = \min \{ t,s \}$$である。
(証明) これは定理1の証明中で示されていることだが、改めて定義1の性質のみを用いて示す。
\(t \geq s \geq 0 \) として\(E[B_t B_s] = s\)をいえばよいが、$$\begin{align} E[B_tB_s] &= E[(B_t - B_s + B_s - B_0)(B_s - B_0)] \\ &= E[(B_t - B_s)(B_s - B_0)] + E[(B_s - B_0)^2]\\ &= s \end{align}$$なのでいえる。■
命題2.\(s>0,c>0\)を固定するとき、\(B_t^\prime(\omega) := B_{t+s}(\omega) - B_s(\omega),\ B_t^{\prime \prime}(\omega) := cB_{t/c^2}(\omega)\)によって新しく定義された確率過程\( (B_t^\prime(\omega))_{t \geq 0}, (B_t^{\prime \prime}(\omega))_{t \geq 0}\)もまたBrown運動である。
(証明) (i),(ii)は\(B_t\)が(i),(ii)をみたすことからすぐに出る。\(0 = t_0 < t_1 < \cdot < t_n ,\ n \in \mathbb{N}\)を任意にとると、$$\begin{align} \{ B_{t_j}^\prime - B_{t_{j-1}}^\prime \}_{1 \leq j \leq n} &= \{ B_{t_j+s} - B_{t_{j-1}+s} \}_{1 \leq j \leq n},\\ \{ B_{t_j}^{\prime \prime} - B_{t_{j-1}}^{\prime \prime} \}_{1 \leq j \leq n} &= \{ c(B_{t_j / c^2} - B_{t_{j-1} / c^2}) \}_{1 \leq j \leq n}\end{align}$$は\(B_t\)の性質(iii)からやはり独立で、平均\(0\)分散\(t_j - t_{j-1}\)のGauss分布にしたがう。よって(iii)もみたす。■
命題3.fを\(\mathbb{R}\)上有界連続関数とする。関数\(u \colon [0,\infty) \times \mathbb{R} \to \mathbb{R}\)を\(u(t,x) = E[f(x + B_t)]\)によって定義すれば、\(u\)は拡散方程式$$\frac{\partial u}{\partial t} = \frac{1}{2}\frac{\partial^2 u}{\partial x^2}$$の解である。
(証明) \(B_t = B_t - B_0\)は平均\(0\)分散\(t\)のGauss分布にしたがうので、$$u(t,x) = \int_{\mathbb{R}} f(x + y) p(t,y)\, dy = \int_\mathbb{R} f(z) p(t,z-x)\, dx$$である。ただし、Gauss分布の密度関数を\(p(t,y) := \frac{1}{\sqrt{2 \pi t}} \exp ( - \frac{y^2}{2t})\)とおいた。具体的な計算により、$$\frac{\partial p}{\partial t}(t,z-x) = \frac{1}{2}\frac{\partial^2}{\partial x^2}(t,z-x) = \frac{1}{2\sqrt{2 \pi t}} \left( \frac{(z-x)^2}{t^2} - \frac{1}{t} \right) \exp \left( - \frac{(z-x)^2}{2t} \right)$$だとわかる。これらに\(f(z)\)をかけて\(z\)について\(\mathbb{R}\)上積分した広義積分はパラメータ\(t\)に関しても\(x\)に関しても広義一様収束するので、積分記号下での微分が定義できて、拡散方程式をみたすことがわかる。■

命題4.\(0 \leq \forall T_1 < \forall T_2\)に対し\(B_t(\omega)\)の\(t \in [T_1, T_2]\)における全変動はa.s.無限大である。
(証明) \(B_t\)が区間\([T_1,T_2]\)で有界変動だとすると、命題1により、$$\frac{1}{\sqrt{T_2 - T_1}} (B_{t(T_2 - T_1) + T_1} - B_{T_1})$$は区間\([0,1]\)で有界変動なBrown運動になる。よって\(T_1 = 0, T_2 = 1\)の場合を示せばよい。
区間\([0,1]\)を\(n\)等分したときの\(B_t\)の2次変分$$\begin{align} X_n(\omega) &:= \sum_{k = 1}^n \Delta_{k,n}^2(\omega) ,\ n \in \mathbb{N}, \\ \Delta_{k,n}(\omega) &:= B_{k/n}(\omega) - B_{(k-1)/n}(\omega),\ k = 1,2,\dots ,n \end{align}$$を考える。\(E[(X_n - 1)^2]\)を求めよう。各\(\Delta_{k,n}\)は独立に平均\(0\)分散\(1/n\)のGauss分布にしたがうこと、\( (X_n -
1)^2\)を展開すると\(\Delta_{k,n}^4, \Delta_{k,n}^2\Delta_{j,n}^2, -\Delta_{k,n}^2, 1\)の形の項がそれぞれ\(n, n(n-1), 2n, 1\)個あることにより、$$E[(X_n - 1)^2] = \frac{3}{n^2} \cdot n + \frac{1}{n} \cdot \frac{1}{n} \cdot n (n-1) - \frac{1}{n} \cdot 2n + 1 \cdot 1 = \frac{2}{n}$$と計算できる。したがって\(E[(X_n - 1)^2] \to 0 (n \to \infty) \)、すなわち\(X_n\)は\(1\)に\(L^2\)の意味で収束する。
よって\(X_{n_i} \to 1\ \text{a.s.}\)となるような部分列\(\{n_i\}\)をとれる。\(B_t\)は\(t\)についてa.s.連続だから区間\([0,1]\)上一様連続であり、したがって$$\delta_n(\omega) := \max_{1 \leq k \leq n}|\Delta_{k,n}(\omega)|$$とおけば\(\delta \to 0\ \text{a.s.}\)である。ここで\(B_t(\omega)\)の区間\([0,1]\)での全変動を\(V(\omega)\)とおけば、$$V(\omega) \geq \sum_{k=1}^{n_i} |\Delta_{k,n_i}(\omega)| \geq \frac{X_{n_i}(\omega)}{\delta_{n_i}(\omega)}$$であるが、最右辺はいくらでも大きくできるので、結論を得る。■


次回に続きます。

順序の数量化と選好

レイ・フロンティア株式会社のデータアナリストの齋藤です。
今回は最近興味を持ち始めた、選好関係と呼ばれる2項関係と、選好の順序を数値によって表現する方法についてご紹介します。

全順序に関する数量化定理

対象の集合\(X\)に2項関係\(\precsim\)が導入されているとします。この関係が好み、すなわち選好関係(preference relation)を表現すると考えます。
\(x \precsim y\)かつ\(y \precsim x\)のことを\(x \sim y\)と書き、\(x \precsim y \)だが\(x \sim y\)でないことを\(x \prec y\)と書きます。\(x \precsim y\)のことを\(y \succsim x\)とも書きます。\(\prec\)と同様に、\(x \succsim y \)だが\(x \sim y\)でないことを\(x \succ y\)と書きます。
全順序の定義から、次の3つが成り立ちます:

全順序の公理(1) 完備性: \(\forall x,y \in X, x \precsim y \vee y \precsim x\)
(2) 反対称性: \(\forall x, y \in X, x \sim y \Rightarrow x = y\)
(3) 推移性: \(\forall x, y, z \in X, x \precsim y \wedge y \precsim z \Rightarrow x \precsim z\)
\(X\)は一般に数とは限らないいろいろな"もの"の集合ですが、\(X\)の元と数との間に選好関係を保つような対応があれば応用上有利です。ありがたいことに、\(X\)が高々可算であればそのような対応が存在することが知られています:
定理1.(全順序の数量化定理:有限集合の場合)有限集合\(X\)上の関係\(\precsim\)が全順序であるとき、\(X\)上の実数値関数\(\phi:X \to \mathbb{R}\)が存在して、$$\forall x,y \in X, \ x \succsim y \Leftrightarrow \phi(x) \geq \phi(y)$$
(証明) まず\(\Rightarrow\)を示す。\(x \succsim y\)を仮定する。推移性により、\(y \succsim z\)となるような任意の\(z \in X\)に対して\(x \succsim z\)が成立する。ゆえに、\(\{ z \mid x \succsim z \} \supseteq \{ z \mid y \succsim z \}\)である。ここで、有限集合\(A\)の要素の個数を\(\sharp A\)とし、関数\(\phi \colon X \to \mathbb{R}\)を$$\phi(x) := \sharp \{z \mid x \succsim z\}$$によって定める。この\(\phi\)について、\(\forall x,y \in X, x \succsim y \Rightarrow \phi(x) \geq \phi(y)\)が成り立つ。
つぎに\(\Leftarrow\)を示す。そのためには対偶を示せばよい。対偶は$$\forall x,y \in X,\ \lnot (x \succsim y) \Rightarrow \lnot (\phi(x) \geq \phi(y))$$であるが、完備性によりこの命題は$$\forall x,y \in X,\ y \succ x \Rightarrow \phi(x) < \phi(y)$$と同値である。ところが、\(y \succ x \)なるとき\(\{ z \mid x \succsim z \} \subsetneqq \{ z \mid y \succsim z \}\)であるため\(\phi(x) < \phi(y)\)である。以上で示された。■

この定理は\(X\)が可算無限集合の場合にも拡張できます:

定理2.(全順序の数量化定理:可算無限集合の場合)可算無限集合\(X\)上の関係\(\precsim\)が全順序であるとき、\(X\)上の実数値関数\(\phi:X \to \mathbb{R}\)が存在して、$$\forall x,y \in X, \ x \succsim y \Leftrightarrow \phi(x) \geq \phi(y)$$
(証明) まず\(\Rightarrow\)を示す。\(\forall x,y \in X, x \succsim y\)を仮定する。\(X\)の要素にてきとうな番号をふって\(X = \{x_1,x_2,\dots,x_i,\dots\}\)とし、二重数列\(S_{ij}\)を\(x_i \succsim x_j\)のとき\(S_{ij}=1\)、それ以外のとき\(S_{ij} = 0\)と定義する。そして、関数\(\phi \colon X \to \mathbb{R}\)を、$$\phi(x_i) := \sum_{j=1}^\infty \frac{1}{2^j}S_{ij}.$$無限級数が収束するのは明らかである。このように構成された関数\(\phi\)に対して、\(\forall x,y \in X,\ x \succsim y \Rightarrow \phi(x) \geq \phi(y)\)が成り立つ。
\(\Leftarrow\)の場合は定理1の証明と同様。■

弱順序に関する数量化定理

次は、全順序の代わりに、条件を弱めた弱順序を考えます。弱順序とは、以下の2つの公理

弱順序の公理(1) 完備性: \(\forall x,y \in X, x \precsim y \vee y \precsim x\)
(2) 推移性: \(\forall x, y, z \in X, x \precsim y \wedge y \precsim z \Rightarrow x \precsim z\)
をみたすような関係のことです。ちょうど順序関係から反対称性を取り除いたものになっています。選好を考えるうえでは、異なる対象を同じくらい選好することがありうるために、このような関係を考えるケースがあります。

弱順序についても、\(X\)が高々可算であれば数量化定理が成立します。

定理3.(弱順序の数量化定理:有限集合の場合)有限集合\(X\)上の関係\(\precsim\)が弱順序であるとき、\(X\)上の実数値関数\(\phi:X \to \mathbb{R}\)が存在して、$$\forall x,y \in X, \ x \succsim y \Leftrightarrow \phi(x) \geq \phi(y)$$
(証明) \( \sim \)は\(X\)上の関係とみなすとき同値関係である。したがって商集合\(X/\sim\)が定義できる。\(X/\sim\)上の関係\(\succsim^\prime\)を$$x \succsim y のとき [x] \succsim^\prime [y]$$であると定める(ただし、\(x\)を代表元とする同値類を\([x]\)と書いている)とこれはwell-definedであり、かつ\(\succsim^\prime\)は\(X/\sim\)上の全順序である。したがって、定理1により実数値関数\(\phi^\prime \colon X/\sim \to \mathbb{R}\)が存在して$$\forall a,b \in X/\sim, \ a \succsim^\prime b \Leftrightarrow \phi^\prime (a) \geq \phi^\prime (b)$$となる。関数\(\phi \colon X \to \mathbb{R}\)を\(x \in X,\ \phi(x) := \phi^\prime ([x])\)によって定めれば、$$\forall x,y \in X, \ x \succsim y \Leftrightarrow \phi(x) \geq \phi(y)$$は成り立っている。■

定理4.(弱順序の数量化定理:可算無限集合の場合)可算無限集合\(X\)上の関係\(\precsim\)が弱順序であるとき、\(X\)上の実数値関数\(\phi:X \to \mathbb{R}\)が存在して、$$\forall x,y \in X, \ x \succsim y \Leftrightarrow \phi(x) \geq \phi(y)$$
(証明) 定理3の証明の「定理1により」を「定理2により」に置き換えればよい。■

これらの定理は\(X\)がたかだか可算の場合に限られており、\(X\)が非可算集合の場合には一般に成立しません。証明は割愛しますが、非可算無限集合については以下の定理が成り立ちます:

定理5.(弱順序の数量化定理:非可算集合の場合)非可算無限集合\(X\)上の関係\(\precsim\)が弱順序であり、かつ商集合\(X/\sim\)が\(\succsim\)順序稠密な可算部分集合をもつとき、\(X\)上の実数値関数\(\phi:X \to \mathbb{R}\)が存在して、$$\forall x,y \in X, \ x \succsim y \Leftrightarrow \phi(x) \geq \phi(y)$$
\(X\)の部分集合\(Y\)が\(\leq\)順序稠密であるとは、任意の要素\(x,y\in X\)について、\(x \leq y\)でありかつ\(x,y \not\in Y\)であるとき、ある\(z \in Y\)が存在して\(x \leq z\)かつ\(z \leq y\)となることをいいます。順序稠密は順序関係のある種の"連続性"を示すものであり、たとえば\(\mathbb{Q}\)は\(\mathbb{R}\)に\(\leq\)順序稠密です。

参考文献

[1] 竹村和久, 藤井聡 (2015), "意思決定の処方", 朝倉書店