Rei Frontier Tech Blog

人工知能を活用した位置情報分析プラットフォーム「SilentLog Analytics」を運営する、レイ・フロンティア株式会社のエンジニアメンバーで運営する技術ブログです。

層の理論:その2

レイ・フロンティア株式会社のデータアナリストの齋藤です.
前回の続きを書いていきます.

層(続)

定義4.(台)\(s \in \Gamma(W; \mathscr{F})\)とする.このとき,$$\mathrm{supp} s = \{ x \in W ; s(x) \not= 0(x) \}$$とおき,切断\(s\)の台という.
補題4より,\(\mathrm{supp} s \)は\(W\)の閉集合です.
いま,\(S\)を\(W\)の閉部分集合とします.このとき,$$\Gamma_s(W;\mathscr{F}) = \{s \in \Gamma(W;\mathscr{F}) ; \mathrm{supp} s \subset S\}$$とおきます.自然な写像のなす列と,$$0 \rightarrow \Gamma_s(W;\mathscr{F}) \rightarrow \Gamma(W; \mathscr{F}) \rightarrow \Gamma(W \setminus S ; \mathscr{F})$$は完全列です.\(W\)と\(W^\prime\)をともに\(S\)の開近傍としたとき,\(\Gamma_S(W;\mathscr{F})\)と\(\Gamma_S(W^\prime ; \mathscr{F})\)は同型です.

ここで,新たに記号を導入します:

定義5.\(S\)を\(X\)の局所閉集合とする.\(\mathfrak{R}(S)\)で\(S\)の開近傍の全体を表し,包含関係で順序づけ,有向集合とする.$$\Gamma[S; \mathscr{F}] = \mathrm{ind-}\lim{W \in \mathfrak{R}(S)} \Gamma_S(W; \mathscr{F})$$とおく.
任意の\(W \in \mathfrak{R}(S)\)に対し,標準的写像$$\Gamma_S(W;\mathscr{F}) \to \Gamma[S;\mathscr{F}]$$は同型です.もし\(S\)が開集合ならば,\(S\in \mathfrak{R}(S)\)で\(\Gamma_S(S;\mathscr{F}) = \Gamma(S;\mathscr{F})\)であるので,$$\Gamma(S;\mathscr{F}) \to \Gamma[S;\mathscr{F}]$$は同型です.\(\Gamma[S;\mathscr{F}]\)を\(\mathscr{F}[S]\)と書くこともあります.

もう一つ,記号を導入します:

定義6.\(Y\)を\(X\)の部分集合とする.$$\mathscr{F}(Y) = \mathrm{ind-}\lim_{W \supset Y} \Gamma(W;\mathscr{F})$$とおく.ここで\(W\)は\(Y\)を含む開集合の全体にわたる.
\(Y\)が開集合ならば$$\mathscr{F}(Y) = \Gamma(Y; \mathscr{F})$$ですが,一般の部分集合\(Y\)に対しては\(\mathscr{F}(Y)\)から\(\Gamma(Y;\mathscr{F})\)への自然な(制限)写像は必ずしも同型とは限りません.

定義7.(台の族)次の3つの条件をみたす\(X\)の部分集合の族\(\Phi\)を台の族(family of supports)という:
(1) \(A \in \Phi\)は閉集合.
(2) \(A \in \Phi, A_1 \subset A\)で\(A_1\)が閉ならば\(A_1 \in \Phi\).
(3) \(A_1,A_2 \in \Phi\)ならば\(A_1\cup A_2 \in \Phi\).
例えば,$$\Phi_X = \{ A; A はXの閉集合\}$$とおけば,\(\Phi_X\)は\(X\)の台の族となっています.いま,\(\Phi\)を台の族とします.\(X\)の部分集合\(S\)に対して,$$\Phi |_S = \{ A \in \Phi ; A \subset S\}$$は\(X\)の台の族です.$$\Phi \cap S = \{ A \cap S ; A \in \Phi \}$$とおくと,\(\Phi \cap S\)は\(S\)の中で台の族をなしています.\(S \subset X\)に対し,$$\Phi_S = \Phi_X |_S = \{ A ; A \subset S かつ A は X で閉\}$$とおきます.\(S\)が\(X\)の閉集合ならば,\(\Phi_S = \Phi_X \cap S\)が成り立ちます.

\(\mathscr{F}\) を\(X\)上の層とし,\(\Phi\)を台の族とするとき,$$\Gamma_\Phi(X;\mathscr{F}) = \{ s \in \Gamma(X;\mathscr{F}) ; \mathrm{supp} s \in \Phi\}$$とおきます.\(\Phi\)は台の族であるということから,\(\Gamma_\Phi(X;\mathscr{F})\)はAbel群となります.
\(S \subset X\)を閉集合としたとき,次の式が成り立ちます:$$\Gamma_S(X;\mathscr{F}) = \Gamma_{\Phi_S}(X;\mathscr{F})$$とくに,$$\Gamma(X;\mathscr{F}) = \Gamma_{\Phi_X}(X;\mathscr{F})$$です.\(\mathscr{F}^\prime \xrightarrow{i} \mathscr{F}\)が層の準同型であるとすれば,\(s^\prime \in \Gamma_\Phi(X;\mathscr{F}^\prime)\)に\(i \circ s^\prime \in \Gamma_\Phi(X;\mathscr{F})\)を対応させることにより,Abel群の準同型$$\Gamma_\Phi(X;\mathscr{F}^\prime) \xrightarrow{i} \Gamma_\Phi(X;\mathscr{F})$$が定まります.このとき,次の命題が成立します:

命題2.\(\Phi\)を\(X\)の台の族とする.$$0 \rightarrow \mathscr{F}^\prime \rightarrow \mathscr{F} \rightarrow \mathscr{F}^{\prime \prime}$$が\(X\)上の層の完全列であれば,誘導されるAbel群の準同型の列$$0\rightarrow \Gamma_\Phi(X;\mathscr{F}^\prime) \rightarrow \Gamma_\Phi(X;\mathscr{F}) \rightarrow \Gamma_\Phi(X;\mathscr{F}^{\prime \prime})$$も完全である.

前層

定義8.(前層)\(X\)を位相空間,\(\mathfrak{W}\)をその開被覆(open covering)とする.すなわち,$$X = \cup\{W; W \in \mathfrak{W} \}$$であるとする.次の性質を満足する\( (F, \rho )\)の組を,\(\mathfrak{W}\)上の(Abel群の)前層(presheaf)という:
(1) 任意の\(W_1 \in \mathfrak{W}\)に対し,Abel群\(F(W)\)が対応する.
(2) \(W_1 \supset W_2\)なる\(W_1, W_2 \in \mathfrak{W}\)に対し,Abel群の準同型$$\rho _{W_2} ^{W_1} : F(W_1) \to F(W_2)$$が対応する.
(3) \(\rho _W ^W = \mathrm{id}\).
(4) \(W_1 \supset W_2 \supset W_3\)なる\(W_1, W_2, W_3 \in \mathfrak{W}\)に対し,次の図式が可換である:
f:id:reifrontier:20180202140519p:plain:w200
\(\mathfrak{W}\)が\(X\)のすべての開集合よりなる被覆の場合は,\(\mathfrak{W}\)上の前層を\(X\)上の前層といいます.
\(F(W)\)が環で,\(\rho _{W_2} ^{W_1}\)が環の準同型であるとき,\( (F,\rho) \)を\(\mathfrak{W}\)上の環の前層といいます.\( (G, \rho )\)が\(\mathfrak{W}\)上の環の前層とします.このとき,\(\mathfrak{W}\)上のAbel群の前層\( (F,\rho ) \)が\(G\)-加群の前層であるとは,各\(F(W)\)が\(G(W) \)-加群で,なおかつ\(\rho _{W_2} ^{W_1} : F(W_1) \to F(W_2)\)が次の意味で加群の準同型となることをいいます:
任意の\(f \in F(W_1)\)と\(g \in F(W_1)\)に対し,$$\rho _{W_2} ^{W_1}(gf) = \rho _{W_2} ^{W_1}(g)\rho _{W_2} ^{W_1}(f)$$

前層の例をいくつか挙げておきます:

例1.\(X\)を位相空間,\(M\)をAbel群とする.\(X\)の開集合\(W\)に対して\(F(W)=M\)とおき,\(W_1 \supset W_2\)に対しては\(\rho_{W_2}^{W_1} = \mathrm{id}\)とすれば,\(X\)上のAbel群の前層が定義される.これを定数前層(constant presheaf)といい,\(M = M_X\)で表す.もし\(M\)が環構造をもてば,定数前層\(M_X\)は環の前層の構造をもつ.

例2.\(X\)を位相空間とする.\(F(W) = \mathbb{C}^W = (W上の\mathbb{C}値関数の全体) \)とおき,\(\rho_{W_2}^{W_1}\)を通常の制限写像とする.こうして定義される\(X\)上の環の前層を,任意関数の前層という.

例3.\(m = 0,1,2,\ldots , \infty \)とする.\(\mathbb{R}^n\)の開集合\(u\)に対し,\(C^m(u)\)で\(m\)回連続微分可能な関数の全体のなす環を表す.\(\rho_{u_2}^{u_1}\)は通常の制限写像であるとすれば,\(\mathbb{R}^n\)上の環の前層が定まる.これを\(C^m\)で表そう.
また,\(\mathscr{D}^\prime (u)\)で\(u\)上のSchwartz超関数の全体,\(\rho_{u_2}^{u_1}\)をSchwartz超関数の制限写像とすると,\(\mathscr{D}^\prime\)は\(\mathbb{R}^n\)の\(C^\infty\)-加群の前層をなす.

例4.\(u\)を\(\mathbb{R}^n\)の開集合としたとき,\(W\)に\(L^p(u) = (p乗\text{Lebesgue}可積分関数の全体) \)を対応させ,\(\rho_{u_2}^{u_1}\)を制限写像とすると,\(\mathbb{R}^n\)上に前層が定まる.

以下,Abel群の前層を単に前層と呼びます.

定義9.(準層の準同型)開被覆\(\mathfrak{W}\)上の前層\( (F, \rho )\)と\( (F^\prime , \rho^\prime )\)が与えられたとき,\( (F, \rho )\)から\( (F^\prime , \rho^\prime )\)への準同型\(\mu\)とは,各\(W \in \mathfrak{W}\)に対して定まったAbel群の準同型$$\mu_W : F(W) \to F^\prime(W)$$の組であって,\(W_1 \supset W_2\),\(W_1, W_2 \in \mathfrak{W}\)に対して次の図式が可換であるものをいう:
f:id:reifrontier:20180202143359p:plain:w200
\( (F, \rho )\)と\( (F^\prime , \rho^\prime )\)が環の前層のとき,\(\mu\)が環の前層の準同型であるとは,上の条件の他に,\(\mu_W\)が環の準同型でもあるときにいいます.同様に,環の前層を係数にもつ加群の前層の準同型も定義されます.
\(F(W)\)が\(F^\prime(W)\)の部分群で,\(\rho_{W_2}^{W_1}\)が\(\rho_{W_2}^{\prime W_1}\)の制限であれば,\(\mu_W\)を標準的単射として\( (F, \rho) \to (F^\prime , \rho^\prime )\)なる前層の準同型が定まります.このとき,\( (F, \rho) \)は\( (F^\prime, \rho^\prime )\)の部分前層であるといいます.

例5.\(m \leq m^\prime\)ならば,\(C^{m^\prime}\)は\(C^m\)の部分前層である.


次回に続きます.

層の理論:その1

レイ・フロンティア株式会社のデータアナリストの齋藤です.

層の定義と、その基本的な性質について述べます.

定義1(層)位相空間\(X\)上の(Abel群の)層(sheaf)とは,次のような組\((\mathscr{F}, \pi)\)のことをいう:
(1) \(\mathscr{F}\)は位相空間.
(2) \(\pi: \mathscr{F} \to X\)は全射かつ局所位相同型.すなわち,任意の\(p \in \mathscr{F}\)に対してある開近傍\(U\)が存在して,\(\pi(U)\)が\(X\)の開集合で,$$\pi |_U : U \to \pi(U)$$が位相同型である.
(3) 任意の\(x \in X\)に対して,$$\mathscr{F}_x = \pi^{-1}(x)$$はAbel群.
(4) 次の意味で,群の演算は連続である:$$\mathscr{F} + \mathscr{F} = \{ (p_1, p_2) \in \mathscr{F} \times \mathscr{F} ; \pi(p_1) = \pi(p_2) \}$$とおくと,加法\( (p_1, p_2) \mapsto p_1 + p_2\)は\(\mathscr{F} + \mathscr{F}\)から\(\mathscr{F}\)への写像であるが,これが連続である.
\(\pi\)を射影(projection)といい,\(\mathscr{F}_x = \pi^{-1}(x)\)を\(x\)上の茎(stalk)といいます.定義1の(2)により,射影は開写像であることが分かります.
\mathscr{F}を\(X\)上の層,\(Y \subset X\)を部分空間としたとき,\( (\pi^{-1}(Y), \pi |_{\pi^{-1}(Y)} ) \)は\(Y\)上の層を与えます.ここで,\(\pi^{-1}(Y)\)には\(\mathscr{F}\)の開集合としたの位相を与えます.これを\(\mathscr{F}|_Y\)と書き,層\(\mathscr{F}\)の\(Y\)への制限といいます.
定義1において,「Abel群」を「環」でおきかえ,(4)で加法および乗法\( (p_1, p_2) \mapsto p_1 p_2\)の連続性を仮定すれば,環の層が定義できます.いま\( (\mathscr{G}, \sigma) \)を環の層として,Abel群の層\( (\mathscr{F}, \pi) \)が\(\mathscr{G} \)-加群の層であるとは,
(1) 任意の\(x \in X\)に対して,\( \mathscr{F}_x\)が\(\mathscr{G}_x\)-加群.
(2) \(\mathscr{G} + \mathscr{F} = \{ (q,p) \in \mathscr{G} \times \mathscr{F} ; \sigma(q) = \pi(p) \} \)から\(\mathscr{F}\)への写像\( (q,p) \mapsto q \cdot p \)は連続.
をみたすことをいいます.

以下,混乱のない限り層といえばAbel群の層のことをさします.

定義2(層の準同型)\( (\mathscr{F}^\prime, \pi^\prime) \)と\( (\mathscr{F}, \pi)\)が\(X\)上の層であるとする.連続写像\( i : \mathscr{F}^\prime \to \mathscr{F}\)が(層の)準同型(homomorphism)であるとは,
(1) 次の図式が可換である:
f:id:reifrontier:20180201161219p:plain:w200
ただし,\(\mathrm{id}\)は恒等写像を表す.
(2) \(i\)を\(\mathscr{F}^\prime _x \)に制限して,\( i_x : \mathscr{F}^\prime _x \to \mathscr{F}_x\)を定めると,これはAbel群の準同型である.
の2条件を満たすことをいう.
\(\mathscr{F}^\prime \subset \mathscr{F}\)かつ恒等写像\(\mathscr{F}^\prime \hookrightarrow \mathscr{F}\)が層の準同型であるとき,\(\mathscr{F}^\prime\)は\(\mathscr{F}\)の部分層(subsheaf)であるといいます.\(\mathscr{F}^\prime \subset \mathscr{F}\)が\( \mathscr{F}\)の部分層であるには,
(1) \(\mathscr{F}^\prime\)は\(\mathscr{F}\)の開集合.
(2) \(\pi(\mathscr{F}^\prime) = x\).
(3) \(\mathscr{F}^\prime_x \equiv \pi^{-1}(x) \cap \mathscr{F}^\prime \)は\(\mathscr{F}_x\)の部分群.
の3条件を満たすことが必要十分です.\(\mathscr{F}^\prime\)が\(\mathscr{F}\)の部分層であるとき,$$\mathscr{F}^{\prime \prime } _x = \mathscr{F}_x / \mathscr{F}^\prime_x$$とおき,\(h_x : \mathscr{F}_x \to \mathscr{F}^{\prime \prime}_x\)を標準的全射とし,さらに$$\mathscr{F}^{\prime \prime} = \bigsqcup_{x \in X}\mathscr{F}^{\prime \prime}_x \ ,\ (直和) $$とおき,\(h : \mathscr{F} \to \mathscr{F}^{\prime \prime}\)を\(h_x\)の拡張として定義します.\(\mathscr{F}^{\prime \prime}\)に\(h\)による商位相をいれると,\(\mathscr{F}^{\prime \prime }\)はまた\(X\)上の層となっています.\(\mathscr{F}^{\prime \prime}\)を\(\mathscr{F}^\prime / \mathscr{F}\)と書き,商層(quotient sheaf)といいます.
環の層,環の層を係数とする加群の層に対しても,準同型が同様に定義できます.環の層の部分層,商層なども同様に定義されます.

定義2(層の切断)\( (\mathscr{F}, \pi) \)を位相空間\(X\)上の層とする.\(Y \subset X\)に対して,\(Y\)から\(\mathscr{F}\)への連続写像\(s\)で,\(\pi \circ s = \mathrm{id}\)となるものを\(Y\)上の\(\mathscr{F}\)の切断(section)といい,その全体を\(\Gamma(Y;\mathscr{F}) \)と表す.切断に,\(Y\)の各点上で茎\(\mathscr{F}_x\)の演算を施すことにより,\(\Gamma(Y;\mathscr{F})\)はAbel群となる.
\(x \in X\)を固定し,\(p \in \pi^{-1} (x)\)を任意にとります.\(\pi\)は局所位相同型だから,\(p\)の近傍\(U\)があり,\(\pi|_U:U \to \pi(U) = W\)は位相同型となります.したがって,\(W\)は\(x\)の開近傍であり,\(s = (\pi|_U)^{-1} \in \Gamma(W; \mathscr{F})\)は\(s(x) = p\)を満たします.このことから次の3つの補題が証明されます:

補題1\(W \subset X\)を開集合とする.\(s \in \Gamma(W;\mathscr{F})\)ならば,\(s : W \to \mathscr{F}\)は開写像である.
補題2任意の\(p \in \mathscr{F}\)に対し,\(\pi(p)\)のある近傍で定義された切断で\(p\)を通るものが存在する.
補題3\( \{ s(W) ; s \in \Gamma(W;\mathscr{F}) , W は X の開集合 \}\)は\(\mathscr{F}\)の開集合の基底をなす.
\(s \in \Gamma(W;\mathscr{F}\)であれば,\(s - s \)も\(W\)上の\(\mathscr{F}\)の切断であり,\(s\)によらず定まります.これを\(\mathscr{F}\)のゼロ切断(zero section)といい,\(0 : W \to \mathscr{F}\)で表します.\(0(x)\)とは,Abel群\(\mathscr{F}_x = \pi^{-1}(x)\)のゼロ元に他なりません.

\(i : \mathscr{F}^\prime \to \mathscr{F}\)が層の準同型であるとします.このとき,\(\mathrm{Im} i = i(\mathscr{F}^\prime) \)は\(\mathscr{F}\)の部分層です.また,\(\mathrm{Ker} i \subset \mathscr{F}^\prime\)は,\(i\)で\(\mathscr{F}\)のゼロ切断の像\(\{ 0(x); x \in X \} \)にうつる\(\mathscr{F}^\prime \)の元から成ります.切断の像は開集合なので,\(\mathrm{Ker} i\)は開集合の連続写像による逆像だから開集合であり,したがって\(\mathscr{F}^\prime\)の部分層となっています.

層の準同型からなる完全列を考えることもできます.$$\mathscr{F}^\prime \xrightarrow{i} \mathscr{F} \xrightarrow{h} \mathscr{F}^{\prime \prime}$$が(第二項において)完全であるとは,$$\mathrm{Im} i = \mathrm{Ker} h$$であることと定義します.$$ 0 \rightarrow \mathscr{F}^\prime \xrightarrow{i} \mathscr{F} \xrightarrow{h} \mathscr{F}^{\prime \prime} \rightarrow 0$$が完全列であるための必要十分条件は,\(\mathscr{F}^\prime\)が\(\mathscr{F}\)の部分層(と同型)であり,\(\mathscr{F}^{\prime \prime}\)が商層\(\mathscr{F} / \mathscr{F}^\prime \)(と同型)であることです.

切断に話題を戻します.\(Y^\prime \subset Y\)であれば,\(Y\)上の\(\mathscr{F}\)の切断\(s \in \Gamma(Y;\mathscr{F})\)を\(Y^\prime\)に制限することにより,\(Y^\prime\)上の\(\mathscr{F}\)の切断$$S|_{Y^\prime} \in \Gamma(Y^\prime ; \mathscr{F})$$が定まります.これを,\(s\)の\(Y^\prime\)への制限(restriction)といいます.
次の補題が成り立ちます:

補題4\(W_1, W_2 \subset X\)を開集合とする.\(s_j \in \Gamma(W_j ; \mathscr{F}) , j = 1,2\)として,$$W_0 = \{ x \in W_1 \cap W_2 ; s_1(x) = s_2(x) \}$$とおけば,\(W_0\)は\(X\)の開集合である.
(証明) \(W = W_1 = W_2\)と仮定してよい.\(s = s_1 - s_2 \in \Gamma(W; \mathscr{F})\)とおけば,$$W_0 = s^{-1} \{ 0(x) ; x \in W \}$$は開集合の連続写像による逆像なので開集合である.■

層は一般にはHausdorffの分離公理を満たすとは限りませんが,次の命題が成立します:

命題1層\(\mathscr{F}\)がHausdorffの分離公理を満たすための必要十分条件は,任意の\(W_1, W_2 \subset X \)と\(s_j \in \Gamma(W_j ,\mathscr{F}) , j = 1,2 \)に対し,上に定めた\(W_0\)が\(W_1 \cap W_2\)の閉集合となることである.


次回に続きます.

Brown運動と確率積分:その3

レイ・フロンティア株式会社のデータアナリストの齋藤です。
前回の記事の続きを書いていきます。

確率積分

Brown運動\( (B_t(\omega) )_{t \geq 0}\)と関数\( f : \mathbb{R} \to \mathbb{R}\)について、積分\(\int_0^t f(B_s(\omega) )\, dB_s(\omega) \)を定義することを考えます。Brown運動の全変動は確率1で無限大なので、積分\(\int_0^t f(B_s(\omega) )\, dB_s(\omega) \)を通常のStieltjes積分として捉えることはできません。たとえば、$$\int_0^1 B_s\, dB_s$$をRiemann-Stieltjes積分の類似物として定義することを試みてみましょう。区間\([0,1]\)を\(n\)等分し、分点を\(t_k = k/n ,\ k = 0,1,\dots ,n\)とおき、Riemann和$$S^{(n)} := \sum_{k = 1}^n B_{s_k} (B_{t_k} - B_{t_{k-1}}) ,\ s_k \in [t_{k-1}, t_k]$$を考えます。Stieltjes積分では\(s_k \in [t_{k-1}, t_k]\)をどのようにとっても\(S^{(n)}\)は\(n \to \infty\)で同じ値に収束します。しかし、左側の点をとり\(s_k = t_{k-1}\)とした和を\(\underline{S}^{(n)}\)、右側の点をとり\(s_k = t_k\)とした和を\(\overline{S}^{(n)}\)とおけば、$$\begin{align} \overline{S}^{(n)} - \underline{S}^{(n)} &= \sum_{k =1}^n (B_{t_k} - B_{t_{k-1}})^2 \\ & \to 1 \qquad \text{ in } L^2 \qquad(\because 命題4の証明より)\end{align}$$となってうまくいきません。確率積分ではStielthes積分とは異なり、被積分関数\(f(B_{s_k})\)について\(s_k\)をどこにとるのかを決めなければいけません。ここでは、左側の点をとったものを確率積分として採用します:

定義2.(伊藤の確率積分)\( (B_t)_{t \geq 0}\)をBrown運動とする。関数\(f(B_t)\)と区間\([0,t]\)の分割の列\(\Delta_n = \{ 0 \leq t_1^{(n)} < t_2^{(n)} < \cdots \},\ n = 1,2,\dots \)について、和$$S_t^{(n)} := \sum_{t_k^{(n)} \in \Delta_n} f(B_{t_{k-1}^{(n)}})(B_{t_k^{(n)}} - B_{t_{k-1}^{(n)}})$$が条件\(\sum_{n = 1 }^\infty < \infty\)のもとで\(n \to \infty\)としたときある確率変数に収束するならば、それを\(f\)のBrown運動\( (B_t) \)に関する(伊藤の)確率積分(stochastic integral)といい、$$\int_0^t f(B_s)\, dB_s$$と書く。
実際はもっと広いclassのもとで定義できますが、ここでは割愛します。
簡単な例を計算してみましょう。$$\int_0^t B_s\, dB_s$$を求めてみます。\(\sum_{n = 1 }^\infty < \infty\)なる分割の列\(\Delta_n = \{ 0 \leq t_1^{(n)} < t_2^{(n)} < \cdots \},\ n = 1,2,\dots \)を任意にとります。恒等式$$B_{t_k^{(n)}}^2 - B_{t_{k-1}^{(n)}}^2 = 2 B_{t_{k-1}^{(n)}} (B_{t_k^{(n)}} - B_{t_{k-1}^{(n)}}) + (B_{t_k^{(n)}} - B_{t_{k-1}^{(n)}})^2$$において\(k\)について和をとってから\(n \to \infty\)とすれば、定理3により、$$B_t^2 - B_0^2 = \lim_{n \to \infty}\sum_{t_k^{(n)} \in \Delta_n}B_{t_{k-1}^{(n)}} (B_{t_k^{(n)}} - B_{t_{k-1}^{(n)}}) + t$$ゆえに$$\int_0^t B_s\, dB_s = \frac{1}{2} B_t^2 - \frac{1}{2} t$$と求まります。\(t\)についての項が加わっているという点で、通常のStieltjes積分とは異なっています。

伊藤の公式

上の例で、確率積分では通常のStieltjes積分とは異なる計算結果が得られることを見ました。このことは、直感的には次のように理解されます: 
\(f\)をなめらかな関数とし、\(f(B_t)\)の微小変化をTaylor展開によって$$df(B_t) = f^\prime (B_t) dB_t + \frac{1}{2} f^{\prime \prime} (B_t) (dB_t)^2 + \frac{1}{6} f^{\prime \prime \prime} (B_t) (dB_t)^3 + \cdots$$と近似することを考えます。ここで、\( (dB_t)^2 = dt\)として、\(dt\)より小さい微小項を無視すれば、\(df(B_t) = f^\prime (B_t) dB_t + \frac{1}{2} f^{\prime \prime} (B_t) dt \)となります。これを積分で書き、\(f(x) = x^2\)とすれば上の例の計算結果が直ちに出ます。2次変分を用いて直接計算できたのは、Taylor展開(計算に用いた恒等式に他なりません)がそもそも2次までしかないからです。
これを定理の形で述べたものが、伊藤の公式と呼ばれるものです:

定理4.(伊藤の公式)\(f \in C^2(\mathbb{R})\)とし、確率過程\(X_t\)が$$X_t(\omega) = X_0(\omega) + \lambda B_t(\omega) + A_t$$の形であるとする。ただし、\( (B_t) \)はBrown運動、\(\lambda\)は定数、\(A_t\)は\(A_0 = 0\)かつ任意の有界区間上で有界変動とする。このとき、確率1で$$f(X_t) - f(X_0) = \int_0^t \lambda f^\prime (X_s)\, dB_s + \int_0^t f^\prime (X_s)\, dA_s + \frac{1}{2} \int_0^t \lambda^2 f^{\prime \prime} (X_s)\, ds,\ t \geq 0$$が成立する。
\(A_t\)は有界変動なので\(dA_t \sim dt\)だと思えば、これは上の直感的な議論と同様の考え方で導出できます。一般には\(X_t - X_0\)がいくつかの確率積分と有界変動関数の和の場合にも同様のことが示されます。ここでは伊藤の公式を証明抜きで認めることにして、経済学への一つの応用例を紹介します。
\(\alpha > 0, \beta > 0\)とし、\(X_t = \alpha B_t + (\beta - \alpha^2/2)t\)とおきます。\(f(x) = e^x\)について伊藤の公式を適用すれば、$$\begin{align} \exp (X_t) - \exp(X_0) &= \int_0^t \alpha \exp (X_s)\, dB_s + \int_0^t \exp (X_s) (\beta - \alpha^2/2)\, ds + \frac{1}{2} \alpha^2 \exp (X_s)\, ds \\ &= \int_0^t \alpha \exp (X_s)\, dB_s + \int_0^t \beta \exp (X_s)\, ds . \end{align}$$\(S_t := \exp (X_t)\)とおき、微分形に書き直せば、$$\frac{dS_t}{S_t} = \alpha dB_t + \beta dt$$という表示を得ます。\(S_t\)は幾何Brown運動(geometric Brownian motion)といわれるものです。\(S_t\)を株価とみれば、左辺は微小時間での株価の伸び率を意味し、上の方程式は株価の伸び率にランダムな変動が加わっていると解釈できます。これはBlack-Scholesモデルと呼ばれ、確率微分方程式(stochastic differential equation)の一種です。多数の要因によって影響を受けることが不規則な運動をもたらすというBrown運動の発送は株価変動と相性がよく、金融工学において伊藤の公式は基本的な道具となっています。

参考文献

[1] 舟木直久(1997), "確率微分方程式", 岩波書店
[2] 西尾真喜子(1978), "確率論", 実教出版
[3] Henry P. McKean Jr.(1969), "Stochastic Integrals", Academic Press
[4] 河野敬雄(1995), "Brown運動とその周辺", http://www.math.kobe-u.ac.jp/publications/rlm01.pdf

Brown運動と確率積分:その2

レイ・フロンティア株式会社のデータアナリストの齋藤です。
前回の記事の続きを書いていきます。

Brown運動のHölder連続性

\( (B_t)_{t \geq 0}\)をBrown運動とします。
前記事で触れたように、Brown運動のsample pathは確率1で連続ですが無限の全変動をもちます。その他にも、確率1でいたるところ微分不可能であり、もっと詳しくいうと、1/2次Hölder連続よりもやや悪いくらいの連続性をもつことが知られています。本記事ではこれを示します。

次の定理を示します:

定理2.(Brown運動のHölder連続性)Brown運動\( (B_t)_{t \geq 0}\)に対して、$$\lim_{h \to 0} \sup_{\substack{0 \leq |s-t| \leq h \\ 0 \leq s,t \leq 1}}\frac{|B_s(\omega) - B_t(\omega)|}{\sqrt{2h\log 1/h}} = 1 \ \text{a.s.}$$が成り立つ。
(証明) まず下からの評価を示す。\(g(h) := \sqrt{2h\log 1/h}\)とおく。\(\forall \varepsilon > 0\)に対して、$$\begin{align} &P \left( \max_{1 \leq k \leq 2^n} \{ B_{k/2^n}(\omega) - B_{(k-1)/2^n}(\omega) \} \leq (1 - \varepsilon ) g(1/2^n) \right) \\ &= \left( 1 - \int_{(1 - \varepsilon) \sqrt{2 \log 2}\sqrt{n}} p(1,x)\, dx \right)^{2^n}\ (\because 定義1(iii)より)\\ & = (1 - I_n)^{2^n}\ (積分を I_n とおいた)\\ &< \exp(-2^n I_n) . \end{align}$$ここで、部分積分により、実数\(a > 0\)に対して、$$\int_a^\infty e^{-x^2/2}\, dx = \int_a^\infty \left( -\frac{1}{x} \right) \cdot \left( e^{-x^2/2} \right)^\prime\, dx = \frac{e^{-a^2/2}}{a} - \int_a^\infty \frac{1}{x^2} e^{-x^2/2}\, dx$$より、$$\frac{e^{-a^2/2}}{a} \geq \int_a^\infty e^{-x^2/2}\, dx \geq \frac{e^{-a^2/2}}{a} - \frac{1}{a^2} \int_a^\infty e^{-x^2/2}\, dx$$したがって$$\frac{e^{-a^2/2}}{a} \geq \int_a^\infty e^{-x^2/2}\, dx \geq \frac{e^{-a^2/2}}{a + 1/a} \qquad \cdots (\ast)$$を得る。これを用いると、十分大きな\(n\)について$$2^nI_n \geq Const. \times \frac{2^n}{\sqrt{n}}\exp(-(1 - \varepsilon)^2 \log 2 \times n) \geq 2^{\delta n} ,\ \delta > 0$$がいえる。\(exp(-2^{\delta n})\) は収束級数の一般項なので、Borel-Cantelliの補題により、$$P\left( \max_{1 \leq k \leq 2^n} \{ B_{k/2^n}(\omega) - B_{(k-1)/2^n}(\omega) \} \leq (1 - \varepsilon ) g(1/2^n)\ \text{i.o.} \right) = 0.$$これは$$\liminf_{n \to \infty} \max_{1 \leq k \leq 2^n} \frac{ B_{k/2^n}(\omega) - B_{(k-1)/2^n}(\omega) }{g(1/2^n)} > 1 - \varepsilon \quad \text{a.s.}$$を意味するが、$$\lim_{h \to 0} \sup_{\substack{0 \leq |s-t| \leq h \\ 0 \leq s,t \leq 1}}\frac{|B_s(\omega) - B_t(\omega)|}{\sqrt{2h\log 1/h}} \geq \liminf_{n \to \infty} \max_{1 \leq k \leq 2^n} \frac{ B_{k/2^n}(\omega) - B_{(k-1)/2^n}(\omega) }{g(1/2^n)}$$であり、\(\varepsilon > 0\)は任意だったので、下からの評価はいえた。
次に上からの評価を示す。\(\forall \varepsilon > 0\)について、\(\delta\)を\( (1 + \varepsilon)^2 > (1 + \delta)/(1 - \delta)\)をみたすように十分小さくとる。このとき、$$\begin{align}&P \left( \max_{\substack{1 \leq k = j - i \leq 2^{\delta n} \\ 0 \leq k < j \leq 2^n}} |B_{j / 2^n}(\omega) - B_{i / 2^n}(\omega)| \geq (1 + \varepsilon) g(k/2^n) \right) \\ &\leq \sum_{\substack{1 \leq k = j - i \leq 2^{\delta n} \\ 0 \leq k < j \leq 2^n}} 2 \int_{(1 + \varepsilon) \sqrt{2 \log (2^n / k)}}^\infty p(1,x)\, dx \quad (\because 定義 1 (iii)) \\&\leq Const. \times \frac{2^{(1 + \delta) n}2^{-(1 - \delta)(1 + \epsilon)^2 n}}{\sqrt{n}}\quad (\because 不等式(\ast))\\ &\leq \frac{2^{-\gamma n}}{\sqrt{n}},\quad \gamma > 0 \qquad (\because \delta のとり方から) \end{align}$$がいえる。\(2^{-\gamma n}/\sqrt{n}\)は収束級数の一般項なので、Borel-Cantelliの補題により、確率1で\(n_0 = n_0(\omega)\)が存在して、\(\forall n \geq n_0, \forall (j - i) = k \leq 2^{\delta n}\)に対して、$$|B_{j / 2^n}(\omega) - B_{i / 2^n}(\omega)| \leq (1 + \varepsilon)g(k/2^n)$$が成り立つ。いま、実数\(s,t\)を\(0 \leq s \leq t, 2^{-(n+1)(1-\delta)}\leq t - s \leq 2^{-n(1 - \delta)}\)となるようにとる。\(s,t\)を「2進数展開」し、$$\begin{align} & s = i/2^n - 1/2^{p_1} - 1/2^{p_2} - \cdots \quad (i,p_1,p_2, \dots は正整数, n < p_1 < p_2 < \cdots) \\& t = j/2^n + 1/2^{q_1} + 1/2^{q_2} - \cdots \quad (j,q_1,q_2, \dots は正整数, n < q_1 < q_2 < \cdots) \end{align}$$と表現すれば、\(i,j\)は\(s\leq i/2^n \leq j/2^n \leq t , 0 < k = j - i \leq (t - s) 2^n < 2^{\delta n}\)をみたす。\(s,t\)の最初の\(m\)項で打ち切った部分和を\(s_m , t_m\)とおけば、三角不等式により$$\begin{align}|B_t(\omega) - B_s(\omega)| &\leq \sum_{m = 1}^\infty |B_{t_{m+1}}(\omega) - B_{t_m}(\omega)| + |B_{i / 2^n}(\omega) - B_{j/2^n}(\omega)| + \sum_{m = 1}^\infty |B_{s_{m+1}}(\omega) - B_{s_m}(\omega)|\\ &\leq \sum_{p = n+1}^\infty (1 + \varepsilon) g(1/2^p) + (1 + \varepsilon) g(k/2^n) + \sum_{q = n+1}^\infty (1 + \varepsilon) g(1/2^q) \end{align}$$となる。十分大きい\(n\)に対して、$$\begin{align} \sum_{p = n+1}^\infty g(1/2^p) &= \sum_{p = n+1}^\infty \sqrt{2 \log 2 \cdot p/2^p} \\ &\leq \sum_{p=n+1}^\infty Const. \times \left( \sqrt{2 \log 2 \cdot p/2^p} - \sqrt{2 \log 2 \cdot (p-1)/2^{p-1}} \right)\\ &= Const. \times \sqrt{2 \log 2 \cdot n/2^n} \\ &= Const. \times g(1/2^n) \\ &< \varepsilon g(2^{-(n+1)(1-\delta)}) \end{align}$$したがって、$$|B_t(\omega) - B_s(\omega)| < (1 + 3 \varepsilon + 2 \varepsilon^2) g(t-s)$$を得る。これは$$\lim_{h \to 0} \sup_{\substack{0 \leq |s-t| \leq h \\ 0 \leq s,t \leq 1}}\frac{|B_s(\omega) - B_t(\omega)|}{\sqrt{2h\log 1/h}} \leq 1 + 3 \varepsilon + 2 \varepsilon^2$$を意味し、\(\varepsilon > 0\)は任意だったため上からの評価もいえた。■

定理2から、各\(t \in (0,\infty)\)に対して\(\frac{B_{t+h} - B_t}{h}\)は\(h \to 0\)で発散することがわかります。これまでの考察から、Brown運動は確率1で、「連続であるが、いたるところ微分不可能であり、任意の区間で無限に変動する」という、「普通の連続関数」とは異質なふるまいをすることがわかります。

Brown運動の微小変化

確率解析の理論においては、次の定理も重要です:

定理3.(Brown運動の2次変分)\(T > t > 0\)を固定し、\(\Delta_n = \{ 0 \leq t_1^{(n)} < t_2^{(n)} < \cdots \}, n = 1,2,\dots \)を区間\([0,T]\)の分割の列とし、\(\Delta_n(t) = \{ t_k^{(n)} \in \Delta_n ; t_k^{(n)} \leq t \} , |\Delta_n| = \sup_k |t_k^{(n)} - t_{k-1}^{(n)}| < \infty\)とする。このとき、$$\sum_{n = 1}^\infty |\Delta_n| < \infty$$ならば$$\lim_{n \to \infty}\sum_{t_k^{(n)} \in \Delta_n(t)}|B_{t_k^{(n)}}(\omega) - B_{t_{k-1}^{(n)}}(\omega)|^2 = t \qquad \text{a.s.}$$である。
(証明)$$V_n := \sum_{t_k^{(n)} \in \Delta_n(t)}\left( |B_{t_k^{(n)}} - B_{t_{k-1}^{(n)}}|^2 - (t_k^{(n)} - t_{k-1}^{(n)}) \right)$$とおく。定義1(iii)より、$$(E[V_n^2] = 2 \sum_{t_k^{(n)} \in \Delta_n(t)}(t_k^{(n)} - t_{k-1}^{(n)}) \leq 2 |\Delta_n| \sum_{t_k^{(n)} \in \Delta_n(t)}(t_k^{(n)} - t_{k-1}^{(n)}) \leq 2 t |\Delta_n|$$と計算できるから、仮定より、$$E\left[ \sum_{n=1}^\infty V_n^2 \right] = \sum_{n=1}^\infty E[V_n^2] \leq 2 t \sum_{n=1}^\infty |\Delta_n| < \infty . $$したがって、$$\sum_{n = 1}^\infty V_n^2 < \infty \qquad \text{a.s.}$$ゆえに、$$\lim_{n \to \infty} V_n = 0 \qquad \text{a.s.}.$$これと\(\sum_{t_k^{(n)} \in \Delta_n(t)}(t_k^{(n)} - t_{k-1}^{(n)}) \to t\)から結論が得られる。■

この結果は、標語的に言えば\(\int_0^t (dB_t)^2 = t\)ということで、微分の形で書けば$$(dB_t)^2 = dt$$となり、「Brown運動は時間変化の1/2乗くらいのひろがりをもつ」ということを意味します。このことは、今までに示してきた、

  • 共分散\(E[B_tB_s]\)が\(O(t)\)となること(命題1)
  • Brown運動の性質が時間を\(c^2\)倍に縮めて変異を\(c\)倍に伸ばすと保持されること(命題2)
  • 拡散方程式\(u_t = 1/2 u_{xx}\)の解が自然に得られること(命題3)
  • 各\( (B_t(\omega) )\)は1/2次くらいのHölder連続性をもつこと(定理2)

など様々な事実から類推されることですが、厳密には確率積分の理論によって定式化され、伊藤の公式とし知られています。

次回に続きます。

Brown運動と確率積分:その1

レイ・フロンティア株式会社のデータアナリストの齋藤です。
本記事から数回にわたって、Brown運動という数学モデルを紹介します。

Brown運動とは

Brown運動とは、もともとは液体中の微粒子が不規則に運動する現象のことをさします。植物学者ブラウン(Robert Brown)が浸透圧によって破裂した花粉から飛び出した粒子を観察した際に発見されたのがBrown運動のはじまりですが、1905年のアインシュタイン(Albert Einstein)の論文によって粒子の不規則な運動は水分子の衝突によるものであると説明され、原子と分子が存在する根拠にもなりました。
数学モデルとしてのBrown運動は、1923年にウィーナー(Norbert Wiener)によって確立されました。Brown運動は日本人数学者伊藤清が1942年に生み出した確率微分方程式の理論においても中心的な役割を果たし、現在では物理学、生物学、経済学など様々な分野に応用されています。
本記事では、数学モデルとしてのBrown運動の構成を提示し、独立増分性から導かれる性質をいくつか導いていきます。

Brown運動の定義と構成

Brown運動は、数学的には連続で独立増分をもちGauss分布にしたがう確率過程として定式化されます。より厳密に定義を述べると、以下のようになります:

定義1.(Brown運動)確率空間\( (\Omega, \mathcal{F}, P)\)上で定義された実数値確率過程\( B = (B_t)_{t \geq 0} \)がBrown運動(Brownian motion)であるとは、次の条件をみたすときにいう:
 (i) \(B_0 = 0\ \mathrm{a.s.} \)である。
 (ii) \(\mathrm{a.a.}\ \omega \in \Omega \)に対し、\( B_t (\omega) \)は\(t\)について連続である。
 (iii) \( 0 = t_0 < \forall t_1 < \cdots < \forall t_n ,\ \forall n \in \mathbb{N}\)に対し、増分\( \{ B_t - B_{t-1 }\}_{1 \geq i \geq n}\)は互いに独立で、それぞれ平均\(0\)、分散\(t_i - t_{i-1}\)のGauss分布にしたがう。
確率空間が与えられたとき、その空間にBrown運動が存在するかどうかは自明ではありませんが、現在では様々な構成法が知られています。たとえば、Kolmogorovの拡張定理を用いて無限次元のGauss仮定として構成する方法や、random walkをscale変換して無限に細かくしていく方法などがあります。本記事では、有界区間におけるBrown運動をGauss分布にしたがうランダムな係数をもつFourier級数として構成する方法をご紹介します。

定理1.(Brown運動の構成)\(\xi_0, \xi_1, \dots \)を独立な標準正規分布\( \mathscr{N}(0,1) \)にしたがう確率変数の列とする。このとき、\( t \in [0,\pi]\)に対して$$B_t(\omega) := \frac{t}{\sqrt{\pi}}\xi_0 (\omega) + \sqrt{\frac{2}{\pi}} \sum_{k=0}^\infty \sum_{j = 2^k + 1}^{2^{k+1}} \xi_j(\omega) \frac{\sin jt}{j}$$とおけば、\(B_t\)は\(t \in [0,\pi]\)のときBrown運動となる。
(証明)まず、\(B_t(\omega)\)が\(t\)に関してa.s. 一様収束することを示す。\(X_{m,n}(t) := \sum_{j = m+1}^n \xi_j \frac{\sin jt}{j}\)とおけば、\(X_{m,n}(t) = \mathrm{Im}(\sum_{j = m+1}^n \xi_j \frac{\exp ijt}{j})\)ゆえ、$$|X_{m,n}(t)|^2 = \left| \sum_{j = m+1}^n \xi_j \frac{\exp (ijt)}{j} \right|^2 = \sum_{j=m+1}^n \frac{\xi_j^2}{j^2} + 2\sum_{p=1}^{n-m+1} \left| \sum_{h = m+1}^{n - p} \frac{\xi_h \xi_{h+p}}{h(h+p)} \right| .$$\(T_{m,n}^2 := \sup_{t \in [0,\pi]}|X_{m,n}(t)|^2\)とおけば、$$E[T_{m,n}^2] \leq \sum{j=m+1}^n \frac{1}{j^2} + 2 \sum_{p =1 }^{n-m+1} \sqrt{\sum_{h = m+1}^{n-p} \frac{1}{h^2(h+p)^2}} \leq \frac{n-m}{m^2} + 2\frac{(n-m)\sqrt{n-m}}{m^2} .$$したがって、$$\sum_{k=0}^\infty E[T_{2^k,2^{k+1}}] \leq \sum_{k=0}^\infty \sqrt{E[T_{2^k,2^{k+1}}^2]} \leq \sum_{k=0}^\infty \sqrt{\frac{2^k}{2^{2k}} + 2\frac{2^k\sqrt{2^k}}{2^{2k}}} < \infty .$$\(\sum_{k=0}^\infty T_{2^k, 2^{k+1}}\)は正項級数なので、これにより概収束することがいえ、それは\(\sum_{k=0}^\infty X_{2^k, 2^{k+1}}(t)\)、さらに\(B_t = \frac{t}{\sqrt{pi}}\xi_0 + \sqrt{\frac{2}{\pi}} \sum_{k=0}^\infty X_{2^k,2^{k+1}}(t)\)が\(t\)に関して一様収束することをも意味する。
これで定義1の(ii)がいえた。(i)は\(t=0\)を代入すればよい。
最後に(iii)を示す。正整数\(l\)と、\(l\)個の実数\(0 = t_0 \leq t_1 \leq \cdots \leq t_l \leq \pi\)を任意にとる。\(B_t\)はGauss分布にしたがう確率変数の線形和だからGauss分布にしたがう。よって\( \{ B_{t_k} - B_{t_{k-1}} \}_{1 \leq k \leq l}\)の結合分布は\(l\)次元Gauss分布にしたがう。
\(B_t, B_sB_t\)の部分和はどちらも2乗可積分なので一様可積分である。よって\(\sum_{k=0}^\infty\)と\(E\)の順序を交換できて、$$\begin{align}E[B_t] &= 0 \quad ゆえに\ E[B_{t_k} - B_{t_{k-1}}] = 0,\ k = 1,\dots l \\ E[B_t B_s]&= \frac{ts}{\pi} + \frac{2}{\pi} \sum_{j = 0}^\infty \frac{\sin jt \sin js}{j^2} .\end{align}$$ここで、$$\begin{align} \int_0^\pi t \sin nt\, dt &= -\frac{\pi}{n} \cos n\pi \\ \int_0^\pi \min \{s,t\} \sin nt\, dt &= \frac{1}{n^2} \sin ns - \frac{s}{n} \cos n\pi \\ &= \frac{1}{n^2} \sin ns + \frac{s}{\pi} \int_0^\pi t \sin nt\, dt \end{align}$$なので、区間\([0,\pi]\)での正弦級数をとることにより$$\frac{ts}{\pi} + \frac{2}{\pi} \sum_{j=0}^\infty \frac{\sin jt \sin js}{j^2} = \min\{s,t\}$$を得るから、$$\begin{align} E[(B_{t_k} - B_{t_{k-1}})(B_{t_j} - B_{t_{j-1}})] &= \min\{t_k,t_j\} - \min\{t_k,t_{j-1}\} - \min\{t_{k-1},t_j\} + \min\{t_{k-1},t_{j-1}\} \\ &= \begin{cases} t_k - t_{k-1} & (j = k)\\ 0 & (j \not= k) \end{cases}.\end{align}$$となる。これにより(iii)もいえる。■

定理1で構成したのは有界区間\([0,\pi]\)上でのBrown運動ですが、区間を\([0,\infty)\)に拡張することもできます。実際、定理1によって構成されたBrown運動を独立で可算個用意し、それを\(\{ (B_t^{(i)})_{t \in [0,\pi]} \}_{i \in \mathbb{N}}\)とおけば、$$B_t := \sum_{i=1}^{\lfloor t/\pi \rfloor}B_{\pi}^{(i)} + B_{t - \lfloor t/\pi \rfloor \pi}^{(\lfloor t/\pi \rfloor + 1)} , \ t \geq 0$$によって定義された\( (B_t)_{t\geq 0}\)は区間\([0,\infty)\)でBrown運動になります。
以降、Brown運動\(B_t\)といえば以上の方法によって構成された確率過程のことをさすものとします。しかし、具体的な式を前提にすることはせず、定義1で仮定した性質(i),(ii),(iii)のみを出発点とします。Brown運動を特徴づけるうえでもっとも重要なものは(iii)で、多数の粒子から絶え間なく影響を受けることで不規則な運動が産まれるという発送がおd区立増分とGauss性によって実現されています。

Brown運動の基本的な性質

Brown運動の基本的な性質を示します。

命題1.\(t,s > 0\)に対して、$$E[B_t B_s] = \min \{ t,s \}$$である。
(証明) これは定理1の証明中で示されていることだが、改めて定義1の性質のみを用いて示す。
\(t \geq s \geq 0 \) として\(E[B_t B_s] = s\)をいえばよいが、$$\begin{align} E[B_tB_s] &= E[(B_t - B_s + B_s - B_0)(B_s - B_0)] \\ &= E[(B_t - B_s)(B_s - B_0)] + E[(B_s - B_0)^2]\\ &= s \end{align}$$なのでいえる。■
命題2.\(s>0,c>0\)を固定するとき、\(B_t^\prime(\omega) := B_{t+s}(\omega) - B_s(\omega),\ B_t^{\prime \prime}(\omega) := cB_{t/c^2}(\omega)\)によって新しく定義された確率過程\( (B_t^\prime(\omega))_{t \geq 0}, (B_t^{\prime \prime}(\omega))_{t \geq 0}\)もまたBrown運動である。
(証明) (i),(ii)は\(B_t\)が(i),(ii)をみたすことからすぐに出る。\(0 = t_0 < t_1 < \cdot < t_n ,\ n \in \mathbb{N}\)を任意にとると、$$\begin{align} \{ B_{t_j}^\prime - B_{t_{j-1}}^\prime \}_{1 \leq j \leq n} &= \{ B_{t_j+s} - B_{t_{j-1}+s} \}_{1 \leq j \leq n},\\ \{ B_{t_j}^{\prime \prime} - B_{t_{j-1}}^{\prime \prime} \}_{1 \leq j \leq n} &= \{ c(B_{t_j / c^2} - B_{t_{j-1} / c^2}) \}_{1 \leq j \leq n}\end{align}$$は\(B_t\)の性質(iii)からやはり独立で、平均\(0\)分散\(t_j - t_{j-1}\)のGauss分布にしたがう。よって(iii)もみたす。■
命題3.fを\(\mathbb{R}\)上有界連続関数とする。関数\(u \colon [0,\infty) \times \mathbb{R} \to \mathbb{R}\)を\(u(t,x) = E[f(x + B_t)]\)によって定義すれば、\(u\)は拡散方程式$$\frac{\partial u}{\partial t} = \frac{1}{2}\frac{\partial^2 u}{\partial x^2}$$の解である。
(証明) \(B_t = B_t - B_0\)は平均\(0\)分散\(t\)のGauss分布にしたがうので、$$u(t,x) = \int_{\mathbb{R}} f(x + y) p(t,y)\, dy = \int_\mathbb{R} f(z) p(t,z-x)\, dx$$である。ただし、Gauss分布の密度関数を\(p(t,y) := \frac{1}{\sqrt{2 \pi t}} \exp ( - \frac{y^2}{2t})\)とおいた。具体的な計算により、$$\frac{\partial p}{\partial t}(t,z-x) = \frac{1}{2}\frac{\partial^2}{\partial x^2}(t,z-x) = \frac{1}{2\sqrt{2 \pi t}} \left( \frac{(z-x)^2}{t^2} - \frac{1}{t} \right) \exp \left( - \frac{(z-x)^2}{2t} \right)$$だとわかる。これらに\(f(z)\)をかけて\(z\)について\(\mathbb{R}\)上積分した広義積分はパラメータ\(t\)に関しても\(x\)に関しても広義一様収束するので、積分記号下での微分が定義できて、拡散方程式をみたすことがわかる。■

命題4.\(0 \leq \forall T_1 < \forall T_2\)に対し\(B_t(\omega)\)の\(t \in [T_1, T_2]\)における全変動はa.s.無限大である。
(証明) \(B_t\)が区間\([T_1,T_2]\)で有界変動だとすると、命題1により、$$\frac{1}{\sqrt{T_2 - T_1}} (B_{t(T_2 - T_1) + T_1} - B_{T_1})$$は区間\([0,1]\)で有界変動なBrown運動になる。よって\(T_1 = 0, T_2 = 1\)の場合を示せばよい。
区間\([0,1]\)を\(n\)等分したときの\(B_t\)の2次変分$$\begin{align} X_n(\omega) &:= \sum_{k = 1}^n \Delta_{k,n}^2(\omega) ,\ n \in \mathbb{N}, \\ \Delta_{k,n}(\omega) &:= B_{k/n}(\omega) - B_{(k-1)/n}(\omega),\ k = 1,2,\dots ,n \end{align}$$を考える。\(E[(X_n - 1)^2]\)を求めよう。各\(\Delta_{k,n}\)は独立に平均\(0\)分散\(1/n\)のGauss分布にしたがうこと、\( (X_n -
1)^2\)を展開すると\(\Delta_{k,n}^4, \Delta_{k,n}^2\Delta_{j,n}^2, -\Delta_{k,n}^2, 1\)の形の項がそれぞれ\(n, n(n-1), 2n, 1\)個あることにより、$$E[(X_n - 1)^2] = \frac{3}{n^2} \cdot n + \frac{1}{n} \cdot \frac{1}{n} \cdot n (n-1) - \frac{1}{n} \cdot 2n + 1 \cdot 1 = \frac{2}{n}$$と計算できる。したがって\(E[(X_n - 1)^2] \to 0 (n \to \infty) \)、すなわち\(X_n\)は\(1\)に\(L^2\)の意味で収束する。
よって\(X_{n_i} \to 1\ \text{a.s.}\)となるような部分列\(\{n_i\}\)をとれる。\(B_t\)は\(t\)についてa.s.連続だから区間\([0,1]\)上一様連続であり、したがって$$\delta_n(\omega) := \max_{1 \leq k \leq n}|\Delta_{k,n}(\omega)|$$とおけば\(\delta \to 0\ \text{a.s.}\)である。ここで\(B_t(\omega)\)の区間\([0,1]\)での全変動を\(V(\omega)\)とおけば、$$V(\omega) \geq \sum_{k=1}^{n_i} |\Delta_{k,n_i}(\omega)| \geq \frac{X_{n_i}(\omega)}{\delta_{n_i}(\omega)}$$であるが、最右辺はいくらでも大きくできるので、結論を得る。■


次回に続きます。

順序の数量化と選好

レイ・フロンティア株式会社のデータアナリストの齋藤です。
今回は最近興味を持ち始めた、選好関係と呼ばれる2項関係と、選好の順序を数値によって表現する方法についてご紹介します。

全順序に関する数量化定理

対象の集合\(X\)に2項関係\(\precsim\)が導入されているとします。この関係が好み、すなわち選好関係(preference relation)を表現すると考えます。
\(x \precsim y\)かつ\(y \precsim x\)のことを\(x \sim y\)と書き、\(x \precsim y \)だが\(x \sim y\)でないことを\(x \prec y\)と書きます。\(x \precsim y\)のことを\(y \succsim x\)とも書きます。\(\prec\)と同様に、\(x \succsim y \)だが\(x \sim y\)でないことを\(x \succ y\)と書きます。
全順序の定義から、次の3つが成り立ちます:

全順序の公理(1) 完備性: \(\forall x,y \in X, x \precsim y \vee y \precsim x\)
(2) 反対称性: \(\forall x, y \in X, x \sim y \Rightarrow x = y\)
(3) 推移性: \(\forall x, y, z \in X, x \precsim y \wedge y \precsim z \Rightarrow x \precsim z\)
\(X\)は一般に数とは限らないいろいろな"もの"の集合ですが、\(X\)の元と数との間に選好関係を保つような対応があれば応用上有利です。ありがたいことに、\(X\)が高々可算であればそのような対応が存在することが知られています:
定理1.(全順序の数量化定理:有限集合の場合)有限集合\(X\)上の関係\(\precsim\)が全順序であるとき、\(X\)上の実数値関数\(\phi:X \to \mathbb{R}\)が存在して、$$\forall x,y \in X, \ x \succsim y \Leftrightarrow \phi(x) \geq \phi(y)$$
(証明) まず\(\Rightarrow\)を示す。\(x \succsim y\)を仮定する。推移性により、\(y \succsim z\)となるような任意の\(z \in X\)に対して\(x \succsim z\)が成立する。ゆえに、\(\{ z \mid x \succsim z \} \supseteq \{ z \mid y \succsim z \}\)である。ここで、有限集合\(A\)の要素の個数を\(\sharp A\)とし、関数\(\phi \colon X \to \mathbb{R}\)を$$\phi(x) := \sharp \{z \mid x \succsim z\}$$によって定める。この\(\phi\)について、\(\forall x,y \in X, x \succsim y \Rightarrow \phi(x) \geq \phi(y)\)が成り立つ。
つぎに\(\Leftarrow\)を示す。そのためには対偶を示せばよい。対偶は$$\forall x,y \in X,\ \lnot (x \succsim y) \Rightarrow \lnot (\phi(x) \geq \phi(y))$$であるが、完備性によりこの命題は$$\forall x,y \in X,\ y \succ x \Rightarrow \phi(x) < \phi(y)$$と同値である。ところが、\(y \succ x \)なるとき\(\{ z \mid x \succsim z \} \subsetneqq \{ z \mid y \succsim z \}\)であるため\(\phi(x) < \phi(y)\)である。以上で示された。■

この定理は\(X\)が可算無限集合の場合にも拡張できます:

定理2.(全順序の数量化定理:可算無限集合の場合)可算無限集合\(X\)上の関係\(\precsim\)が全順序であるとき、\(X\)上の実数値関数\(\phi:X \to \mathbb{R}\)が存在して、$$\forall x,y \in X, \ x \succsim y \Leftrightarrow \phi(x) \geq \phi(y)$$
(証明) まず\(\Rightarrow\)を示す。\(\forall x,y \in X, x \succsim y\)を仮定する。\(X\)の要素にてきとうな番号をふって\(X = \{x_1,x_2,\dots,x_i,\dots\}\)とし、二重数列\(S_{ij}\)を\(x_i \succsim x_j\)のとき\(S_{ij}=1\)、それ以外のとき\(S_{ij} = 0\)と定義する。そして、関数\(\phi \colon X \to \mathbb{R}\)を、$$\phi(x_i) := \sum_{j=1}^\infty \frac{1}{2^j}S_{ij}.$$無限級数が収束するのは明らかである。このように構成された関数\(\phi\)に対して、\(\forall x,y \in X,\ x \succsim y \Rightarrow \phi(x) \geq \phi(y)\)が成り立つ。
\(\Leftarrow\)の場合は定理1の証明と同様。■

弱順序に関する数量化定理

次は、全順序の代わりに、条件を弱めた弱順序を考えます。弱順序とは、以下の2つの公理

弱順序の公理(1) 完備性: \(\forall x,y \in X, x \precsim y \vee y \precsim x\)
(2) 推移性: \(\forall x, y, z \in X, x \precsim y \wedge y \precsim z \Rightarrow x \precsim z\)
をみたすような関係のことです。ちょうど順序関係から反対称性を取り除いたものになっています。選好を考えるうえでは、異なる対象を同じくらい選好することがありうるために、このような関係を考えるケースがあります。

弱順序についても、\(X\)が高々可算であれば数量化定理が成立します。

定理3.(弱順序の数量化定理:有限集合の場合)有限集合\(X\)上の関係\(\precsim\)が弱順序であるとき、\(X\)上の実数値関数\(\phi:X \to \mathbb{R}\)が存在して、$$\forall x,y \in X, \ x \succsim y \Leftrightarrow \phi(x) \geq \phi(y)$$
(証明) \( \sim \)は\(X\)上の関係とみなすとき同値関係である。したがって商集合\(X/\sim\)が定義できる。\(X/\sim\)上の関係\(\succsim^\prime\)を$$x \succsim y のとき [x] \succsim^\prime [y]$$であると定める(ただし、\(x\)を代表元とする同値類を\([x]\)と書いている)とこれはwell-definedであり、かつ\(\succsim^\prime\)は\(X/\sim\)上の全順序である。したがって、定理1により実数値関数\(\phi^\prime \colon X/\sim \to \mathbb{R}\)が存在して$$\forall a,b \in X/\sim, \ a \succsim^\prime b \Leftrightarrow \phi^\prime (a) \geq \phi^\prime (b)$$となる。関数\(\phi \colon X \to \mathbb{R}\)を\(x \in X,\ \phi(x) := \phi^\prime ([x])\)によって定めれば、$$\forall x,y \in X, \ x \succsim y \Leftrightarrow \phi(x) \geq \phi(y)$$は成り立っている。■

定理4.(弱順序の数量化定理:可算無限集合の場合)可算無限集合\(X\)上の関係\(\precsim\)が弱順序であるとき、\(X\)上の実数値関数\(\phi:X \to \mathbb{R}\)が存在して、$$\forall x,y \in X, \ x \succsim y \Leftrightarrow \phi(x) \geq \phi(y)$$
(証明) 定理3の証明の「定理1により」を「定理2により」に置き換えればよい。■

これらの定理は\(X\)がたかだか可算の場合に限られており、\(X\)が非可算集合の場合には一般に成立しません。証明は割愛しますが、非可算無限集合については以下の定理が成り立ちます:

定理5.(弱順序の数量化定理:非可算集合の場合)非可算無限集合\(X\)上の関係\(\precsim\)が弱順序であり、かつ商集合\(X/\sim\)が\(\succsim\)順序稠密な可算部分集合をもつとき、\(X\)上の実数値関数\(\phi:X \to \mathbb{R}\)が存在して、$$\forall x,y \in X, \ x \succsim y \Leftrightarrow \phi(x) \geq \phi(y)$$
\(X\)の部分集合\(Y\)が\(\leq\)順序稠密であるとは、任意の要素\(x,y\in X\)について、\(x \leq y\)でありかつ\(x,y \not\in Y\)であるとき、ある\(z \in Y\)が存在して\(x \leq z\)かつ\(z \leq y\)となることをいいます。順序稠密は順序関係のある種の"連続性"を示すものであり、たとえば\(\mathbb{Q}\)は\(\mathbb{R}\)に\(\leq\)順序稠密です。

参考文献

[1] 竹村和久, 藤井聡 (2015), "意思決定の処方", 朝倉書店

ZFC公理系について:その3

レイ・フロンティア株式会社のデータアナリストの齋藤です。
前前回前回につづいて、ZFC公理系の残りの公理を紹介していきます。

写像と選択公理

順序対、直積

ふだん慣れ親しんでいる数学的対象として、自然数などの数だけではなく、数と数の関係を定める関数(あるいは写像)があります。そこで、Zermelo-Fraenkelの立場から関数を構成することを考えてみましょう。
集合\(A\)から集合\(B\)への写像\(f \colon A \to B\)を集合論的に定義するためには、写像\(f\)のグラフというものを用います。\(f\)のグラフというのを直感的に説明すると、"\(A\)と\(B\)の直積"\(A times B\)の部分集合で、\( (x,f(x))\ (x\in a)\)というペアの全体から成るもののことです。\(A=B=\mathbb{R}\)の場合を考えると、関数\(f\)のグラフを座標平面にプロットしたものは、\(y=x^2\)のグラフは放物線などといったお馴染みの"グラフ"になります。
しかし、我々はまだ\(A\)と\(B\)の直積なるものを定義できていません。したがって、まずこの\(A \times B\)を定義するところから始めます。

集合\(a,b\)が与えられたとしましょう。それらの直積\(a\times b\)の元として我々が想定しているのは、\(a,b\)のそれぞれの元\(x,y\)のペア\( (x,y) \)のことです。そして、2つのペア\( (x,y) , (x^\prime, y^\prime)\)が等しいとは\(x=x^\prime , y=y^\prime\)が成り立つことでした。2つの集合の組として非順序対\( \{ a,b \}\)というのを以前考えましたが、\(\{ a,b\} = \{ b,a \}\)なので、これではうまくいきません。しかし、非順序対に一工夫加えることで、順序対を構成することができます。
次の補題が成り立ちます:

補題3.集合\(x,y,x^\prime, y^\prime \)について、次が成り立つ:$$\{ \{ x \}, \{ x , y \} \} = \{ \{ x^\prime \}, \{ x^\prime , y^\prime \} \} \Leftrightarrow x = x^\prime \wedge y = y^\prime .$$
集合\(x,y\)に対し、\( \{ \{ x \} , \{ x , y \} \} \)を\(x,y\)の順序対(ordered pair)と呼び、\( ( x , y ) \)と書きます。
\(x , y\)がそれぞれ集合\(a,b\)の元であるとき、\(\{ x \} , \{ x,y \} \subset a \cup b\)だから、\(\{ x \} , \{ x,y \} \)はともにべき集合\(\mathcal{P}(a\cup b)\)の元となります。したがって、$$ (x,y) = \{ \{ x \} , \{ x , y \} \} \in \mathcal{P} ( \mathcal{P} (a \cup b) )$$です。

集合\(a,b\)に対して、それらの直積(direct product)あるいはカルテシアン積(Cartesian product)\(a \times b\)を、$$a \times b = \{ u \in \mathcal{P}(\mathcal{P}(a \cup b )) \mid \exists x \exists y ( x \in a \wedge y \in b \wedge u = ( x , y ) ) \}$$によって定義します。"普通の言葉"で言えば、\(a \times b\)は\(a\)の元\(x\), \(b\)の元\(y\)の順序対\( (x,y) \)全体から成る集合です。合併集合の公理、分出公理、べき集合の公理によって\(a \times b\)の存在は保証され、外延性公理によって\(a \times b\)は\(a\)と\(b\)が与えられたとき確定します。上の定義により、$$u \in a \times b \Leftrightarrow \exists x \exists y ( x \in a \wedge y \in b \wedge u = (x,y) )$$となるので、とくに$$\emptyset \times b = \emptyset, \ a \times \emptyset = \emptyset$$が任意の集合\(a,b\)について成り立ちます。

写像、一般の直積、選択公理

さてこれから写像を定義するわけですが、その前により一般的な概念である"対応"の定義から始めましょう。集合\(a,b\)に対して、直積\(a \times b\)とその部分集合\(f\)の順序対\( (a \times b , f) \)を\(a\)から\(b\)への対応(correspondence)と呼び、\(f\)を対応\( (a \times b, f) \)のグラフ(graph)と呼びます。\(a,b\)が与えられているとき、\( (a \times b , f) \)をたんに対応\(f\)と言うこともあります。\(x \in a\)のとき、\( f(x) = \{ y \in b \mid (x, y) \in f \} \)とおき、\(f(x)\)を\(x\)の\(f\)による像(image)と呼びます。とくに、\(f(x) = \{ y \} ,\ y \in b\)のとき、たんに\(f(x) = y\)と書きます。\(a\)から\(b\)への対応\( (a \times b , f) \)が与えられたとき、これを"対応\(f \colon a \to b\)"と表します。また、集合\(\{ x \in a \mid f(x) \not= \emptyset \}\)を\(f\)の定義域(domain of definition)と呼び、これを\(\mathrm{Dom} f\)と書きます。また、部分集合\(a^\prime \subset a \)に対して、\(f[a^\prime] = \{ y \in b \mid \exists x (x \in a^\prime \wedge (x,y) \in f) \}\)とおけば、$$f[a^\prime] = \bigcup_{x \in a^\prime} f(x)$$となります。\(f[a^\prime]\)のことを\(f\)による\(a^\prime\)の像(image)と呼びます。\(f[a^\prime]\)のことを\(f(a^\prime)\)と書くこともあります。とくに、\(f[a]\)を\(f\)の像または値域と呼び、\(\mathrm{Im}f\)とも表します。
対応\(f\colon a \to b\)は、\(\mathrm{Dom} f = a\)かつ\(a\)の任意の元\(x\)に対して\(f(x)\)が\(b\)の元のシングルトンとなるとき、\(a\)から\(b\)への写像(mapping)と呼びます。たとえば、\(\mathbb{N}\)から\(\mathbb{N}\)への対応\(f\)として\(f = \{ (m,n) \in \mathbb{N} \times \mathbb{N} \mid n = m^+ \}\)をとるとき、この対応\(f \colon \mathbb{N} \to \mathbb{N}\)は\(\mathbb{N}\)から\(\mathbb{N}\)への写像であり、\(f(m) = m^+\)です。
もう一つ重要な例を挙げておきましょう。集合\(a\)に対して\(\Delta_a = \{ (x,y) \in a \times a \mid x = y \}\)を直積\(a \times a\)の対角線集合(diagonal set)と呼びます。\(f = \Delta_a\)とおけば、\( (a \times a , f)\)は\(a\)からそれ自身への写像であり、\(a\)の任意の元\(x\)について\(f(x) = x\)となります。この写像は\(a\)の恒等写像(identity mapping)と呼ばれ、\(\mathrm{id}_a\)または\(1_a\)などと表されます。
写像\(f \colon a \to b\)について\(f[a]=b\)のとき、\(f\)は\(a\)から\(b\)への全射(surjection)と呼ばれ、\(a\)の任意の元\(x,y\)に対して\(f(x)=f(y)\Rightarrow x=y\)が成り立つとき\(f\)は\(a\)から\(b\)への単射(injection)と呼ばれます。\(f\)が\(a\)から\(b\)への全射でありかつ単射でもあるとき、\(f\)は\(a\)から\(b\)への全単射(bijection)と呼ばれます。\(a\)から\(b\)への全単射が存在するとき\(a\)と\(b\)は対等(equivalent)であるといわれ、\(a\approx b\)と書かれます。
また、集合\(a,b\)が与えられたとき、写像\(f \colon a \to b\)は直積\(a \times b\)の部分集合のなかの特殊なものによって定まりますが、\(a\)から\(b\)への写像のグラフ全体からなる集まりは\(\mathcal{P}(a \times b)\)の部分集合です。この後者の集合を\(b^a\)と書くことにします。
\(a\)から\(b\)への対応\(f\)が与えられたとき、\(b\)から\(a\)への対応\(f^{-1}\)を$$f^{-1} = \{ (y,x) \in b \times a \mid (x,y) \in f \}$$によって定義し、\( (b \times a, f^{-1}\)または略して\(f^{-1}\)を\(f\)の逆対応とよびます。2つの対応\(f \colon a \to b\)と\(g \colon b \to c\)が与えられたとき、\(f,g\)の"合成"とよばれる対応\(g \circ f \colon a \to c\)が$$g \circ f = \{ (x,z) \in a \times c \mid f(x) \cap g^{-1}(z) \not= \phi \}$$というように定義されます。\(f \colon a \to b\)と\(g \colon b \to c\)がともに写像ならば、それらの合成\(g\circ f \colon a \to c\)も写像となり、\(x \in a\)に対して\( (g \circ f)(x) = g(f(x)) \)となります。


2つの集合の直積を定義し、それを用いて写像を定義することができました。しかし、実際にはもっと多くの個数、とくに無限に多くの集合の直積を考えたくなることがあります。そのような一般の直積を、写像を用いて定義します。
空でない集合\(I\)が与えられ、\(I\)から集合\(A\)への写像\(f\)が与えられているとき、順序対\( (f,f[I]) \)を\(I\)によって添数づけられた集合(indexed set)と呼び、\(I\)を\(f[I]\)の添数集合、\(I\)の元\(i\)を添数(index)と呼びます。\(f(i)\)を\(a_i\)とも書き、\( (f,f[I])\)を\(\{ a_i \}_{i \in I}\)のようにも書きます。また、このとき\(\cup f[I]\)のことを\(\cup_{i \in I}a_i\)とも書きます。
空集合とは異なる集合\(I\)によって添数づけられた集合\(\{ a_i \}_{i \in I}\)が与えられたとき、その直積とはつぎのような集合\(b\)のことをいいます:$$b = \left\{ \lambda \in \left( \bigcup_{i\in I}a_i \right)^I \middle| \forall i (i \in I \Rightarrow \lambda(i) \in a_i) \right\} .$$この集合\(b\)を\(\prod_{i \in I} a_i\)と表します。とくに、\(I = 2\)のときには、\(\prod_{i \in I} a_i \approx a_0 \times a_1\)となります。自然数\(n\)に対して\(I = n\)のとき、\(\prod_{i \in I} a_i\)は\(\prod_{i = 0}^{n-1} a_i\)または\(a_0 \times a_1 \times \cdots \times a_{n-1}\)というふうに表されます(正確には、自然数\(n\)の引き算を定義する必要があります)。
一般に、\(\lambda\)を直積\(\prod_{i \in I} a_i\)の元とすれば、\(\lambda\)は\(\lambda(i)\)によって定まるので、\(\lambda\)を\( (\lambda(i))_{i \in I}\)というふうに書きます。とくに、\(a_0 \times a_1 \times \cdots \times a_{n-1}\)の元は\( (\lambda(0), \lambda(1), \dots, \lambda(n-1))\)と書きます。こうして、我々がふだん使っている直積の姿が見えてきました。

さて、直積の定義から明らかに、\(a \not= \emptyset \)かつ\(b \not= \emptyset \)ならば\(a \times b \not= \emptyset\)です。それでは、一般に空集合とは異なる集合\(I\)によって添数づけられた集合\(\{ a_i \}_{i \in I}\)で、\(I\)の任意の元\(i\)に対して\(a_i \not= \emptyset\)なるものが与えられたとき、\(\prod_{i \in I} a_i\)は空集合ではないと言えるでしょうか。この問いに肯定的に答えるために考えられたのが、次の公理です:

(Set8) 選択公理$$\forall a \exists f [ f \in (\cup a)^a \wedge \forall x (x \in a \wedge x \not= \emptyset \Rightarrow f(x) \in x) ]$$
普通の言葉でいうと、「任意の集合\(a\)に対して、\(a\)から\(\cup a\)への写像\(f\)が存在し、\(a\)の任意の元で空集合とは異なるもの\(x\)に対して\(f(x) \in x\)となる」というものです。この公理は選択公理(axiom of choice)と呼ばれ、この公理によって存在を保証される写像\(f\)を、\(a\)の選択写像あるいは選択関数(choice function)と呼びます。
次が成り立ちます:
定理5.\(I\)を空集合とは異なる集合、\(\{ a_i \}_{i \in I}\)を\(I\)によって添数づけられた集合で、任意の\(i \in I\)に対して\(a_i \not= \emptyset\)であるものとする。このとき、直積\(\prod_{i \in I}a_i\)は空集合ではない。
(証明) \(A = \{ a_i \}_{i \in I}\)とおけば、定義により写像\(f \colon I \to A\)で\(f(i) = a_i\)となるものが存在する。\(F\)を\(A\)の選択関数とすれば、任意の\(i \in I\)に対して\(a_i \not= \emptyset \)だから、\(F(a_i) \in a_i\)となる。ここで、\(\lambda = F \circ f\)とおけば、\(\lambda\)は\(I\)から\(\cup A = \cup_{i \in I}a_i\)への写像であり、任意の\(i \in I\)について\(\lambda(i) = F(a_i) \in a_i\)となるから、\(\lambda \in \prod_{i \in I}a_i\)となる。■

順序数、ZFC公理系

順序関係と順序数

自然数、実数といった数の性質を調べるにあたっては、数の大小関係は重要です。そこで、数の大小関係の一般化にあたる"順序関係"を定義していきます。

集合\(a\)からそれ自身への対応\( (a \times a , f) \)あるいは単にそのグラフ\(f\)を、\(a\)の元の間の関係(relation)といいます。集合\(a\)の元の間の関係\(\prec\)について、\( (x,y) \in \prec \)のことを\(x \prec y\)と書くことにしましょう。つぎの条件$$\begin{align} &(1)\ \forall x (x \in a \Rightarrow x \prec x )\ (反射律) \\ &(2)\ x \prec y \wedge y \prec x \Rightarrow x=y\ (反対称律)\\ &(3)\ x \prec y \wedge y \prec z \Rightarrow x \prec z\ (推移律) \end{align}$$が成り立つとき、\(\prec\)を\(a\)の元の間の順序関係(order relation)と呼び、順序対\( (a,\prec) \)のことを順序集合(ordered set)と呼びます。上の(1),(2),(3)は順序の公理(axion of order)と呼ばれます。
\( (a,\prec) \)を順序集合、\(x,y \in a\)に対して、\(x \prec y \wedge x \not= y\)のとき\(x \precneqq y\)と書くことにします。\(x \in a\)に対して、\(a\)の部分集合で\(x\)の切片(segment)と呼ばれるものを$$s(x) = \{ y \in a \mid y \precneqq x \}$$と定めます。
\( (a,\prec) \)を順序集合、\( S \subset a\)とします。\(S\)の元\(s\)について\( \forall t (t \in S \Rightarrow s \prec t ) \)が成り立つとき、そのような\(s\)は一意的に定まり、それを\(S\)の(\(\prec\)に関する)最小元(minimum)と呼び、\(\min S\)と書きます。自然数全体の集合\(\mathbb{N}\)の重要な性質として、「\(\mathbb{N}\)の任意の空ではない部分集合が最小元をもつ」というものがありますが、一般に順序集合\( (a,\prec ) \)において、任意の空でない\(a\)の部分集合\(s\)について\(\min s\)が存在するとき、\( (a,\prec )\)または\(a\)を整列集合(well-ordered set)であるといいます。
順序集合\( (a,\prec_1 ), (b,\prec_2 ) \)および写像\(F\colon a \to b\)が与えられたとします。\(a\)の任意の元\(x,y\)について、$$x \prec_1 y \Rightarrow F(x) \prec_2 F(y)$$が成り立つとき、\(F\)は順序を保つ写像(order preserving mapping)と呼びます。\(F\)が\(a\)から\(b\)への全単射であれば\(F\)は\(a\)から\(b\)の上への順序同型写像(order isomorphism)といい、またこのとき\( (a,\prec_1) \)と\( (b,\prec_2) \)は順序同型(order isomorphic)であるといって\( (a,\prec_1) \simeq (b,\prec_2) \)または\(a \simeq b\)と書きます。たとえば恒等写像\(1_a\)は\(a\)からそれ自身への上への順序同型写像です。

ところで、自然数\(0, 1=\{ 0 \}, 2 = \{ 0,1 \} , 3 = \{ 0,1,2 \} , \dots \)や自然数全体の集合\(\mathbb{N}\)、\(\mathbb{N}^+ = \mathbb{N} \cup \{ \mathbb{N} \}\)などはみな包含関係について整列集合となっています。これらに共通する性質のひとつに、「\(x\)をこれらの中の任意のものの元とするとき、切片\(s(x)\)と\(x\)が相等しいものがある」というものがあります。一般に、\( (a,\prec) \)を整列集合とするとき、\(a\)の任意の元\(x\)について\(x = s(x)\)が成り立つならば、\( (a,\prec) \)(または\(a\))を順序数(ordinal number)と呼びます。自然数や\(\mathbb{N}\)などは順序数ですが、たとえば\(\{ 0,2 \}\)などは包含関係について整列集合とみなすとき順序数ではありません。
\( (a,\prec) \)を順序数としましょう。\(x ,y \in a \)とすると、\(x \precneqq y \Leftrightarrow x \in s(y) \Leftrightarrow x \in y \)、ゆえに\( x \precneqq y \Leftrightarrow x \in y\)が成り立ちます。さらに、\(x \precneqq y \Leftrightarrow s(x) \subsetneqq s(y)\)であるので、$$x \precneqq y \Leftrightarrow x \subsetneqq y \Leftrightarrow x \in y$$が成り立ちます。よって、このとき、順序関係\(\prec\)というのは包含関係\(\subset\)にほかならず、\(a\)の集合論的構造のみによって定まるのです。この事実からも、順序数\( (a,\prec) \)を単に\(a\)と表しても問題ないと納得がいくでしょう。

正則性公理

\(\alpha\)を任意の順序数とするとき、\(\alpha \in \alpha^+ \in (\alpha^+)^+ \in \cdots \)となり、このような列はいくらでも延ばすことができます。しかし、\(\alpha\)から"左へ"いくらでも列を延ばすことはできません。たとえば\(\alpha = 2\)とすれば\(2 \ni 1 \ni 0\)でストップです。
一般に、\(\alpha\)を任意の順序数とするとき、\(\alpha\)に含まれる元\(\beta\)で\(\gamma \in \beta \Rightarrow \gamma \not\in a\)が成り立つものが存在します(\(\beta = 0\)とすればよい)。このことがより一般的に成り立つことを主張するのが、つぎの公理です:

(Set9) 正則性公理$$\forall a [ a \not= \emptyset \Rightarrow \exists b (b \in a \wedge a \cap b = \emptyset) ]$$
普通の言葉でいうと、「空でない集合\(a\)に対して、その元\(b\)で、\(b\)のいかなる元も\(a\)には含まれないものが存在する」ということになります。
たとえば、\(x\)を任意の集合とし、\(a = \{ x \}\)とおけば、\(a\)の元は\(x\)のみなので、正則性公理から\(\{ x\} \cup x = \emptyset\)となり、したがって\(x \not\in x \)が成り立ちます。すなわち、正則性公理を仮定すれば、集合がそれ自身を元として含むという状況は起こらなくなります。

置換公理

順序数に関しては、次の定理が基本的です:

定理6.\( (a,\prec) \)を任意の整列集合とすると、順序数\(\alpha \)で\(a \simeq \alpha \)となるものが一意的に存在する。
実は、この定理の証明に困難が伴うのです。\(\alpha\)の存在を証明するためには超限帰納法というテクニックを用います。これについては割愛しますが、そのプロセスにおいて「\(s(x)\)の任意の元\(y\)に対して\(s(y) \simeq \alpha_y\)となるような順序数\(\alpha_y\)が存在する」ということを仮定して「\(s(x)\)と順序同型な順序数が存在する」ことを証明する場面が出てきます。\(s(x)\)と順序同型となるような順序数\(\alpha_x\)の候補として\(\alpha_y (y \in s(x))\)の合併集合が考えられますが、ここで困難が生じます。というのも、合併集合をとるためには"\(\alpha_y (y \in s(x))\)の全体"が集合であることが示されねばなりませんが、\(s(x)\)というのは今我々の持っている分出公理が使えないほどに"巨大な"集合なのです。
ここで、この困難を克服するために、つぎの公理が導入されます:
(Set6) 置換公理\(P(x,y)\)を\(x,y\)を自由変数とする命題とし、\(a\)を集合とするとき、次が成り立つ:$$\begin{align}& \forall x [ x \in a \Rightarrow \forall y \forall z ( P(x,y) \wedge P(x,z) \Rightarrow y = z ) ] \\ & \quad \quad \Rightarrow \exists b \forall u [u \in b \Rightarrow \exists x ( x \in a \wedge P(x,u) ) ] \end{align}$$
普通の言葉でいうと、「\(a\)の任意の元\(x\)に対して\(P(x,y)\)が成り立つような\(y\)が存在するならばそれは一意的だとしよう。そのとき、集合\(b\)で、\(P(x,u) (x \in a)\)を成り立たせるような\(u\)全体からなるものが存在する」ということです。

最後に、(Set1)-(Set9)から分出公理(Set6')が示されることを見ていきます。集合\(a\)が元\(x\)を含むとき、\(a\)の部分集合\(b\)で、$$t \in b \Leftrightarrow t \in a \wedge t\not= x$$を満たすものが存在することを示します。
\(a = \{x\}\)のときは、\(b = \emptyset\)とすればよいので、\(a \in y, y \not= x\)とします。命題\(P(s,t)\)として、$$(s \in a \wedge s \not= x \Rightarrow t=s) \wedge (s=x \Rightarrow t=y)$$をとると、置換公理によって、集合\(b\)で$$t \in b \Leftrightarrow \exists s (s \in a \wedge P(s,t))$$をみたすものが存在します。これは示したかった性質をみたしています。
このような集合\(b\)を\(a-\{x\}\)と書きましょう。いま\(a\)を集合、\(P(x)\)を\(x\)を自由変数とする命題とするとき、集合\(c\)で$$x \in c \Leftrightarrow x \in a \wedge P(x)$$をみたすものが存在することを示せば、分出公理が成り立つことがわかります。\(x,y\)についての命題\(Q(x,y)\)として、$$(x \in a \wedge P(x) \Rightarrow y = x) \wedge (x \in a \wedge \lnot P(x) \Rightarrow y = a)$$というものをとります。置換公理によって、集合\(b\)で、$$y \in b \Leftrightarrow \exists x (x \in a \wedge Q(x,y))$$をみたすものが存在します。\(b\)の元\(y\)は、\(a\)の元\(x\)で\(P(x)\)を成り立たせるものか、または\(a\)自身です。もし\(a\)の任意の元\(x\)について\(P(x)\)が成り立つならば、\(b = a\)が成り立ち、その場合では上のような\(c\)として\(a\)自身をとれば解決です。もし\(a\)の元\(x\)で\(\lnot P(x)\)となるようなものがあれば、そのような\(x\)に対して命題\(Q(x,a)\)が成り立つから、\(a \in b\)が成り立ちます。ここで\(c = b - \{a\}\)とおけば、\(c\)の元はすべて\(a\)の元\(x\)で\(P(x)\)を成り立たせるものであり、また逆に\(a\)の元\(x\)で\(P(x)\)を満たすようなものがあれば、正則性公理によって\(x\)は\(a\)自身ではないので、\(c\)の元となっています。よって\(c\)は求める集合です。これで分出公理が導かれました。

以上、紹介した9つの公理(Set1)-(Set9)のことをZermelo-Fraenkelの公理系、あるいはZFC公理系と呼びます。我々が当たり前のように使っている数学(のほとんど)は、これら僅か9個のルールを基礎として築き上げられているのです。

参考文献

[1] 彌永昌吉,彌永健一 (1990), "集合と位相", 岩波書店
[2] G. Takeuti, W. M. Zaring (1971), "Introduction to Axiomatic Set Theory", Springer-Verlag