Rei Frontier Tech Blog

人工知能を活用した位置情報分析プラットフォーム「SilentLog Analytics」を運営する、レイ・フロンティア株式会社のエンジニアメンバーで運営する技術ブログです。

Brown運動と確率積分:その2

レイ・フロンティア株式会社のデータアナリストの齋藤です。
前回の記事の続きを書いていきます。

Brown運動のHölder連続性

\( (B_t)_{t \geq 0}\)をBrown運動とします。
前記事で触れたように、Brown運動のsample pathは確率1で連続ですが無限の全変動をもちます。その他にも、確率1でいたるところ微分不可能であり、もっと詳しくいうと、1/2次Hölder連続よりもやや悪いくらいの連続性をもつことが知られています。本記事ではこれを示します。

次の定理を示します:

定理2.(Brown運動のHölder連続性)Brown運動\( (B_t)_{t \geq 0}\)に対して、$$\lim_{h \to 0} \sup_{\substack{0 \leq |s-t| \leq h \\ 0 \leq s,t \leq 1}}\frac{|B_s(\omega) - B_t(\omega)|}{\sqrt{2h\log 1/h}} = 1 \ \text{a.s.}$$が成り立つ。
(証明) まず下からの評価を示す。\(g(h) := \sqrt{2h\log 1/h}\)とおく。\(\forall \varepsilon > 0\)に対して、$$\begin{align} &P \left( \max_{1 \leq k \leq 2^n} \{ B_{k/2^n}(\omega) - B_{(k-1)/2^n}(\omega) \} \leq (1 - \varepsilon ) g(1/2^n) \right) \\ &= \left( 1 - \int_{(1 - \varepsilon) \sqrt{2 \log 2}\sqrt{n}} p(1,x)\, dx \right)^{2^n}\ (\because 定義1(iii)より)\\ & = (1 - I_n)^{2^n}\ (積分を I_n とおいた)\\ &< \exp(-2^n I_n) . \end{align}$$ここで、部分積分により、実数\(a > 0\)に対して、$$\int_a^\infty e^{-x^2/2}\, dx = \int_a^\infty \left( -\frac{1}{x} \right) \cdot \left( e^{-x^2/2} \right)^\prime\, dx = \frac{e^{-a^2/2}}{a} - \int_a^\infty \frac{1}{x^2} e^{-x^2/2}\, dx$$より、$$\frac{e^{-a^2/2}}{a} \geq \int_a^\infty e^{-x^2/2}\, dx \geq \frac{e^{-a^2/2}}{a} - \frac{1}{a^2} \int_a^\infty e^{-x^2/2}\, dx$$したがって$$\frac{e^{-a^2/2}}{a} \geq \int_a^\infty e^{-x^2/2}\, dx \geq \frac{e^{-a^2/2}}{a + 1/a} \qquad \cdots (\ast)$$を得る。これを用いると、十分大きな\(n\)について$$2^nI_n \geq Const. \times \frac{2^n}{\sqrt{n}}\exp(-(1 - \varepsilon)^2 \log 2 \times n) \geq 2^{\delta n} ,\ \delta > 0$$がいえる。\(exp(-2^{\delta n})\) は収束級数の一般項なので、Borel-Cantelliの補題により、$$P\left( \max_{1 \leq k \leq 2^n} \{ B_{k/2^n}(\omega) - B_{(k-1)/2^n}(\omega) \} \leq (1 - \varepsilon ) g(1/2^n)\ \text{i.o.} \right) = 0.$$これは$$\liminf_{n \to \infty} \max_{1 \leq k \leq 2^n} \frac{ B_{k/2^n}(\omega) - B_{(k-1)/2^n}(\omega) }{g(1/2^n)} > 1 - \varepsilon \quad \text{a.s.}$$を意味するが、$$\lim_{h \to 0} \sup_{\substack{0 \leq |s-t| \leq h \\ 0 \leq s,t \leq 1}}\frac{|B_s(\omega) - B_t(\omega)|}{\sqrt{2h\log 1/h}} \geq \liminf_{n \to \infty} \max_{1 \leq k \leq 2^n} \frac{ B_{k/2^n}(\omega) - B_{(k-1)/2^n}(\omega) }{g(1/2^n)}$$であり、\(\varepsilon > 0\)は任意だったので、下からの評価はいえた。
次に上からの評価を示す。\(\forall \varepsilon > 0\)について、\(\delta\)を\( (1 + \varepsilon)^2 > (1 + \delta)/(1 - \delta)\)をみたすように十分小さくとる。このとき、$$\begin{align}&P \left( \max_{\substack{1 \leq k = j - i \leq 2^{\delta n} \\ 0 \leq k < j \leq 2^n}} |B_{j / 2^n}(\omega) - B_{i / 2^n}(\omega)| \geq (1 + \varepsilon) g(k/2^n) \right) \\ &\leq \sum_{\substack{1 \leq k = j - i \leq 2^{\delta n} \\ 0 \leq k < j \leq 2^n}} 2 \int_{(1 + \varepsilon) \sqrt{2 \log (2^n / k)}}^\infty p(1,x)\, dx \quad (\because 定義 1 (iii)) \\&\leq Const. \times \frac{2^{(1 + \delta) n}2^{-(1 - \delta)(1 + \epsilon)^2 n}}{\sqrt{n}}\quad (\because 不等式(\ast))\\ &\leq \frac{2^{-\gamma n}}{\sqrt{n}},\quad \gamma > 0 \qquad (\because \delta のとり方から) \end{align}$$がいえる。\(2^{-\gamma n}/\sqrt{n}\)は収束級数の一般項なので、Borel-Cantelliの補題により、確率1で\(n_0 = n_0(\omega)\)が存在して、\(\forall n \geq n_0, \forall (j - i) = k \leq 2^{\delta n}\)に対して、$$|B_{j / 2^n}(\omega) - B_{i / 2^n}(\omega)| \leq (1 + \varepsilon)g(k/2^n)$$が成り立つ。いま、実数\(s,t\)を\(0 \leq s \leq t, 2^{-(n+1)(1-\delta)}\leq t - s \leq 2^{-n(1 - \delta)}\)となるようにとる。\(s,t\)を「2進数展開」し、$$\begin{align} & s = i/2^n - 1/2^{p_1} - 1/2^{p_2} - \cdots \quad (i,p_1,p_2, \dots は正整数, n < p_1 < p_2 < \cdots) \\& t = j/2^n + 1/2^{q_1} + 1/2^{q_2} - \cdots \quad (j,q_1,q_2, \dots は正整数, n < q_1 < q_2 < \cdots) \end{align}$$と表現すれば、\(i,j\)は\(s\leq i/2^n \leq j/2^n \leq t , 0 < k = j - i \leq (t - s) 2^n < 2^{\delta n}\)をみたす。\(s,t\)の最初の\(m\)項で打ち切った部分和を\(s_m , t_m\)とおけば、三角不等式により$$\begin{align}|B_t(\omega) - B_s(\omega)| &\leq \sum_{m = 1}^\infty |B_{t_{m+1}}(\omega) - B_{t_m}(\omega)| + |B_{i / 2^n}(\omega) - B_{j/2^n}(\omega)| + \sum_{m = 1}^\infty |B_{s_{m+1}}(\omega) - B_{s_m}(\omega)|\\ &\leq \sum_{p = n+1}^\infty (1 + \varepsilon) g(1/2^p) + (1 + \varepsilon) g(k/2^n) + \sum_{q = n+1}^\infty (1 + \varepsilon) g(1/2^q) \end{align}$$となる。十分大きい\(n\)に対して、$$\begin{align} \sum_{p = n+1}^\infty g(1/2^p) &= \sum_{p = n+1}^\infty \sqrt{2 \log 2 \cdot p/2^p} \\ &\leq \sum_{p=n+1}^\infty Const. \times \left( \sqrt{2 \log 2 \cdot p/2^p} - \sqrt{2 \log 2 \cdot (p-1)/2^{p-1}} \right)\\ &= Const. \times \sqrt{2 \log 2 \cdot n/2^n} \\ &= Const. \times g(1/2^n) \\ &< \varepsilon g(2^{-(n+1)(1-\delta)}) \end{align}$$したがって、$$|B_t(\omega) - B_s(\omega)| < (1 + 3 \varepsilon + 2 \varepsilon^2) g(t-s)$$を得る。これは$$\lim_{h \to 0} \sup_{\substack{0 \leq |s-t| \leq h \\ 0 \leq s,t \leq 1}}\frac{|B_s(\omega) - B_t(\omega)|}{\sqrt{2h\log 1/h}} \leq 1 + 3 \varepsilon + 2 \varepsilon^2$$を意味し、\(\varepsilon > 0\)は任意だったため上からの評価もいえた。■

定理2から、各\(t \in (0,\infty)\)に対して\(\frac{B_{t+h} - B_t}{h}\)は\(h \to 0\)で発散することがわかります。これまでの考察から、Brown運動は確率1で、「連続であるが、いたるところ微分不可能であり、任意の区間で無限に変動する」という、「普通の連続関数」とは異質なふるまいをすることがわかります。

Brown運動の微小変化

確率解析の理論においては、次の定理も重要です:

定理3.(Brown運動の2次変分)\(T > t > 0\)を固定し、\(\Delta_n = \{ 0 \leq t_1^{(n)} < t_2^{(n)} < \cdots \}, n = 1,2,\dots \)を区間\([0,T]\)の分割の列とし、\(\Delta_n(t) = \{ t_k^{(n)} \in \Delta_n ; t_k^{(n)} \leq t \} , |\Delta_n| = \sup_k |t_k^{(n)} - t_{k-1}^{(n)}| < \infty\)とする。このとき、$$\sum_{n = 1}^\infty |\Delta_n| < \infty$$ならば$$\lim_{n \to \infty}\sum_{t_k^{(n)} \in \Delta_n(t)}|B_{t_k^{(n)}}(\omega) - B_{t_{k-1}^{(n)}}(\omega)|^2 = t \qquad \text{a.s.}$$である。
(証明)$$V_n := \sum_{t_k^{(n)} \in \Delta_n(t)}\left( |B_{t_k^{(n)}} - B_{t_{k-1}^{(n)}}|^2 - (t_k^{(n)} - t_{k-1}^{(n)}) \right)$$とおく。定義1(iii)より、$$(E[V_n^2] = 2 \sum_{t_k^{(n)} \in \Delta_n(t)}(t_k^{(n)} - t_{k-1}^{(n)}) \leq 2 |\Delta_n| \sum_{t_k^{(n)} \in \Delta_n(t)}(t_k^{(n)} - t_{k-1}^{(n)}) \leq 2 t |\Delta_n|$$と計算できるから、仮定より、$$E\left[ \sum_{n=1}^\infty V_n^2 \right] = \sum_{n=1}^\infty E[V_n^2] \leq 2 t \sum_{n=1}^\infty |\Delta_n| < \infty . $$したがって、$$\sum_{n = 1}^\infty V_n^2 < \infty \qquad \text{a.s.}$$ゆえに、$$\lim_{n \to \infty} V_n = 0 \qquad \text{a.s.}.$$これと\(\sum_{t_k^{(n)} \in \Delta_n(t)}(t_k^{(n)} - t_{k-1}^{(n)}) \to t\)から結論が得られる。■

この結果は、標語的に言えば\(\int_0^t (dB_t)^2 = t\)ということで、微分の形で書けば$$(dB_t)^2 = dt$$となり、「Brown運動は時間変化の1/2乗くらいのひろがりをもつ」ということを意味します。このことは、今までに示してきた、

  • 共分散\(E[B_tB_s]\)が\(O(t)\)となること(命題1)
  • Brown運動の性質が時間を\(c^2\)倍に縮めて変異を\(c\)倍に伸ばすと保持されること(命題2)
  • 拡散方程式\(u_t = 1/2 u_{xx}\)の解が自然に得られること(命題3)
  • 各\( (B_t(\omega) )\)は1/2次くらいのHölder連続性をもつこと(定理2)

など様々な事実から類推されることですが、厳密には確率積分の理論によって定式化され、伊藤の公式とし知られています。

次回に続きます。

Brown運動と確率積分:その1

レイ・フロンティア株式会社のデータアナリストの齋藤です。
本記事から数回にわたって、Brown運動という数学モデルを紹介します。

Brown運動とは

Brown運動とは、もともとは液体中の微粒子が不規則に運動する現象のことをさします。植物学者ブラウン(Robert Brown)が浸透圧によって破裂した花粉から飛び出した粒子を観察した際に発見されたのがBrown運動のはじまりですが、1905年のアインシュタイン(Albert Einstein)の論文によって粒子の不規則な運動は水分子の衝突によるものであると説明され、原子と分子が存在する根拠にもなりました。
数学モデルとしてのBrown運動は、1923年にウィーナー(Norbert Wiener)によって確立されました。Brown運動は日本人数学者伊藤清が1942年に生み出した確率微分方程式の理論においても中心的な役割を果たし、現在では物理学、生物学、経済学など様々な分野に応用されています。
本記事では、数学モデルとしてのBrown運動の構成を提示し、独立増分性から導かれる性質をいくつか導いていきます。

Brown運動の定義と構成

Brown運動は、数学的には連続で独立増分をもちGauss分布にしたがう確率過程として定式化されます。より厳密に定義を述べると、以下のようになります:

定義1.(Brown運動)確率空間\( (\Omega, \mathcal{F}, P)\)上で定義された実数値確率過程\( B = (B_t)_{t \geq 0} \)がBrown運動(Brownian motion)であるとは、次の条件をみたすときにいう:
 (i) \(B_0 = 0\ \mathrm{a.s.} \)である。
 (ii) \(\mathrm{a.a.}\ \omega \in \Omega \)に対し、\( B_t (\omega) \)は\(t\)について連続である。
 (iii) \( 0 = t_0 < \forall t_1 < \cdots < \forall t_n ,\ \forall n \in \mathbb{N}\)に対し、増分\( \{ B_t - B_{t-1 }\}_{1 \geq i \geq n}\)は互いに独立で、それぞれ平均\(0\)、分散\(t_i - t_{i-1}\)のGauss分布にしたがう。
確率空間が与えられたとき、その空間にBrown運動が存在するかどうかは自明ではありませんが、現在では様々な構成法が知られています。たとえば、Kolmogorovの拡張定理を用いて無限次元のGauss仮定として構成する方法や、random walkをscale変換して無限に細かくしていく方法などがあります。本記事では、有界区間におけるBrown運動をGauss分布にしたがうランダムな係数をもつFourier級数として構成する方法をご紹介します。

定理1.(Brown運動の構成)\(\xi_0, \xi_1, \dots \)を独立な標準正規分布\( \mathscr{N}(0,1) \)にしたがう確率変数の列とする。このとき、\( t \in [0,\pi]\)に対して$$B_t(\omega) := \frac{t}{\sqrt{\pi}}\xi_0 (\omega) + \sqrt{\frac{2}{\pi}} \sum_{k=0}^\infty \sum_{j = 2^k + 1}^{2^{k+1}} \xi_j(\omega) \frac{\sin jt}{j}$$とおけば、\(B_t\)は\(t \in [0,\pi]\)のときBrown運動となる。
(証明)まず、\(B_t(\omega)\)が\(t\)に関してa.s. 一様収束することを示す。\(X_{m,n}(t) := \sum_{j = m+1}^n \xi_j \frac{\sin jt}{j}\)とおけば、\(X_{m,n}(t) = \mathrm{Im}(\sum_{j = m+1}^n \xi_j \frac{\exp ijt}{j})\)ゆえ、$$|X_{m,n}(t)|^2 = \left| \sum_{j = m+1}^n \xi_j \frac{\exp (ijt)}{j} \right|^2 = \sum_{j=m+1}^n \frac{\xi_j^2}{j^2} + 2\sum_{p=1}^{n-m+1} \left| \sum_{h = m+1}^{n - p} \frac{\xi_h \xi_{h+p}}{h(h+p)} \right| .$$\(T_{m,n}^2 := \sup_{t \in [0,\pi]}|X_{m,n}(t)|^2\)とおけば、$$E[T_{m,n}^2] \leq \sum{j=m+1}^n \frac{1}{j^2} + 2 \sum_{p =1 }^{n-m+1} \sqrt{\sum_{h = m+1}^{n-p} \frac{1}{h^2(h+p)^2}} \leq \frac{n-m}{m^2} + 2\frac{(n-m)\sqrt{n-m}}{m^2} .$$したがって、$$\sum_{k=0}^\infty E[T_{2^k,2^{k+1}}] \leq \sum_{k=0}^\infty \sqrt{E[T_{2^k,2^{k+1}}^2]} \leq \sum_{k=0}^\infty \sqrt{\frac{2^k}{2^{2k}} + 2\frac{2^k\sqrt{2^k}}{2^{2k}}} < \infty .$$\(\sum_{k=0}^\infty T_{2^k, 2^{k+1}}\)は正項級数なので、これにより概収束することがいえ、それは\(\sum_{k=0}^\infty X_{2^k, 2^{k+1}}(t)\)、さらに\(B_t = \frac{t}{\sqrt{pi}}\xi_0 + \sqrt{\frac{2}{\pi}} \sum_{k=0}^\infty X_{2^k,2^{k+1}}(t)\)が\(t\)に関して一様収束することをも意味する。
これで定義1の(ii)がいえた。(i)は\(t=0\)を代入すればよい。
最後に(iii)を示す。正整数\(l\)と、\(l\)個の実数\(0 = t_0 \leq t_1 \leq \cdots \leq t_l \leq \pi\)を任意にとる。\(B_t\)はGauss分布にしたがう確率変数の線形和だからGauss分布にしたがう。よって\( \{ B_{t_k} - B_{t_{k-1}} \}_{1 \leq k \leq l}\)の結合分布は\(l\)次元Gauss分布にしたがう。
\(B_t, B_sB_t\)の部分和はどちらも2乗可積分なので一様可積分である。よって\(\sum_{k=0}^\infty\)と\(E\)の順序を交換できて、$$\begin{align}E[B_t] &= 0 \quad ゆえに\ E[B_{t_k} - B_{t_{k-1}}] = 0,\ k = 1,\dots l \\ E[B_t B_s]&= \frac{ts}{\pi} + \frac{2}{\pi} \sum_{j = 0}^\infty \frac{\sin jt \sin js}{j^2} .\end{align}$$ここで、$$\begin{align} \int_0^\pi t \sin nt\, dt &= -\frac{\pi}{n} \cos n\pi \\ \int_0^\pi \min \{s,t\} \sin nt\, dt &= \frac{1}{n^2} \sin ns - \frac{s}{n} \cos n\pi \\ &= \frac{1}{n^2} \sin ns + \frac{s}{\pi} \int_0^\pi t \sin nt\, dt \end{align}$$なので、区間\([0,\pi]\)での正弦級数をとることにより$$\frac{ts}{\pi} + \frac{2}{\pi} \sum_{j=0}^\infty \frac{\sin jt \sin js}{j^2} = \min\{s,t\}$$を得るから、$$\begin{align} E[(B_{t_k} - B_{t_{k-1}})(B_{t_j} - B_{t_{j-1}})] &= \min\{t_k,t_j\} - \min\{t_k,t_{j-1}\} - \min\{t_{k-1},t_j\} + \min\{t_{k-1},t_{j-1}\} \\ &= \begin{cases} t_k - t_{k-1} & (j = k)\\ 0 & (j \not= k) \end{cases}.\end{align}$$となる。これにより(iii)もいえる。■

定理1で構成したのは有界区間\([0,\pi]\)上でのBrown運動ですが、区間を\([0,\infty)\)に拡張することもできます。実際、定理1によって構成されたBrown運動を独立で可算個用意し、それを\(\{ (B_t^{(i)})_{t \in [0,\pi]} \}_{i \in \mathbb{N}}\)とおけば、$$B_t := \sum_{i=1}^{\lfloor t/\pi \rfloor}B_{\pi}^{(i)} + B_{t - \lfloor t/\pi \rfloor \pi}^{(\lfloor t/\pi \rfloor + 1)} , \ t \geq 0$$によって定義された\( (B_t)_{t\geq 0}\)は区間\([0,\infty)\)でBrown運動になります。
以降、Brown運動\(B_t\)といえば以上の方法によって構成された確率過程のことをさすものとします。しかし、具体的な式を前提にすることはせず、定義1で仮定した性質(i),(ii),(iii)のみを出発点とします。Brown運動を特徴づけるうえでもっとも重要なものは(iii)で、多数の粒子から絶え間なく影響を受けることで不規則な運動が産まれるという発送がおd区立増分とGauss性によって実現されています。

Brown運動の基本的な性質

Brown運動の基本的な性質を示します。

命題1.\(t,s > 0\)に対して、$$E[B_t B_s] = \min \{ t,s \}$$である。
(証明) これは定理1の証明中で示されていることだが、改めて定義1の性質のみを用いて示す。
\(t \geq s \geq 0 \) として\(E[B_t B_s] = s\)をいえばよいが、$$\begin{align} E[B_tB_s] &= E[(B_t - B_s + B_s - B_0)(B_s - B_0)] \\ &= E[(B_t - B_s)(B_s - B_0)] + E[(B_s - B_0)^2]\\ &= s \end{align}$$なのでいえる。■
命題2.\(s>0,c>0\)を固定するとき、\(B_t^\prime(\omega) := B_{t+s}(\omega) - B_s(\omega),\ B_t^{\prime \prime}(\omega) := cB_{t/c^2}(\omega)\)によって新しく定義された確率過程\( (B_t^\prime(\omega))_{t \geq 0}, (B_t^{\prime \prime}(\omega))_{t \geq 0}\)もまたBrown運動である。
(証明) (i),(ii)は\(B_t\)が(i),(ii)をみたすことからすぐに出る。\(0 = t_0 < t_1 < \cdot < t_n ,\ n \in \mathbb{N}\)を任意にとると、$$\begin{align} \{ B_{t_j}^\prime - B_{t_{j-1}}^\prime \}_{1 \leq j \leq n} &= \{ B_{t_j+s} - B_{t_{j-1}+s} \}_{1 \leq j \leq n},\\ \{ B_{t_j}^{\prime \prime} - B_{t_{j-1}}^{\prime \prime} \}_{1 \leq j \leq n} &= \{ c(B_{t_j / c^2} - B_{t_{j-1} / c^2}) \}_{1 \leq j \leq n}\end{align}$$は\(B_t\)の性質(iii)からやはり独立で、平均\(0\)分散\(t_j - t_{j-1}\)のGauss分布にしたがう。よって(iii)もみたす。■
命題3.fを\(\mathbb{R}\)上有界連続関数とする。関数\(u \colon [0,\infty) \times \mathbb{R} \to \mathbb{R}\)を\(u(t,x) = E[f(x + B_t)]\)によって定義すれば、\(u\)は拡散方程式$$\frac{\partial u}{\partial t} = \frac{1}{2}\frac{\partial^2 u}{\partial x^2}$$の解である。
(証明) \(B_t = B_t - B_0\)は平均\(0\)分散\(t\)のGauss分布にしたがうので、$$u(t,x) = \int_{\mathbb{R}} f(x + y) p(t,y)\, dy = \int_\mathbb{R} f(z) p(t,z-x)\, dx$$である。ただし、Gauss分布の密度関数を\(p(t,y) := \frac{1}{\sqrt{2 \pi t}} \exp ( - \frac{y^2}{2t})\)とおいた。具体的な計算により、$$\frac{\partial p}{\partial t}(t,z-x) = \frac{1}{2}\frac{\partial^2}{\partial x^2}(t,z-x) = \frac{1}{2\sqrt{2 \pi t}} \left( \frac{(z-x)^2}{t^2} - \frac{1}{t} \right) \exp \left( - \frac{(z-x)^2}{2t} \right)$$だとわかる。これらに\(f(z)\)をかけて\(z\)について\(\mathbb{R}\)上積分した広義積分はパラメータ\(t\)に関しても\(x\)に関しても広義一様収束するので、積分記号下での微分が定義できて、拡散方程式をみたすことがわかる。■

命題4.\(0 \leq \forall T_1 < \forall T_2\)に対し\(B_t(\omega)\)の\(t \in [T_1, T_2]\)における全変動はa.s.無限大である。
(証明) \(B_t\)が区間\([T_1,T_2]\)で有界変動だとすると、命題1により、$$\frac{1}{\sqrt{T_2 - T_1}} (B_{t(T_2 - T_1) + T_1} - B_{T_1})$$は区間\([0,1]\)で有界変動なBrown運動になる。よって\(T_1 = 0, T_2 = 1\)の場合を示せばよい。
区間\([0,1]\)を\(n\)等分したときの\(B_t\)の2次変分$$\begin{align} X_n(\omega) &:= \sum_{k = 1}^n \Delta_{k,n}^2(\omega) ,\ n \in \mathbb{N}, \\ \Delta_{k,n}(\omega) &:= B_{k/n}(\omega) - B_{(k-1)/n}(\omega),\ k = 1,2,\dots ,n \end{align}$$を考える。\(E[(X_n - 1)^2]\)を求めよう。各\(\Delta_{k,n}\)は独立に平均\(0\)分散\(1/n\)のGauss分布にしたがうこと、\( (X_n -
1)^2\)を展開すると\(\Delta_{k,n}^4, \Delta_{k,n}^2\Delta_{j,n}^2, -\Delta_{k,n}^2, 1\)の形の項がそれぞれ\(n, n(n-1), 2n, 1\)個あることにより、$$E[(X_n - 1)^2] = \frac{3}{n^2} \cdot n + \frac{1}{n} \cdot \frac{1}{n} \cdot n (n-1) - \frac{1}{n} \cdot 2n + 1 \cdot 1 = \frac{2}{n}$$と計算できる。したがって\(E[(X_n - 1)^2] \to 0 (n \to \infty) \)、すなわち\(X_n\)は\(1\)に\(L^2\)の意味で収束する。
よって\(X_{n_i} \to 1\ \text{a.s.}\)となるような部分列\(\{n_i\}\)をとれる。\(B_t\)は\(t\)についてa.s.連続だから区間\([0,1]\)上一様連続であり、したがって$$\delta_n(\omega) := \max_{1 \leq k \leq n}|\Delta_{k,n}(\omega)|$$とおけば\(\delta \to 0\ \text{a.s.}\)である。ここで\(B_t(\omega)\)の区間\([0,1]\)での全変動を\(V(\omega)\)とおけば、$$V(\omega) \geq \sum_{k=1}^{n_i} |\Delta_{k,n_i}(\omega)| \geq \frac{X_{n_i}(\omega)}{\delta_{n_i}(\omega)}$$であるが、最右辺はいくらでも大きくできるので、結論を得る。■


次回に続きます。

順序の数量化と選好

レイ・フロンティア株式会社のデータアナリストの齋藤です。
今回は最近興味を持ち始めた、選好関係と呼ばれる2項関係と、選好の順序を数値によって表現する方法についてご紹介します。

全順序に関する数量化定理

対象の集合\(X\)に2項関係\(\precsim\)が導入されているとします。この関係が好み、すなわち選好関係(preference relation)を表現すると考えます。
\(x \precsim y\)かつ\(y \precsim x\)のことを\(x \sim y\)と書き、\(x \precsim y \)だが\(x \sim y\)でないことを\(x \prec y\)と書きます。\(x \precsim y\)のことを\(y \succsim x\)とも書きます。\(\prec\)と同様に、\(x \succsim y \)だが\(x \sim y\)でないことを\(x \succ y\)と書きます。
全順序の定義から、次の3つが成り立ちます:

全順序の公理(1) 完備性: \(\forall x,y \in X, x \precsim y \vee y \precsim x\)
(2) 反対称性: \(\forall x, y \in X, x \sim y \Rightarrow x = y\)
(3) 推移性: \(\forall x, y, z \in X, x \precsim y \wedge y \precsim z \Rightarrow x \precsim z\)
\(X\)は一般に数とは限らないいろいろな"もの"の集合ですが、\(X\)の元と数との間に選好関係を保つような対応があれば応用上有利です。ありがたいことに、\(X\)が高々可算であればそのような対応が存在することが知られています:
定理1.(全順序の数量化定理:有限集合の場合)有限集合\(X\)上の関係\(\precsim\)が全順序であるとき、\(X\)上の実数値関数\(\phi:X \to \mathbb{R}\)が存在して、$$\forall x,y \in X, \ x \succsim y \Leftrightarrow \phi(x) \geq \phi(y)$$
(証明) まず\(\Rightarrow\)を示す。\(x \succsim y\)を仮定する。推移性により、\(y \succsim z\)となるような任意の\(z \in X\)に対して\(x \succsim z\)が成立する。ゆえに、\(\{ z \mid x \succsim z \} \supseteq \{ z \mid y \succsim z \}\)である。ここで、有限集合\(A\)の要素の個数を\(\sharp A\)とし、関数\(\phi \colon X \to \mathbb{R}\)を$$\phi(x) := \sharp \{z \mid x \succsim z\}$$によって定める。この\(\phi\)について、\(\forall x,y \in X, x \succsim y \Rightarrow \phi(x) \geq \phi(y)\)が成り立つ。
つぎに\(\Leftarrow\)を示す。そのためには対偶を示せばよい。対偶は$$\forall x,y \in X,\ \lnot (x \succsim y) \Rightarrow \lnot (\phi(x) \geq \phi(y))$$であるが、完備性によりこの命題は$$\forall x,y \in X,\ y \succ x \Rightarrow \phi(x) < \phi(y)$$と同値である。ところが、\(y \succ x \)なるとき\(\{ z \mid x \succsim z \} \subsetneqq \{ z \mid y \succsim z \}\)であるため\(\phi(x) < \phi(y)\)である。以上で示された。■

この定理は\(X\)が可算無限集合の場合にも拡張できます:

定理2.(全順序の数量化定理:可算無限集合の場合)可算無限集合\(X\)上の関係\(\precsim\)が全順序であるとき、\(X\)上の実数値関数\(\phi:X \to \mathbb{R}\)が存在して、$$\forall x,y \in X, \ x \succsim y \Leftrightarrow \phi(x) \geq \phi(y)$$
(証明) まず\(\Rightarrow\)を示す。\(\forall x,y \in X, x \succsim y\)を仮定する。\(X\)の要素にてきとうな番号をふって\(X = \{x_1,x_2,\dots,x_i,\dots\}\)とし、二重数列\(S_{ij}\)を\(x_i \succsim x_j\)のとき\(S_{ij}=1\)、それ以外のとき\(S_{ij} = 0\)と定義する。そして、関数\(\phi \colon X \to \mathbb{R}\)を、$$\phi(x_i) := \sum_{j=1}^\infty \frac{1}{2^j}S_{ij}.$$無限級数が収束するのは明らかである。このように構成された関数\(\phi\)に対して、\(\forall x,y \in X,\ x \succsim y \Rightarrow \phi(x) \geq \phi(y)\)が成り立つ。
\(\Leftarrow\)の場合は定理1の証明と同様。■

弱順序に関する数量化定理

次は、全順序の代わりに、条件を弱めた弱順序を考えます。弱順序とは、以下の2つの公理

弱順序の公理(1) 完備性: \(\forall x,y \in X, x \precsim y \vee y \precsim x\)
(2) 推移性: \(\forall x, y, z \in X, x \precsim y \wedge y \precsim z \Rightarrow x \precsim z\)
をみたすような関係のことです。ちょうど順序関係から反対称性を取り除いたものになっています。選好を考えるうえでは、異なる対象を同じくらい選好することがありうるために、このような関係を考えるケースがあります。

弱順序についても、\(X\)が高々可算であれば数量化定理が成立します。

定理3.(弱順序の数量化定理:有限集合の場合)有限集合\(X\)上の関係\(\precsim\)が弱順序であるとき、\(X\)上の実数値関数\(\phi:X \to \mathbb{R}\)が存在して、$$\forall x,y \in X, \ x \succsim y \Leftrightarrow \phi(x) \geq \phi(y)$$
(証明) \( \sim \)は\(X\)上の関係とみなすとき同値関係である。したがって商集合\(X/\sim\)が定義できる。\(X/\sim\)上の関係\(\succsim^\prime\)を$$x \succsim y のとき [x] \succsim^\prime [y]$$であると定める(ただし、\(x\)を代表元とする同値類を\([x]\)と書いている)とこれはwell-definedであり、かつ\(\succsim^\prime\)は\(X/\sim\)上の全順序である。したがって、定理1により実数値関数\(\phi^\prime \colon X/\sim \to \mathbb{R}\)が存在して$$\forall a,b \in X/\sim, \ a \succsim^\prime b \Leftrightarrow \phi^\prime (a) \geq \phi^\prime (b)$$となる。関数\(\phi \colon X \to \mathbb{R}\)を\(x \in X,\ \phi(x) := \phi^\prime ([x])\)によって定めれば、$$\forall x,y \in X, \ x \succsim y \Leftrightarrow \phi(x) \geq \phi(y)$$は成り立っている。■

定理4.(弱順序の数量化定理:可算無限集合の場合)可算無限集合\(X\)上の関係\(\precsim\)が弱順序であるとき、\(X\)上の実数値関数\(\phi:X \to \mathbb{R}\)が存在して、$$\forall x,y \in X, \ x \succsim y \Leftrightarrow \phi(x) \geq \phi(y)$$
(証明) 定理3の証明の「定理1により」を「定理2により」に置き換えればよい。■

これらの定理は\(X\)がたかだか可算の場合に限られており、\(X\)が非可算集合の場合には一般に成立しません。証明は割愛しますが、非可算無限集合については以下の定理が成り立ちます:

定理5.(弱順序の数量化定理:非可算集合の場合)非可算無限集合\(X\)上の関係\(\precsim\)が弱順序であり、かつ商集合\(X/\sim\)が\(\succsim\)順序稠密な可算部分集合をもつとき、\(X\)上の実数値関数\(\phi:X \to \mathbb{R}\)が存在して、$$\forall x,y \in X, \ x \succsim y \Leftrightarrow \phi(x) \geq \phi(y)$$
\(X\)の部分集合\(Y\)が\(\leq\)順序稠密であるとは、任意の要素\(x,y\in X\)について、\(x \leq y\)でありかつ\(x,y \not\in Y\)であるとき、ある\(z \in Y\)が存在して\(x \leq z\)かつ\(z \leq y\)となることをいいます。順序稠密は順序関係のある種の"連続性"を示すものであり、たとえば\(\mathbb{Q}\)は\(\mathbb{R}\)に\(\leq\)順序稠密です。

参考文献

[1] 竹村和久, 藤井聡 (2015), "意思決定の処方", 朝倉書店

ZFC公理系について:その3

レイ・フロンティア株式会社のデータアナリストの齋藤です。
前前回前回につづいて、ZFC公理系の残りの公理を紹介していきます。

写像と選択公理

順序対、直積

ふだん慣れ親しんでいる数学的対象として、自然数などの数だけではなく、数と数の関係を定める関数(あるいは写像)があります。そこで、Zermelo-Fraenkelの立場から関数を構成することを考えてみましょう。
集合\(A\)から集合\(B\)への写像\(f \colon A \to B\)を集合論的に定義するためには、写像\(f\)のグラフというものを用います。\(f\)のグラフというのを直感的に説明すると、"\(A\)と\(B\)の直積"\(A times B\)の部分集合で、\( (x,f(x))\ (x\in a)\)というペアの全体から成るもののことです。\(A=B=\mathbb{R}\)の場合を考えると、関数\(f\)のグラフを座標平面にプロットしたものは、\(y=x^2\)のグラフは放物線などといったお馴染みの"グラフ"になります。
しかし、我々はまだ\(A\)と\(B\)の直積なるものを定義できていません。したがって、まずこの\(A \times B\)を定義するところから始めます。

集合\(a,b\)が与えられたとしましょう。それらの直積\(a\times b\)の元として我々が想定しているのは、\(a,b\)のそれぞれの元\(x,y\)のペア\( (x,y) \)のことです。そして、2つのペア\( (x,y) , (x^\prime, y^\prime)\)が等しいとは\(x=x^\prime , y=y^\prime\)が成り立つことでした。2つの集合の組として非順序対\( \{ a,b \}\)というのを以前考えましたが、\(\{ a,b\} = \{ b,a \}\)なので、これではうまくいきません。しかし、非順序対に一工夫加えることで、順序対を構成することができます。
次の補題が成り立ちます:

補題3.集合\(x,y,x^\prime, y^\prime \)について、次が成り立つ:$$\{ \{ x \}, \{ x , y \} \} = \{ \{ x^\prime \}, \{ x^\prime , y^\prime \} \} \Leftrightarrow x = x^\prime \wedge y = y^\prime .$$
集合\(x,y\)に対し、\( \{ \{ x \} , \{ x , y \} \} \)を\(x,y\)の順序対(ordered pair)と呼び、\( ( x , y ) \)と書きます。
\(x , y\)がそれぞれ集合\(a,b\)の元であるとき、\(\{ x \} , \{ x,y \} \subset a \cup b\)だから、\(\{ x \} , \{ x,y \} \)はともにべき集合\(\mathcal{P}(a\cup b)\)の元となります。したがって、$$ (x,y) = \{ \{ x \} , \{ x , y \} \} \in \mathcal{P} ( \mathcal{P} (a \cup b) )$$です。

集合\(a,b\)に対して、それらの直積(direct product)あるいはカルテシアン積(Cartesian product)\(a \times b\)を、$$a \times b = \{ u \in \mathcal{P}(\mathcal{P}(a \cup b )) \mid \exists x \exists y ( x \in a \wedge y \in b \wedge u = ( x , y ) ) \}$$によって定義します。"普通の言葉"で言えば、\(a \times b\)は\(a\)の元\(x\), \(b\)の元\(y\)の順序対\( (x,y) \)全体から成る集合です。合併集合の公理、分出公理、べき集合の公理によって\(a \times b\)の存在は保証され、外延性公理によって\(a \times b\)は\(a\)と\(b\)が与えられたとき確定します。上の定義により、$$u \in a \times b \Leftrightarrow \exists x \exists y ( x \in a \wedge y \in b \wedge u = (x,y) )$$となるので、とくに$$\emptyset \times b = \emptyset, \ a \times \emptyset = \emptyset$$が任意の集合\(a,b\)について成り立ちます。

写像、一般の直積、選択公理

さてこれから写像を定義するわけですが、その前により一般的な概念である"対応"の定義から始めましょう。集合\(a,b\)に対して、直積\(a \times b\)とその部分集合\(f\)の順序対\( (a \times b , f) \)を\(a\)から\(b\)への対応(correspondence)と呼び、\(f\)を対応\( (a \times b, f) \)のグラフ(graph)と呼びます。\(a,b\)が与えられているとき、\( (a \times b , f) \)をたんに対応\(f\)と言うこともあります。\(x \in a\)のとき、\( f(x) = \{ y \in b \mid (x, y) \in f \} \)とおき、\(f(x)\)を\(x\)の\(f\)による像(image)と呼びます。とくに、\(f(x) = \{ y \} ,\ y \in b\)のとき、たんに\(f(x) = y\)と書きます。\(a\)から\(b\)への対応\( (a \times b , f) \)が与えられたとき、これを"対応\(f \colon a \to b\)"と表します。また、集合\(\{ x \in a \mid f(x) \not= \emptyset \}\)を\(f\)の定義域(domain of definition)と呼び、これを\(\mathrm{Dom} f\)と書きます。また、部分集合\(a^\prime \subset a \)に対して、\(f[a^\prime] = \{ y \in b \mid \exists x (x \in a^\prime \wedge (x,y) \in f) \}\)とおけば、$$f[a^\prime] = \bigcup_{x \in a^\prime} f(x)$$となります。\(f[a^\prime]\)のことを\(f\)による\(a^\prime\)の像(image)と呼びます。\(f[a^\prime]\)のことを\(f(a^\prime)\)と書くこともあります。とくに、\(f[a]\)を\(f\)の像または値域と呼び、\(\mathrm{Im}f\)とも表します。
対応\(f\colon a \to b\)は、\(\mathrm{Dom} f = a\)かつ\(a\)の任意の元\(x\)に対して\(f(x)\)が\(b\)の元のシングルトンとなるとき、\(a\)から\(b\)への写像(mapping)と呼びます。たとえば、\(\mathbb{N}\)から\(\mathbb{N}\)への対応\(f\)として\(f = \{ (m,n) \in \mathbb{N} \times \mathbb{N} \mid n = m^+ \}\)をとるとき、この対応\(f \colon \mathbb{N} \to \mathbb{N}\)は\(\mathbb{N}\)から\(\mathbb{N}\)への写像であり、\(f(m) = m^+\)です。
もう一つ重要な例を挙げておきましょう。集合\(a\)に対して\(\Delta_a = \{ (x,y) \in a \times a \mid x = y \}\)を直積\(a \times a\)の対角線集合(diagonal set)と呼びます。\(f = \Delta_a\)とおけば、\( (a \times a , f)\)は\(a\)からそれ自身への写像であり、\(a\)の任意の元\(x\)について\(f(x) = x\)となります。この写像は\(a\)の恒等写像(identity mapping)と呼ばれ、\(\mathrm{id}_a\)または\(1_a\)などと表されます。
写像\(f \colon a \to b\)について\(f[a]=b\)のとき、\(f\)は\(a\)から\(b\)への全射(surjection)と呼ばれ、\(a\)の任意の元\(x,y\)に対して\(f(x)=f(y)\Rightarrow x=y\)が成り立つとき\(f\)は\(a\)から\(b\)への単射(injection)と呼ばれます。\(f\)が\(a\)から\(b\)への全射でありかつ単射でもあるとき、\(f\)は\(a\)から\(b\)への全単射(bijection)と呼ばれます。\(a\)から\(b\)への全単射が存在するとき\(a\)と\(b\)は対等(equivalent)であるといわれ、\(a\approx b\)と書かれます。
また、集合\(a,b\)が与えられたとき、写像\(f \colon a \to b\)は直積\(a \times b\)の部分集合のなかの特殊なものによって定まりますが、\(a\)から\(b\)への写像のグラフ全体からなる集まりは\(\mathcal{P}(a \times b)\)の部分集合です。この後者の集合を\(b^a\)と書くことにします。
\(a\)から\(b\)への対応\(f\)が与えられたとき、\(b\)から\(a\)への対応\(f^{-1}\)を$$f^{-1} = \{ (y,x) \in b \times a \mid (x,y) \in f \}$$によって定義し、\( (b \times a, f^{-1}\)または略して\(f^{-1}\)を\(f\)の逆対応とよびます。2つの対応\(f \colon a \to b\)と\(g \colon b \to c\)が与えられたとき、\(f,g\)の"合成"とよばれる対応\(g \circ f \colon a \to c\)が$$g \circ f = \{ (x,z) \in a \times c \mid f(x) \cap g^{-1}(z) \not= \phi \}$$というように定義されます。\(f \colon a \to b\)と\(g \colon b \to c\)がともに写像ならば、それらの合成\(g\circ f \colon a \to c\)も写像となり、\(x \in a\)に対して\( (g \circ f)(x) = g(f(x)) \)となります。


2つの集合の直積を定義し、それを用いて写像を定義することができました。しかし、実際にはもっと多くの個数、とくに無限に多くの集合の直積を考えたくなることがあります。そのような一般の直積を、写像を用いて定義します。
空でない集合\(I\)が与えられ、\(I\)から集合\(A\)への写像\(f\)が与えられているとき、順序対\( (f,f[I]) \)を\(I\)によって添数づけられた集合(indexed set)と呼び、\(I\)を\(f[I]\)の添数集合、\(I\)の元\(i\)を添数(index)と呼びます。\(f(i)\)を\(a_i\)とも書き、\( (f,f[I])\)を\(\{ a_i \}_{i \in I}\)のようにも書きます。また、このとき\(\cup f[I]\)のことを\(\cup_{i \in I}a_i\)とも書きます。
空集合とは異なる集合\(I\)によって添数づけられた集合\(\{ a_i \}_{i \in I}\)が与えられたとき、その直積とはつぎのような集合\(b\)のことをいいます:$$b = \left\{ \lambda \in \left( \bigcup_{i\in I}a_i \right)^I \middle| \forall i (i \in I \Rightarrow \lambda(i) \in a_i) \right\} .$$この集合\(b\)を\(\prod_{i \in I} a_i\)と表します。とくに、\(I = 2\)のときには、\(\prod_{i \in I} a_i \approx a_0 \times a_1\)となります。自然数\(n\)に対して\(I = n\)のとき、\(\prod_{i \in I} a_i\)は\(\prod_{i = 0}^{n-1} a_i\)または\(a_0 \times a_1 \times \cdots \times a_{n-1}\)というふうに表されます(正確には、自然数\(n\)の引き算を定義する必要があります)。
一般に、\(\lambda\)を直積\(\prod_{i \in I} a_i\)の元とすれば、\(\lambda\)は\(\lambda(i)\)によって定まるので、\(\lambda\)を\( (\lambda(i))_{i \in I}\)というふうに書きます。とくに、\(a_0 \times a_1 \times \cdots \times a_{n-1}\)の元は\( (\lambda(0), \lambda(1), \dots, \lambda(n-1))\)と書きます。こうして、我々がふだん使っている直積の姿が見えてきました。

さて、直積の定義から明らかに、\(a \not= \emptyset \)かつ\(b \not= \emptyset \)ならば\(a \times b \not= \emptyset\)です。それでは、一般に空集合とは異なる集合\(I\)によって添数づけられた集合\(\{ a_i \}_{i \in I}\)で、\(I\)の任意の元\(i\)に対して\(a_i \not= \emptyset\)なるものが与えられたとき、\(\prod_{i \in I} a_i\)は空集合ではないと言えるでしょうか。この問いに肯定的に答えるために考えられたのが、次の公理です:

(Set8) 選択公理$$\forall a \exists f [ f \in (\cup a)^a \wedge \forall x (x \in a \wedge x \not= \emptyset \Rightarrow f(x) \in x) ]$$
普通の言葉でいうと、「任意の集合\(a\)に対して、\(a\)から\(\cup a\)への写像\(f\)が存在し、\(a\)の任意の元で空集合とは異なるもの\(x\)に対して\(f(x) \in x\)となる」というものです。この公理は選択公理(axiom of choice)と呼ばれ、この公理によって存在を保証される写像\(f\)を、\(a\)の選択写像あるいは選択関数(choice function)と呼びます。
次が成り立ちます:
定理5.\(I\)を空集合とは異なる集合、\(\{ a_i \}_{i \in I}\)を\(I\)によって添数づけられた集合で、任意の\(i \in I\)に対して\(a_i \not= \emptyset\)であるものとする。このとき、直積\(\prod_{i \in I}a_i\)は空集合ではない。
(証明) \(A = \{ a_i \}_{i \in I}\)とおけば、定義により写像\(f \colon I \to A\)で\(f(i) = a_i\)となるものが存在する。\(F\)を\(A\)の選択関数とすれば、任意の\(i \in I\)に対して\(a_i \not= \emptyset \)だから、\(F(a_i) \in a_i\)となる。ここで、\(\lambda = F \circ f\)とおけば、\(\lambda\)は\(I\)から\(\cup A = \cup_{i \in I}a_i\)への写像であり、任意の\(i \in I\)について\(\lambda(i) = F(a_i) \in a_i\)となるから、\(\lambda \in \prod_{i \in I}a_i\)となる。■

順序数、ZFC公理系

順序関係と順序数

自然数、実数といった数の性質を調べるにあたっては、数の大小関係は重要です。そこで、数の大小関係の一般化にあたる"順序関係"を定義していきます。

集合\(a\)からそれ自身への対応\( (a \times a , f) \)あるいは単にそのグラフ\(f\)を、\(a\)の元の間の関係(relation)といいます。集合\(a\)の元の間の関係\(\prec\)について、\( (x,y) \in \prec \)のことを\(x \prec y\)と書くことにしましょう。つぎの条件$$\begin{align} &(1)\ \forall x (x \in a \Rightarrow x \prec x )\ (反射律) \\ &(2)\ x \prec y \wedge y \prec x \Rightarrow x=y\ (反対称律)\\ &(3)\ x \prec y \wedge y \prec z \Rightarrow x \prec z\ (推移律) \end{align}$$が成り立つとき、\(\prec\)を\(a\)の元の間の順序関係(order relation)と呼び、順序対\( (a,\prec) \)のことを順序集合(ordered set)と呼びます。上の(1),(2),(3)は順序の公理(axion of order)と呼ばれます。
\( (a,\prec) \)を順序集合、\(x,y \in a\)に対して、\(x \prec y \wedge x \not= y\)のとき\(x \precneqq y\)と書くことにします。\(x \in a\)に対して、\(a\)の部分集合で\(x\)の切片(segment)と呼ばれるものを$$s(x) = \{ y \in a \mid y \precneqq x \}$$と定めます。
\( (a,\prec) \)を順序集合、\( S \subset a\)とします。\(S\)の元\(s\)について\( \forall t (t \in S \Rightarrow s \prec t ) \)が成り立つとき、そのような\(s\)は一意的に定まり、それを\(S\)の(\(\prec\)に関する)最小元(minimum)と呼び、\(\min S\)と書きます。自然数全体の集合\(\mathbb{N}\)の重要な性質として、「\(\mathbb{N}\)の任意の空ではない部分集合が最小元をもつ」というものがありますが、一般に順序集合\( (a,\prec ) \)において、任意の空でない\(a\)の部分集合\(s\)について\(\min s\)が存在するとき、\( (a,\prec )\)または\(a\)を整列集合(well-ordered set)であるといいます。
順序集合\( (a,\prec_1 ), (b,\prec_2 ) \)および写像\(F\colon a \to b\)が与えられたとします。\(a\)の任意の元\(x,y\)について、$$x \prec_1 y \Rightarrow F(x) \prec_2 F(y)$$が成り立つとき、\(F\)は順序を保つ写像(order preserving mapping)と呼びます。\(F\)が\(a\)から\(b\)への全単射であれば\(F\)は\(a\)から\(b\)の上への順序同型写像(order isomorphism)といい、またこのとき\( (a,\prec_1) \)と\( (b,\prec_2) \)は順序同型(order isomorphic)であるといって\( (a,\prec_1) \simeq (b,\prec_2) \)または\(a \simeq b\)と書きます。たとえば恒等写像\(1_a\)は\(a\)からそれ自身への上への順序同型写像です。

ところで、自然数\(0, 1=\{ 0 \}, 2 = \{ 0,1 \} , 3 = \{ 0,1,2 \} , \dots \)や自然数全体の集合\(\mathbb{N}\)、\(\mathbb{N}^+ = \mathbb{N} \cup \{ \mathbb{N} \}\)などはみな包含関係について整列集合となっています。これらに共通する性質のひとつに、「\(x\)をこれらの中の任意のものの元とするとき、切片\(s(x)\)と\(x\)が相等しいものがある」というものがあります。一般に、\( (a,\prec) \)を整列集合とするとき、\(a\)の任意の元\(x\)について\(x = s(x)\)が成り立つならば、\( (a,\prec) \)(または\(a\))を順序数(ordinal number)と呼びます。自然数や\(\mathbb{N}\)などは順序数ですが、たとえば\(\{ 0,2 \}\)などは包含関係について整列集合とみなすとき順序数ではありません。
\( (a,\prec) \)を順序数としましょう。\(x ,y \in a \)とすると、\(x \precneqq y \Leftrightarrow x \in s(y) \Leftrightarrow x \in y \)、ゆえに\( x \precneqq y \Leftrightarrow x \in y\)が成り立ちます。さらに、\(x \precneqq y \Leftrightarrow s(x) \subsetneqq s(y)\)であるので、$$x \precneqq y \Leftrightarrow x \subsetneqq y \Leftrightarrow x \in y$$が成り立ちます。よって、このとき、順序関係\(\prec\)というのは包含関係\(\subset\)にほかならず、\(a\)の集合論的構造のみによって定まるのです。この事実からも、順序数\( (a,\prec) \)を単に\(a\)と表しても問題ないと納得がいくでしょう。

正則性公理

\(\alpha\)を任意の順序数とするとき、\(\alpha \in \alpha^+ \in (\alpha^+)^+ \in \cdots \)となり、このような列はいくらでも延ばすことができます。しかし、\(\alpha\)から"左へ"いくらでも列を延ばすことはできません。たとえば\(\alpha = 2\)とすれば\(2 \ni 1 \ni 0\)でストップです。
一般に、\(\alpha\)を任意の順序数とするとき、\(\alpha\)に含まれる元\(\beta\)で\(\gamma \in \beta \Rightarrow \gamma \not\in a\)が成り立つものが存在します(\(\beta = 0\)とすればよい)。このことがより一般的に成り立つことを主張するのが、つぎの公理です:

(Set9) 正則性公理$$\forall a [ a \not= \emptyset \Rightarrow \exists b (b \in a \wedge a \cap b = \emptyset) ]$$
普通の言葉でいうと、「空でない集合\(a\)に対して、その元\(b\)で、\(b\)のいかなる元も\(a\)には含まれないものが存在する」ということになります。
たとえば、\(x\)を任意の集合とし、\(a = \{ x \}\)とおけば、\(a\)の元は\(x\)のみなので、正則性公理から\(\{ x\} \cup x = \emptyset\)となり、したがって\(x \not\in x \)が成り立ちます。すなわち、正則性公理を仮定すれば、集合がそれ自身を元として含むという状況は起こらなくなります。

置換公理

順序数に関しては、次の定理が基本的です:

定理6.\( (a,\prec) \)を任意の整列集合とすると、順序数\(\alpha \)で\(a \simeq \alpha \)となるものが一意的に存在する。
実は、この定理の証明に困難が伴うのです。\(\alpha\)の存在を証明するためには超限帰納法というテクニックを用います。これについては割愛しますが、そのプロセスにおいて「\(s(x)\)の任意の元\(y\)に対して\(s(y) \simeq \alpha_y\)となるような順序数\(\alpha_y\)が存在する」ということを仮定して「\(s(x)\)と順序同型な順序数が存在する」ことを証明する場面が出てきます。\(s(x)\)と順序同型となるような順序数\(\alpha_x\)の候補として\(\alpha_y (y \in s(x))\)の合併集合が考えられますが、ここで困難が生じます。というのも、合併集合をとるためには"\(\alpha_y (y \in s(x))\)の全体"が集合であることが示されねばなりませんが、\(s(x)\)というのは今我々の持っている分出公理が使えないほどに"巨大な"集合なのです。
ここで、この困難を克服するために、つぎの公理が導入されます:
(Set6) 置換公理\(P(x,y)\)を\(x,y\)を自由変数とする命題とし、\(a\)を集合とするとき、次が成り立つ:$$\begin{align}& \forall x [ x \in a \Rightarrow \forall y \forall z ( P(x,y) \wedge P(x,z) \Rightarrow y = z ) ] \\ & \quad \quad \Rightarrow \exists b \forall u [u \in b \Rightarrow \exists x ( x \in a \wedge P(x,u) ) ] \end{align}$$
普通の言葉でいうと、「\(a\)の任意の元\(x\)に対して\(P(x,y)\)が成り立つような\(y\)が存在するならばそれは一意的だとしよう。そのとき、集合\(b\)で、\(P(x,u) (x \in a)\)を成り立たせるような\(u\)全体からなるものが存在する」ということです。

最後に、(Set1)-(Set9)から分出公理(Set6')が示されることを見ていきます。集合\(a\)が元\(x\)を含むとき、\(a\)の部分集合\(b\)で、$$t \in b \Leftrightarrow t \in a \wedge t\not= x$$を満たすものが存在することを示します。
\(a = \{x\}\)のときは、\(b = \emptyset\)とすればよいので、\(a \in y, y \not= x\)とします。命題\(P(s,t)\)として、$$(s \in a \wedge s \not= x \Rightarrow t=s) \wedge (s=x \Rightarrow t=y)$$をとると、置換公理によって、集合\(b\)で$$t \in b \Leftrightarrow \exists s (s \in a \wedge P(s,t))$$をみたすものが存在します。これは示したかった性質をみたしています。
このような集合\(b\)を\(a-\{x\}\)と書きましょう。いま\(a\)を集合、\(P(x)\)を\(x\)を自由変数とする命題とするとき、集合\(c\)で$$x \in c \Leftrightarrow x \in a \wedge P(x)$$をみたすものが存在することを示せば、分出公理が成り立つことがわかります。\(x,y\)についての命題\(Q(x,y)\)として、$$(x \in a \wedge P(x) \Rightarrow y = x) \wedge (x \in a \wedge \lnot P(x) \Rightarrow y = a)$$というものをとります。置換公理によって、集合\(b\)で、$$y \in b \Leftrightarrow \exists x (x \in a \wedge Q(x,y))$$をみたすものが存在します。\(b\)の元\(y\)は、\(a\)の元\(x\)で\(P(x)\)を成り立たせるものか、または\(a\)自身です。もし\(a\)の任意の元\(x\)について\(P(x)\)が成り立つならば、\(b = a\)が成り立ち、その場合では上のような\(c\)として\(a\)自身をとれば解決です。もし\(a\)の元\(x\)で\(\lnot P(x)\)となるようなものがあれば、そのような\(x\)に対して命題\(Q(x,a)\)が成り立つから、\(a \in b\)が成り立ちます。ここで\(c = b - \{a\}\)とおけば、\(c\)の元はすべて\(a\)の元\(x\)で\(P(x)\)を成り立たせるものであり、また逆に\(a\)の元\(x\)で\(P(x)\)を満たすようなものがあれば、正則性公理によって\(x\)は\(a\)自身ではないので、\(c\)の元となっています。よって\(c\)は求める集合です。これで分出公理が導かれました。

以上、紹介した9つの公理(Set1)-(Set9)のことをZermelo-Fraenkelの公理系、あるいはZFC公理系と呼びます。我々が当たり前のように使っている数学(のほとんど)は、これら僅か9個のルールを基礎として築き上げられているのです。

参考文献

[1] 彌永昌吉,彌永健一 (1990), "集合と位相", 岩波書店
[2] G. Takeuti, W. M. Zaring (1971), "Introduction to Axiomatic Set Theory", Springer-Verlag

ZFC公理系について:その2

レイ・フロンティア株式会社のデータアナリストの齋藤です。
本記事の目的は、自然数全体の集合\(\mathbb{N}\)を定義し、その性質(の一部)を述べることです。

べき集合の公理、自然数の全体

自然数の話に戻ります。前記事で得られた、空集合0とその後継ぎ1,2,...の"全体"の集まりを\(\mathbb{N}\)とするのが、いかにも自然な発想であるように思われます。しかし、今無限公理によって存在が保証されているのは、あくまで0とその後継ぎたちを全て含む集合(すなわち、無限系譜)だけです。そのような集合は、"自然数"だけではなく、その他にいろいろ余計な元を含んでいる可能性があります。そこで、ある一つの無限系譜(それには自然数が全て含まれています)をてきとうにとり、それに含まれる無限系譜すべての共通部分をとればよいのではないか? というアイデアを思いつきます。これを実行するには、また新しい公理を加えねばなりません。というのも、ある無限系譜が与えられたときに、「それに含まれる無限系譜の全体」は集合だろうか? という問いに答えられないからです。この問いを一般化すると、「集合\(a\)が与えられたとき、"\(a\)の部分集合全体"は集合になるか?」ということになりますが、これに肯定的に答えるために以下の公理を導入します:

(Set7) べき集合の公理$$\forall a \exists b \forall x (x\in b \Leftrightarrow x \subset a) .$$
普通の言葉で言うと、「任意の集合\(a\)に対して、\(a\)の部分集合全体から成る集合\(b\)が存在する」ということです。この集合\(b\)は\(a\)のべき集合(power set)とよばれ、\(\mathcal{P}(a)\)と表されます。

さて、いよいよ自然数全体の定義に入りましょう。まず集合\(x\)について、「\(x\)は無限系譜である」という命題を\(M(x)\)で表します。論理式で書くと、\(M(x)\)とは、$$\emptyset \in x \wedge \forall y (y \in x \Rightarrow y^+ \in x)$$ということです。空集合とは異なる集合\(a\)に対して、$$\forall x(x \in a \Rightarrow M(x))$$が成り立つとき、\(a\)を無限樹と呼ぶことにします。たとえば、ある無限系譜\(x\)のシングルトン\(\{x\}\)は無限樹です。無限公理によって、無限樹は少なくとも一つ存在します。てきとうな無限樹をとって、共通部分をとることによって樹の"枝"を刈り取り、\(\mathbb{N}\)という一本の幹を切り出そうという魂胆です。
明らかに次の補題が成り立ちます:

補題1.無限系譜\(a,b\)について以下が成り立つ:
(i) \(\cap a\)は無限系譜である。
(ii) \(a \subset b \Rightarrow \cap a \supset \cap b .\)
さて、\(a\)を無限系譜として、$$\tilde a = \{x \in \mathcal{P}(z) \mid M(x)\}$$
とおきます。すなわち、\(\tilde a\)は\(a\)に部分集合として含まれる無限系譜全体からなる集合です。べき集合と分出公理と無限公理によって\(\tilde a\)は集合であり、外延性公理によって\(\tilde a\)は\(a\)によって確定します。さらに、\(a \tilde \ni a\)だから\(\tilde a \not= \emptyset \)であり、\(\tilde a\)は無限樹となっています。
$$\omega_a = \bigcap \tilde a$$とおきます。補題1によって\(\omega_a\)は無限系譜であり、\(\omega_a \in \tilde a\)が成り立ちます。いま、\(b\)を任意の無限系譜とすると、\(a\cap b\)もまた無限系譜なので、補題1により\(\omega_{a\cap b} \supset \omega_a\)となります。
ここで、\(z\)を\(\omega_{a\cap b}\)の任意の元とし、\(x \in \tilde a\)とします。すると、\(x \cap b \subset a \cap b\)であり、しかも\(x\cap b\)は無限系譜となるので\(x\cap b \in \widetilde {a \cap b}\)、ゆえに\(z \in x\cap b\)、したがって\(z \in x\)が成り立ちます。これにより\(z \in \omega_a\)が成り立つので、\(\omega_{a\cap b} \subset \omega_a\)、したがって\(\omega_{a\cap b} = \omega_a\)です。\(a,b\)は任意の無限系譜であったので、\(\omega_a = \omega_{a\cap b} = \omega_b\)となります。よって、無限系譜\(\omega_a\)は\(a\)の選び方によらずに確定し、しかも任意の無限系譜の部分集合になることがわかりました。この\(\omega_a\)を\(\mathbb{N}\)と書き、自然数全体の集合と呼びます。\(\mathbb{N}\)は0,1,2,...を元として含んでおり、\(\mathbb{N}\)の元を自然数(natural number)と呼びます。

ペアノの公理

前節の議論によって、我々はついに当初の目的であった「自然数の全体」という、具体的でかつ非自明な集合を手に入れることができました。しかし、果たしてこの集合を、我々がふだん接している"自然数の全体"であると言ってもよいのでしょうか。たとえば、定義から\(1 \subset 2 \subset 3 \subset \cdots\)のような関係が成り立ちますが、これは"普通の自然数"を考えるときにはちょっと馴染みの薄い光景です。しかし、考えようによっては、これは単に我々が自然数を定義するために上記のような方法をとったために産まれた"副産物"にすぎず、自然数としての"算術的性質"さえ満たされていれば、あとは"普通の自然数"として扱えても差し支えない、と思うこともできます。では、今我々が構成した"集合論的自然数"が"普通の自然数"と同じような"算術的性質"をもつことが示されるでしょうか?

自然数のもつべき"算術的性質"には、大小関係、足し算掛け算等々いろいろありますが、それらはいくつかの基本的な性質から証明できます(長くなるので、本記事では扱いません)。そのような基本的性質として挙げられるのが、ペアノ(Peano)の公理です。すなわち、集合\(a\)がつぎの命題たちを満たしていれば、\(a\)は"自然数の集合の算術的性質"を満たすことが示されます:

Peanoの公理(P1) \(x \in a\)ならば\(x^\prime\)と表される\(a\)の元が確定する。
(P2) \(a\)の元\(\nu\)で、\(a\)の任意の元\(x\)に対して\(x^\prime \not = \nu\)となるものが存在する。
(P3) \(b\subset a, \nu \in b\)かつ\(\forall x (x \in b \Rightarrow x^\prime \in b)\)が成り立てば\(b = a\)である。
(P4) \(x\in a, y \in a\)かつ\(x^\prime = y^\prime\)ならば\(x=y\)である。

そして、この性質は今定義した\(\mathbb{N}\)についても無事成立します。

定理3.集合\(\mathbb{N}\)について、Peanoの公理が成り立つ。ただし、\(x \in \mathbb{N}\)について\(x^\prime = x^+ = x \cup \{x\}\)とし、\(\nu = 0 = \emptyset\)とする。
(証明) (P1)が成り立つことは明らか。また、(P3)に現れる\(b\)は無限系譜であるから、\(\mathbb{N} \subset b \mathbb{N}\)ゆえに\(b = \omega\)だから(P3)が成り立つ。(P2)についても、\(\nu = 0 = \emptyset \)であり、なおかつ\(x^\prime = x \cup \{x\} \in x\)なので\(x^\prime \not= 0\)となる。
(P4)を示すために、\(x \in \omega, y \in \omega\)とし、\(x^+ = y^+\)としよう。\(x \in x^+ = y^+ = y \cup \{y\}\)であるから、\(x \in y\)と\(x = y\)のどちらかが成り立つ。同様にして、\(y \in x^+\)であるから、\(y \in x\)または\(y = x\)が成り立つ。
つぎの補題が成り立つとしよう(証明は後で述べる):

補題2.\(\mathbb{N}\)の元\(x,y\)について、\(x \in y \Leftrightarrow x \subsetneqq y .\)

\(x \in y\)かつ\(y \in x\)であると仮定する。上の議論により、\(x^+ = y^+ \Rightarrow x = y \vee (x \in y \wedge y \in x)\)であるが、補題2により\(x \in y \wedge y \in x \Rightarrow x \subsetneqq y \wedge y \subsetneqq x \Leftrightarrow x \subset y \wedge y \subset x \wedge x \not= y\)となり、一番右の命題は\( (x = y) \wedge \lnot (x = y)\)を意味するので矛盾。したがって\(x^+ = y^+ \Rightarrow x = y\)が成り立つ。■

最後に、仕上げとして補題2を証明しましょう。

(補題2の証明) \(y = 0 = \emptyset\)ならば、どのような\(x\)に対しても\(x \in y \)も\(x \subsetneqq y\)も成立しない。したがって、\(P,Q\)を任意の命題とするとき、\(x \in 0 \Rightarrow P\)と\(x \subsetneqq 0 \Rightarrow Q\)がともに成立する。ゆえに、このとき補題は成り立つ。
さて、上の議論のなかで、\(\mathbb{N}\)に関して(P3)が成り立つことは補題を用いずに証明されているので、\(\mathbb{N}\)の元\(y\)に関する次の命題\(P_1, P_2\)が示されればよい:$$\begin{align} &P_1: \forall x(x \in \mathbb{N} \wedge x \in y \Rightarrow x\subsetneqq y)\ \Rightarrow \ \forall x(x \in \mathbb{N} \wedge x \in y^+ \Rightarrow x\subsetneqq y^+) \\ &P_2: \forall x(x \in \mathbb{N} \wedge x \subsetneqq y \Rightarrow x\in y)\ \Rightarrow \ \forall x(x \in \mathbb{N} \wedge x \subsetneqq y^+ \Rightarrow x\in y^+) \end{align}$$まず\(P_1\)を示そう。\(x\in \mathbb{N}\)にたいして、\(x \in y^+ = y \cup \{y\}\)となれば、\(x \in y \vee x = y\)である。もし\(x \in y\) ならば、仮定により\(x \subsetneqq y\)であり、ゆえに\(x \subsetneqq y^+\)となる。また\(x=y\)ならば明らかに\(x \subset y^+\)であるから、\(y \not= y^+\)が示されれば\(x \subsetneqq y^+\)が示される。もし\(y = y^+\)ならば、\(y^+\)の定義から\(y \in y\)となるが、仮定と\(x=y\)より\(y \subsetneqq y\)、とくに\(y \not= y\)となるので矛盾である。したがって、\(y \subsetneqq y^+\)となって、\(P_1\)は示された。
次に、\(P_2\)が成り立つことを示そう。\(x \in \mathbb{N}\)について\(x \subsetneqq y^+\)となると仮定する。もし\(y \in x\)ならば\(P_1\)により\(y \subsetneqq x\)となり、ゆえに\(y \cup \{y\} \subset x\)となるが、これは\(x \subsetneqq y^+\)に反する。よって\(y \not\in x \)であるが、このとき\(x \subsetneqq y^+ = y \cup \{y\}\)から\(x \subset y\)がいえる。\(x \subset y \Leftrightarrow x \subsetneqq y \vee x = y\)である。仮定から\(x \subsetneqq y \Rightarrow x \in y \Rightarrow x \in y^+\)であり、しかも\(x=y \Rightarrow x \in y^+\)であるから、\(P_2\)は成り立つ。■

補題2の証明で活躍した公理(P3)は数学的帰納法の原理とも呼ばれています。実際、Peanoの公理は高校数学などでもお馴染みの数学的帰納法の定理を含んでいます:

定理4.(数学的帰納法)自然数\(n\)に関する命題\(P(n)\)について、つぎの(i),(ii)が成り立てば、任意の自然数\(n\)について\(P(n)\)が成り立つ:
(i) \(P(0). \)
(ii) \(\forall n (n \in \mathbb{N} \wedge P(n) \Rightarrow P(n^+)). \)

これでようやく、集合の公理を基礎として自然数および自然数全体の集合\(\mathbb{N}\)を、期待される算術的性質を満たす形で構成することができました。ここでは取り上げませんが、これらの公理を用いて、有理数、実数、複素数なども構成されます。では集合の公理はこれで全部としてよいのかというとそんなことはなく、様々な"無限集合"同士を比較するために新しい公理が必要となります。本記事もずいぶん長くなってしまいました。残りのZFCの公理の紹介は次回の記事で行いたいと思います。

次回に続きます。

ZFC公理系について:その1

レイ・フロンティア株式会社のデータアナリストの齋藤です。
今回皆様にお話するのは、現代数学の土台であり、我々が普段接する数学的対象をつくる素材を提供してくれる、ZFC公理系にまつわるお話です。

はじめに

集合とは「ものの集まり」を厳密に考える数学的対象のことで、数や図形、関数など現代の数学に登場するほとんど全ての概念が集合の言葉で書かれていると言っても過言ではありません。
集合が何たるかについては、集合論の創始者といわれるゲオルク・カントール(Georg Cantor)の著書"超限集合論"のつぎの言葉によって的確に表現されています:

'集合'とは一つの総体\(M\)であり、それを形成するもの\(m\)(それは\(M\)の'要素'とよばれる)は、それぞれ確定し、互いに識別され得る、われわれの直感または思惟の対象である。
カントールは集合論の研究を推し進め、数や図形にとどまらず、"ものの集まり"として考えることのできるあらゆるものを数学の対象にしようと試みました。しかし、そのような試みは集合論の内部からパラドックスの数々が見出されたことで致命的な危機にさらされることになりました。
(初期)集合論のパラドックスの一つとして有名なのが、ラッセル(Russell)のパラドックスでしょう。それは次のようなものです。集合について考えるとき、できるだけ普遍的な集合を想定するのが自然な考え方ですが、最も普遍的な集合は何かというと、それは「集合全体からなる集合\(\mathbb{S}\)」でしょう。\(\mathbb{S}\)はそれ自体が集合なので、当然\(\mathbb{S}\)の要素です。しかし、たとえば自然数の集合\(\mathbb{N}\)それ自体は自然数ではないので、\(\mathbb{N}\)の要素ではありません。このように、集合、すなわち\(\mathbb{S}\)の要素の中には「自分自身を要素として含まない集合」が存在しています。そのような集合の全体を\(\mathbb{A}\)とおきます。
さて、\(\mathbb{A}\)という集合は\(\mathbb{A}\)の要素でしょうか。もしYesであるならば、\(\mathbb{A}\)の定義により\(\mathbb{A}\)は\(\mathbb{A}\)の要素ではなくなってしまうので矛盾です。Noであるならば、やはり\(\mathbb{A}\)の定義により\(\mathbb{A}\)は\(\mathbb{A}\)の要素になってしまうのでこれまた矛盾してしまいます。
このようなパラドックスを回避するために、ツェルメロ(Zermelo)らによって集合論の公理系が整備されました。現代の数学者のほとんどはZFCと呼ばれる、ツェルメロとフレンケル(Fraenkel)による8つの公理に選択公理(Axiom of Choice)と呼ばれる公理を付け加えた公理系のもとで展開される数学を研究しています。そこでは、自然数や実数、関数、ベクトルと行列などなど身近な数学的対象は問題なく構成されており、私たちは(それなりに)安心して数学を利用することができています。
本記事の目標は、このZFC公理系に含まれる公理たちを、身近な数学的対象の代表といえる自然数とその全体\(\mathbb{N}\)を構成しながら紹介することです。

命題と論理式

命題(proposition)とは、数学的対象について論理記号や演算記号などを用いて記述された文章で、真であるかあるいは偽であるという性質をもつものです。たとえば、"\(1+1=2\)"であるとか、"\(\ \triangle ABC\)において\(AB=AC\)"などがそれに該当します。
与えられた命題\(P\)に対して、その否定、すなわち"\(P\)ではない"という命題のことを、$$\lnot P$$と書きます。また、命題\(P,Q\)が与えられたとき、"\(P\)または\(Q\)"という命題のことを\(P \vee Q\)と書き、"\(P\)かつ\(Q\)"のことを\(P \wedge Q\)と書きます。"\(P\)ならば\(Q\)"という命題は\(P \Rightarrow Q\)あるいは\(Q \Leftarrow P\)と書きます。これは\(\lnot P \vee Q\)と同じ意味です。命題\(P \Rightarrow Q \wedge P \Leftarrow Q\)のことを\(P \Leftrightarrow Q\)と書き、これが成り立つとき\(P\)と\(Q\)は同値であるといいます。
対象\(x\)についての命題を\(P(x)\)のように表すことがあります。\(P(x)\)は\(x\)を変数(variable)とする命題とよびます。この場合、\(x\)はある決まった集まり(あるいは族)に属するものとされます。
(与えられた族に属する)任意の対象\(x\)について、命題\(P(x)\)が成り立つことを主張する命題を、$$\forall xP(x)$$と書きます。また、対象\(x\)で命題\(P(x)\)が成立するようなものが存在するという命題を、$$\exists xP(x)$$と書きます。
これらの記号を用いて、たとえば、与えられた族に属する対象\(x\)についての命題\(P(x)\)が与えられたとき、$$\lnot (\forall xP(x)) \Leftrightarrow \exists x\lnot P(x)$$である……といった風な表現がなされます。これから説明していくZFC公理系の一つ一つも、これらの記号を組み合わせた論理式によって表現されます。

外延性公理と集合

集合論で扱われる対象のことを集合(set)とよびます。正確には、以下に述べる公理(Set1)-(Set9)をみたす対象のことを集合といいます。9つの公理を設ける目的は、数や関数などの大昔から広く受け入れられている数学的対象の諸々を再構成し、なおかつ"集合全体の集合"といったあまりに"大きすぎる"集まりを集合の世界から締め出すことにあります。
集合論的な命題を作るために、新しい記号\(\in, \ni\)を導入しましょう。命題$$a \in b \quad (または\ b \ni a)$$は、「\(a\)は\(b\)の元(または要素)(element)である」といい、否定命題\(\lnot (a \in b)\)のことを$$a \not\in b \quad (または\ b \not\ni a)$$と書きます。
ここで、最初の公理をおきましょう:

(Set1) 外延性公理$$\forall a \forall b [ a = b \Leftrightarrow \forall x (x \in a \Leftrightarrow x \in b)] .$$
外延性公理を"普通の言葉"で述べると、「任意の集合\(a,b\)について、\(a=b\)であるための必要十分条件は、任意の\(x\)に対して\(x \in a \Leftrightarrow x \in b\)が成り立つことである」となります。この公理によれば、集合は「それがどんな元を含むか」によって決定されるのです。集合の元どうしがどのように関係しあっていたとしても、その集合の(集合論的な)特徴づけには一切関与しません。
集合\(a,b\)について、\(\forall x (x \in a \Rightarrow x \in b\)が成り立つとき、「\(a\)は\(b\)の部分集合(subset)である」といい、これを\(a\subset b\)あるいは\(b \supset a\)と表します。

つぎの公理は、集合が(少なくとも1つ)存在することを、ある具体的な集合を論理式を用いて厳密に定めることによって主張するものです:

(Set2) 空集合の存在公理$$\exists a \forall x [\lnot (x \in a)].$$
"普通の言葉"でいうと、「このような元をも含まない集合\(a\)が存在する」というものです。
定理1.集合\(a\)が空集合となるための必要十分条件は、\(a\)が任意の集合\(x\)の部分集合となることである。
(証明) まず\(z\)をひとつの空集合とし、\(\forall x (x \supset z)\)が成り立つことを示す。そのためには、\(\forall y (y \in z \Rightarrow y \in x)\)を示せば良い。ところが、命題$$y \in z \Rightarrow y \in z$$の対偶は$$\lnot (y \in x) \Rightarrow \lnot (y \in z)$$であるが、空集合の定義によりこれは任意の\(y\)について成り立つ。
つぎに、集合\(a\)について\(\forall x (a \subset x)\)が成り立つとすると、とくに\(a \subset z\)となるが、上の議論により\(z \subset a\)であり、一般に\(a \subset z \wedge z \subset a \Leftrightarrow a = z\)であることより\(a =z \)となり、したがって\(a\)は空集合である。■
系.空集合は確定する。
(証明) 集合\(a,b\)について\(\forall x [\lnot (x \in a) ]\)と\(\forall x [\lnot (x \in b) ]\)が同時に成り立つとすれば、定理により\(a\subset b \wedge b\subset a \)が成り立つため、\(a =b \)となる。■

この系によって一つに定まる空集合を\(\emptyset\)と書きます。これでようやく、「何も含まない集合」という具体的な集合を得ることができました。

非順序対と合併

われわれは前節で要素の個数が0の集合\(\emptyset\)を得ることができましたが、普段当たり前のように接している有限集合\(\{a\}\)、\(\{1,2\}\)などはまだ知らないものとして議論を進めています。このような集合の存在を許すためには、新しい公理が必要です:

(Set3) 非順序対の存在公理$$\forall a \forall b \exists c \forall x (x \in c \Leftrightarrow x =a \vee x = b) .$$
"普通の言葉"で述べると、「任意の集合\(a,b\)に対して、\(a,b\)を元として含み、それ以外の元を含まない集合\(c\)が存在する」というものです。この集合\(c\)は\(a,b\)の非順序対(unordered pair)と呼ばれ、\(\{ a,b \}\)と書かれます。\(x=a \wedge x=b\)と\(x=b \wedge x=a\)は同値であるため、外延性公理によって\(\{a,b\} = \{b,a\}\)が成り立ちます。
集合\(\{ a,a \}\)を\(a\)のシングルトン(singleton)とよび、\(\{a\}\)と書きます。空集合のシングルトン\(\{\emptyset\}\)は、空集合を元として含むので空集合ではありません。こうして、非順序対の存在公理によって空でない集合を手にすることができました。

集合\(a,b,c\)について、\(\{ \{a,b\}, \{c\}\}, \{ \{a,c\}, \{b\}\}\)といった集合の存在は非順序対の存在公理によって示すことができます。では、\(\{a,b,c\}\)と書かれる集合の存在を示すことはできるでしょうか。一般にそういった集合の存在を許すのが、次の公理です。

(Set4) 合併集合の公理$$\forall a \exists b \forall x [x \in b \Leftrightarrow c (c \in a \wedge x \in c)] .$$
"普通の言葉"で述べると、「任意の集合\(a\)に対して集合\(b\)が存在し、任意の\(x\)に対して、\(x \in b\)となることと、\(x\)が\(a\)に含まれるある集合\(c\)の元となることが同値である」ということになります。ここで、\(b\)は\(a\)の元の元全体からなる集合と呼ばれます。外延性公理によりそのような集合は確定し、\(b\)は\(a\)に含まれる集合全体の合併と呼び、$$\bigcup_{c \in a}c$$あるいは$$\bigcup a$$と表します。また、集合\(a,b\)に対して\(c = \{a,b\}\)とするとき、\(\cup c\)を\(a\)と\(b\)の合併(union)とよび、\(a \cup b\)と表します。定義から、明らかに$$\forall x (x \in a \cup b \Leftrightarrow x \in a \vee x \in b)$$です。
明らかに\(\{a,b\} = \{a\} \cup \{b\}\)となり、したがって$$\begin{align} \{a,b\}\cup \{c\} &= (\{a\}\cup\{b\}) \cup \{c\} = \{a\} \cup \{b,c\} \\ &= \{a\}\cup \{c,b\} = \{a,c\}\cup \{b\} = \cdots \cdots \end{align}$$となります。\(\{a,b\}\cup \{c\}\)を\(\{a,b,c\}\)と表し、これを\(a,b,c\)からなる(非順序)組と呼びます。同様に、\(\{a,b,c\}\cup \{d\}\)を\(\{a,b,c,d\}\)などと書きます。

無限公理と無限系譜

さて、前節までの議論から次のことがわかります。空集合\(\emptyset\)が確定します。また、\(\emptyset\)のシングルトン\(\{\emptyset\}\)は\(\emptyset\)とは異なる集合です。また、\(\{\emptyset, \{\emptyset\}\} = \{\emptyset\} \cup \{\{\emptyset\}\}\)はこれら2つを部分集合として含みますが、どれとも異なります。
このようにして、つぎつぎと新しい集合を構成してゆくことができるのではないでしょうか。そして、集合論的に自然数\(0,1,2,3,\dots\)が存在し、よく知られた性質を満たすことを証明できるのではないでしょうか? そのためには、まず\(0\)とか\(1\)とかいった対象を集合論的に与える必要があります。そこで、我々が今持っている道具を用いて、$$\begin{align} 0 &= \emptyset , \\ 1 &= \{\emptyset\} = 0 \cup \{0\} , \\ 2 &= 1 \cup \{1\} = \{\emptyset, \{\emptyset\}\} = \{0,1\} , \\ 3 &= 2 \cup \{2\} = \{0,1,2\} , \\ &= \cdots \cdots \end{align}$$などと定義します。

一般に集合\(a\)が与えられたときに、非順序対の存在公理と合併集合の公理によって存在が保証される集合\(a \cup \{a\}\)を\(a\)の後継ぎと呼び、\(a^+\)と表します。たとえば、\(1 = 0^+ , 2 = 1^+, \dots\)となります。こうして、\(0 = \emptyset\)から始めて後継ぎを順々に取っていくことにより、我々は自然数を具体的に手にすることができるのです。
しかし、ここで問題が生じます。こうして得られた"自然数"の全体の集まりは、集合であるといえるのでしょうか。そして、もしそうであるならば、それを"自然数の集合"と呼んでよいでしょうか。こういった問題を解決するための第一歩として、また新しい公理を導入することにしましょう。

(Set5) 無限公理$$\exists a [ \emptyset \in a \wedge \forall x ( x \in a \Rightarrow x^+ \in a)] .$$
"普通の言葉"で述べると、「集合\(a\)で、\(\emptyset\)を含み、かつ任意の集合\(x\)について、\(x\in a\) ならば\(x^+ \in a \)となるようなものが存在する」と言い表せます。集合\(a\)が無限公理の条件をみたすとき、\(a\)を無限系譜と呼ぶことにします。
無限系譜は、少なくとも一つ存在しますが、一つに確定してはいません。"自然数の全体"という集合を構成するためには、無限系譜から"無駄なものを取り除く"という操作をすることが必要です。そのような操作を可能にするために、次節で述べる分出公理が用いられます。

分出公理と共通部分

次の公理を導入しましょう。

(Set6') 分出公理$$\forall a \exists b \forall x (x \in b \Leftrightarrow x \in a \wedge P(x)) .$$
"普通の言葉"で述べると、「任意の集合\(a\)に対して、\(P(x)\)が成り立つような\(a\)の元\(x\)の全体からなる\(a\)の部分集合\(b\)が存在する」といえます。番号にダッシュ'がついているのは、分出公理は後々に出てくる公理から証明されるので、ZFCに数える必要がないためです。外延性公理によってこのような\(b\)は確定し、\(\{x \in a \mid P(x)\}\)と表されます。
集合\(a,b\)に対して、集合\(\{x \in a \mid x \in b\}\)を\(a,b\)の共通部分とよび、\(a \cap b\)と表します。定義から明らかに次の命題が成り立ちます:$$\forall x (x \in a \cap b \Leftrightarrow x \in a \wedge x \in b).$$前節で定義された集合\(0,1,2,3,\dots\)について、$$0\cap a= 1 , 1\cap 2= 1, 1\cap 3= 1, 2\cap 3= 2, \dots$$などが成立します。
集合\(a,b,c\)に対して\((a\cap b)\cap c\)を\(a,b,c\)の共通部分とよび、\(a\cap b\cap c\)と表します。同様に、集合\(a,b,c,d\)について\((a\cap b\cap c)\cap d\)を\(a,b,c,d\)の共通部分とよび\(a\cap b\cap c\cap d\)、などと順次定義されます。このようなことを一般的に考えるために、\(a\)を空集合と異なる集合として、\(b\in a\)に対して$$\bar b = \{ x \in b \mid \forall y (y \in a \Rightarrow x \in y) \}$$を考えましょう。\(\bar b\)は、\(b\)の元で\(a\)のすべての元に含まれるもの全体からなる\(b\)の部分集合です。一般に、任意の\(x\)について、\(b\in a\)から、つぎの命題が成り立ちます:$$x\in \bar b \Leftrightarrow \forall y (y \in a \Rightarrow x \in y) .$$したがって、もし\(c\in a\)ならば\(\bar b = \bar c\)となり、\(\bar b\)は\(a\)の元\(b\)のとり方によらずに定まります。\(\bar b\)を\(a\)の元の共通部分(intersection)とよび、$$\bigcap_{x \in a}x$$または$$\bigcap a$$と書きます。とくに、\(a = \{b,c\}\)のとき、\(a\)の元の共通部分は\(b\cap c\)に他なりません。

次の定理が成り立ちます。

定理2.集合\(a\)に対して、\(a^\prime = \{x \in a \mid x \not\in x\}\)とすると、\(a^\prime \not\in a\)。
(証明) 命題\(P\)として\(a^\prime \in a\)を、命題\(Q\)として\(a^\prime \in a^\prime\)をとり、\(P \Rightarrow Q \wedge \lnot Q\)を示す。そうすれば\(\lnot P\)すなわち\(a^\prime \not\in a\)が成り立つ(背理法)。\(P\)が成り立つとすると、\(\lnot Q \Leftrightarrow P \wedge \lnot Q\)が成り立つが、\(a^\prime\)の定義によって\(P\wedge \lnot Q\)すなわち\( (a^\prime \in a)\wedge (a^\prime \not\in a^\prime) \)と\(Q\)すなわち\(a^\prime \in a^\prime\)とは同値である。ゆえに命題\(P\Rightarrow (\lnot Q \Leftrightarrow Q)\)が成り立つが、\(\lnot Q \Leftrightarrow Q\)は\(Q \wedge \lnot Q\)と同値であるので、\(P \Rightarrow Q \wedge \lnot Q\)が成り立つ。■
系.$$\forall a \exists b (b \not \in a) .$$
この系によって、どのような集合\(a\)をとっても、\(a\)に含まれない集合(たとえば\(a^\prime \))が存在することがわかります。したがって、"集合全体の集まり"は集合でないということになり、Russellのパラドックスは無事回避されたことになります。


自然数全体の集合はまだ定義されていませんが、きりがよいので本記事はここまでとします。次回で、自然数全体の集合\(\mathbb{N}\)と有名なペアノ(Peano)の公理、そしてZFC公理系の残りについて説明することにします。

感染症モデルとR0:その2

レイ・フロンティア株式会社のデータアナリストの齋藤です。前回の記事の続きを書いていこうと思います。

年齢構造をもつSIRモデルにおける\(\mathcal{R}_0\)

前記事では、感染症の常微分方程式モデルにおいて、感染者が生産する2次感染者の人数を表す基本再生産数\(\mathcal{R}_0\)が、方程式系の漸近挙動や非自明な平衡解の存在をきめる閾値になっていることを見てきました。次に、年齢構造を導入した場合の感染症モデルにおいても基本再生産数が重要な指標となっていることを、かなり駆け足になってしまいますがご紹介します。

モデルの構成

現実の伝染病の流行仮定を考える際には、年齢によって感染率が大きく異なるという事情から、年齢構造を導入することでより現実味のあるモデルを考えることができると期待できます。さらに、疫学的な問題として、ワクチン接種をどの年齢層に行うべきかを考えるうえでも年齢構造の考察は欠かせません。そこで、前節で考えたSIR型感染症モデルに年齢構造を入れた以下のモデルを考えてみます:
$$\left\{ \begin{align} &\frac{\partial S(t,a)}{\partial t} + \frac{\partial S(t,a)}{\partial a} = -(\mu(a) + \theta(a) + \lambda(t,a))S(t,a) \\ & \frac{\partial I(t,a)}{\partial t} + \frac{\partial I(t,a)}{\partial a} = \lambda(t,a)S(t,a) - (\mu(a) + \gamma(a)) I(t,a) \\ &\frac{\partial R(t,a)}{\partial t} + \frac{\partial R(t,a)}{\partial a} = \theta(a)S(t,a) + \gamma(a)I(t,a) - \mu(a)R(t,a) \\& S(t,0) = \int_0^\omega m(a) (S(t,a) + (1-q)I(t,a) + R(t,a))\, da \\& I(t,0) = q\int_0^\omega m(a)I(t,a)\, da \\ &R(t,0) = 0 \\ &S(0,a) = S_0(a),\ I(0,a) = I_0(a),\ R(0,a) = R_0(a) \end{align} \right.$$ここで、\(S(t,a),I(t,a),R(t,a)\)はそれぞれ感受性人口、感染人口、隔離人口の年齢密度関数とし、\(m(a)\)は年齢別出生率、\(\mu(a)\)は自然死亡率、\(\gamma(a)\)は隔離率、\(q\)は感染人口から産まれた新生児が感染している(これを垂直感染と呼びます)確率、\(\theta(a)\)はワクチン接種による免疫化率を表します。また、\(\lambda(t,a)\)は\(a\)歳の感受性人口に作用する感染力(force of infection)であり、以下のように与えられます:$$\lambda(t,a) = \frac{1}{N(t)}\int_0^\omega \beta(a,\sigma) I(t,\sigma)\, d\sigma .$$ただし、\(P(t,a) := S(t,a) + I(t,a) + R(t,a)\)とするとき、$$N(t) := \int_0^\omega P(t,a), da$$です。つまり\(N(t)\)は時刻\(t\)における総人口です。\(\beta(a,\sigma)\)は\(a\)歳の感受性個体と\(\sigma\)歳の感染個体の間の感染率であり、\(\omega\)は最大年齢、\(S_0,I_0,R_0\)は初期データです。
このシステムにおいて、全人口の年齢分布\(P(t,a)\)は以下の安定人口モデルにしたがうことがわかります:$$\left\{ \begin{align} &\frac{\partial P(t,a)}{\partial t} + \frac{\partial P(t,a)}{\partial a} = -\mu(a) P(t,a) \\& P(t,0) = \int_0^\omega m(a) P(t,a)\, da\\& P(0,a) = P_0(a) \end{align} \right.$$ここで、\(P_0(a) := S_0(a) + I_0(a) + R_0(a)\)です。したがって、全人口のサイズと年齢分布の時間発展は、感染の状況とは無関係に決定されます。安定人口モデルの一般論により、人口の年齢分布は時間に依らない分布へ収束します:$$\lim_{t \to \infty} \frac{P(t,a)}{\int_0^\omega P(t,a)\, da} = c(a) := \frac{e^{-\lambda_0 a} m(a) \ell(a)}{\int_0^\omega e^{-\lambda_0 a} m(a) \ell(a)\, da} .$$ここで\(\lambda_0\)は全人口の自然成長率、\(\ell(a)\)は生残率\(\ell(a) = \exp (-\int_0^a \mu(\sigma)\, d\sigma)\)です。\(c(a)\)は安定年齢分布といいます。そこで以下では、ホスト人口は既に安定年齢分布に到達しているものと仮定します。
全体人口が定常状態にあると仮定します。また、簡単のため、垂直感染が存在せず、ワクチン接種も行わないと仮定します。すなわち、\(q=0, \theta(a) \equiv 0\)であり、$$\int_0^\omega m(a)\ell(a)\, da = 1$$が成り立つとします。また、全人口が定常状態であるとすれば、任意の\(t>0\)について、$$P(t,a) = P_0(a) := B\ell(a) .$$ここで\(B\)は粗出生率と呼ばれる定数です。このとき\(c(a) = b\ell(a),\ b=1/\int_0^\omega \ell(a)\, da\)となります。\(b\)は規格化された定常人口分布の粗出生率です。

漸近挙動と\(\mathcal{R}_0\)

このとき、全人口が感受性であるような定常状態に少数の感染者が発生した場合を考えます。このとき、線形化された感染者のダイナミクスを考えれば、
$$\left\{ \begin{align} &\frac{\partial I(t,a)}{\partial t} + \frac{\partial I(t,a)}{\partial a} = c_2(a) \int_0^\omega \beta(a, \sigma) I(t,\sigma)\, d\sigma - (\mu(a) + \gamma(a))I(t,a)\\ &
I(t,0) = q\int_0^\omega m(a) I(t,a)\, da \end{align} \right.$$を得ます。この線形方程式を、Laplace変換を用いて形式に解くことを考えます。IのLaplace変換を$$\hat I(a,\alpha) = \int_0^\infty e^{-\alpha t} I(t,a)\, da$$とし、システムの上の方程式の両辺について時間\(t\)に関するLaplace変換をとれば、以下を得ます:$$\frac{d\hat I(t,a)}{da} = I_0(a) + c(a) \int_0^\omega \beta(a,\sigma)\hat I(\sigma,\alpha)\, d\sigma - (\alpha + \mu(a) + \gamma(a))\hat I(a,\alpha) .$$これを\(\hat I(\cdot, \alpha)\)に関する微分方程式とみて解けば、$$\begin{align}&\hat I(a,\alpha) = q \langle m,\hat I(\cdot, \alpha) \rangle e^{-\alpha a}\ell(a) \Gamma(a) \\ &\quad + \int_0^a e^{-\alpha (a-\sigma)}\frac{\ell(a)\Gamma(a)}{\ell(\sigma)\Gamma(\sigma)} [I_0(\sigma) + c(\sigma) \langle \beta(\sigma,\cdot), \hat I(\cdot, \alpha) \rangle ]\, d\sigma \end{align}$$を得ます。ここで、\(\Gamma(a) :=\exp(-\int_0^a \gamma(\sigma)\, d\sigma)\)です。上の等式の両辺に\(m(a), \beta(a,\sigma)\)をそれぞれ掛けてから\([0,\omega]\)上で積分すれば、\( \langle m,\hat I(\cdot, \alpha) \rangle, \langle \beta(a,\cdot), \hat I(\cdot, \alpha) \rangle\)に関する2つの等式が得られ、それらを連立して解けば\(\hat I(a,\alpha)\)が求まります。とくに、\(I\)によらない作用素\(T(\alpha)\)と関数\(f(a,\alpha)\)があって、$$\langle \beta(a,\cdot),\hat I(\cdot,\alpha) \rangle = (1 - T(\alpha))^{-1}f(\cdot,\alpha)(a)$$となります。安定人口モデルとのアナロジーから、\(\hat I(a,\alpha)\)の特異点、すなわち作用素\( (1-T(\alpha) )\)が有界な逆をもたないような点の集合\( \Lambda := \{ \lambda \in \mathbb{C} \mid 1 \in \sigma ( T(\alpha) ) \} \)によって\(I(t,a)\)の漸近挙動が決まると予想されます。実際、\(T(\alpha)\)がコンパクトかつノンサポーティングという性質をもち、かつ垂直感染がないならば、\(T(\alpha)\)は全ての\(\alpha \in \mathbb{R}\)で正作用素であり、方程式$$r(T(\alpha))=1$$(\(r\)はスペクトル半径を表す)は唯一つの実根\(\lambda_0 \in \Lambda\)をもち、しかも\(\lambda_0\)は\(\Lambda\)の任意の他の元の実部よりも大きいことが示されます。そして、感染症の流行の拡大がおこるためには、\(r( T(0) ) > 1\)となることが必要十分であることが知られています。
いま、作用素\(T\)を$$(Tf)(a) := c(a) \int_0^\omega \beta(a,x) \int_0^x \frac{\ell(x)\Gamma(x)}{\ell(\sigma)\Gamma(\sigma)}f(\sigma)\, d\sigma dx$$と定義すると、\(Tf\)はちょうど感染したばかりの感染者の年齢分布\(f\)から水平感染によって生産された2次感染者の年齢分布を表します。その意味で\(T\)は次世代作用素(next generation operator, NGO)と呼ばれます。次世代作用素のスペクトル半径は$$r(T) = \lim_{n \to \infty} \sqrt[n]{\| T^n \|}$$であり、漸近的には連続する世代の感染人口のサイズの比と解釈されるので、システムの基本再生産数\(\mathcal{R}_0\)であると考えられます。このとき、掛け算作用素\(L:f\mapsto cf\)について\(T = L^{-1}T(0)L\)が成り立つことから、$$r(T) = r( T(0) )$$を得ます。以上のことから、次の定理が得られます:

定理3. (閾値原理)水平感染において\(\mathcal{R_0} = r(T)\)とするとき、
\(\mathcal{R}_0>1\)ならば伝染病は侵入できる。
\(\mathcal{R}_0<1\)ならば伝染病は侵入できない。

非自明平衡解と\(\mathcal{R}_0\)

次に、定常人口下におけるシステムの定常解の存在を議論してみましょう。\( (S^\ast, I^\ast) \)を定常解として、定常解に対応する感染力を\(\lambda^\ast\)とすれば、$$\left\{ \begin{align} &\frac{dS^\ast(a)}{da} = -(\mu(a) + \theta(a) + \lambda^\ast(a))S^\ast(a) \\ &\frac{dI^\ast(a)}{da} = \lambda^\ast(a)S^\ast(a) - (\mu(a) + \gamma(a))I^\ast(a) \\ &S^\ast(0) = B - I^\ast(0) \\ &I^\ast(0) = q \int_0^\omega m(a) I^\ast(a)\, da \\ &\lambda^\ast(a) = \left( B\int_0^\omega \ell(a)\, da \right)^{-1} \int_0^\omega \beta(a,\sigma)I^\ast(\sigma)\, d\sigma . \end{align}\right.$$定数変化法を用いれば、以下の表現が得られます:$$\begin{align} &S^\ast(a) = S^\ast(0)\ell(a)\Theta(a)e^{-\int_0^a \lambda^\ast(\sigma)\, d\sigma},\\ &I^\ast(a) = I^\ast(0) \ell(a)\Gamma(a) + \int_0^a \frac{\Gamma(a)\ell(a)}{\Gamma(\sigma)\ell(\sigma)} \lambda^\ast(\sigma) S^\ast(\sigma)\, d\sigma \end{align}.$$ ここで、$$\Theta(a) := \exp \left( -\int_0^a \theta(\sigma)\, d\sigma \right)$$です。
いま、\(\lambda^\ast\)の非線形汎関数\(F(\lambda^\ast)\)を、$$\begin{align} F(\lambda^\ast) &:= \frac{qb^{-1}}{1 - q\int_0^\omega m(a)\ell(a)\Gamma(a)\,da} \\ &\times \int_0^\omega m(a) \int_0^a \frac{\Gamma(a)\ell(a)}{\Gamma(\sigma)\ell(\sigma)}\Theta(\sigma)c(\sigma)\lambda^\ast(\sigma) e^{-\int_0^\sigma \lambda^\ast(z)\, dz}\, d\sigma \, da \end{align}$$と定義すれば、\(I^\ast(0)\)は\(F(\lambda^\ast)\)を用いて次のように表されます:$$I^\ast(0) = \frac{BF(\lambda^\ast)}{1 + F(\lambda^\ast)}$$また、\(S^\ast(a), I^\ast(a)\)の表現を\(\lambda^\ast\)の式に代入すると\(S^\ast, I^\ast\)に関する文字を消去することができて、\(\lambda^\ast\)についての関係式$$\begin{align} \lambda^\ast(a) &= \frac{bF(\lambda^\ast)}{1 + F(\lambda^\ast)} \int_0^\omega \beta(a,\sigma)\ell(\sigma)\Gamma(\sigma)\, d\sigma \\ &+ \frac{1}{1 + F(\lambda^\ast)} \int_0^\omega \beta(a,\sigma) \int_0^\sigma \frac{\Gamma(\sigma)\ell(\sigma)}{\Gamma(z)\ell(z)} c(z)\Theta(z)\lambda^\ast(z) e^{-\int_0^z \lambda^\ast(s)\, ds}\, dz\, d\sigma \end{align}$$を得ます。この等式の右辺を\(\Phi(\lambda^\ast)\)と書きましょう。すると、非線形作用素\(\Phi\)が正の不動点を持てば、それが非自明な定常解に対応する感染力であり、感染力が求まればエンデミックな定常解が計算されることになります。一般に\(\Phi\)の不動点の個数は簡単には分かりませんが、ワクチンによる免疫化が無い場合を考えれば、侵入条件が満たされればエンデミックな定常解が存在します。
このことは、次のような流れで証明されます: \(\Phi(x)\)の\(x=0\)におけるFréchet微分を\(\Phi^\prime[0]\)とすれば、\(u \in L^1\)に対して、$$\begin{align} (\Phi^\prime[0]u)(a) &= \int_0^\omega \beta(a,\sigma) \int_0^\sigma \frac{\Gamma(\sigma)\ell(\sigma)}{\Gamma(z)\ell(z)} c(z)\Theta(z) u(z) \, dz\, d\sigma \\ &+ \frac{q\int_0^\omega \beta(a,\sigma)\ell(\sigma)\Gamma(\sigma)\, d\sigma}{1 - q\int_0^\omega m(a)\ell(a)\Gamma(a)\, da}\int_0^\omega m(a) \int_0^a \frac{\Gamma(a)\ell(a)}{\Gamma(\sigma)\ell(\sigma)} c(\sigma)\Theta(\sigma) u(\sigma)\, d\sigma\, da . \end{align}$$正値錐\(L_+^1\)の\(\Phi\)による像は正有界であるので、Krasnoselskiiの不動点定理により、\(\Phi^\prime[0]\)がコンパクト、ノンサポーティングかつ\(r(\Phi^\prime[0]) > 1\)ならば、\(\Phi\)は少なくとも1つの正の不動点をもちます。とくに\(\theta \equiv 0\)であれば、\(\Phi^\prime[0] = T(0)\)なので、\(T(0)\)がコンパクト、ノンサポーティングかつ侵入条件\(r(T) = r(T(0)) > 1\)が満たされていれば、少なくとも1つのエンデミックな定常解が存在します。

このときさらに垂直感染がないと仮定すると、\(q = F = 0\)として、\(\Phi(x) \leq \Phi^\prime[0]x\)となります。この場合、\(r(T)\leq 1\)であれば自明な定常解しかないことが知られていますが、この自明な定常解は大域安定となります。実際、\(S(t,a)\)が与えられていると考えると、\(I(t,a)\)は非自律的線形問題$$\left\{\begin{align} &\frac{\partial I(t,a)}{\partial t} + \frac{\partial I(t,a)}{\partial a} = \frac{S(t,a)}{B\int_0^\omega \ell(a)\, da}\int_0^\omega \beta(a,\sigma)I(t,\sigma)\, d\sigma - (\mu(a) + \gamma(a))I(t,a) \\ &I(t,0) = q\int_0^\omega m(a) I(t,a)\, da \end{align}\right.$$の正値解になっています。ここで、$$S(t,a) = \left\{ \begin{align}& B\ell(a)\exp\left( -\int_0^t \lambda(t-a+\sigma,\sigma)\, d\sigma \right) \quad (t - a > 0)\\ & S_0(a-t) \frac{\ell(a)}{\ell(a-t)} \exp \left( -\int_0^a \lambda(\sigma, a-t+\sigma)\, d\sigma \right) \quad (a - t > 0) \end{align}\right.$$であるから、\(t\)をじゅうぶん大きくとれば、$$\frac{S(t,a)}{B\int_0^\omega \ell(a)\, da} \leq \frac{\ell(a)}{\int_0^\omega \ell(a)\, da} = c(a)$$となります。ゆえに比較定理により、\(J(t,a)\)を初期条件\(J(0,a) = I_0(a)\)のもとでの線形化問題(前セクションで登場した線形化方程式のことです)の解とすれば、$$I(t,a) \leq J(t,a)$$となります。定理3により、\(q=0\)の場合、\(r(T)<1\)のときは$$\lim_{t \to \infty}J(t,a) = 0$$なので、\(I=0\)は大域的に漸近安定になっているとわかります。
したがって、次のような定理が得られます:

定理4.\(q = \theta = 0\)と仮定する。また、次世代作用素\(T\)はコンパクトかつノンサポーティングであると仮定する。
\(\mathcal{R}_0<1\)ならば定常解は自明なものに限り、大域的に漸近安定である。
\(\mathcal{R}_0>1\)ならば自明な定常解は不安定であり、少なくとも1つのエンデミックな定常解が存在する。
こうして、年齢構造を導入した場合においても、基本再生産数\(\mathcal{R}_0\)は非自明定常解の存在と自明定常解の安定性の両方をきめる閾値となっていることがわかりました。

参考文献

[1] 稲葉寿 (2002), "数理人口学", 東京大学出版会